Update README.md
Browse files
README.md
CHANGED
@@ -16,7 +16,7 @@ tags:
|
|
16 |
---
|
17 |
|
18 |
<h4>
|
19 |
-
<i class="highlight-container"><b class="highlight">jerteh-
|
20 |
BERT model specijalno obučen za srpski jezik.</h4>
|
21 |
|
22 |
<img src="cover.png" class="cover">
|
@@ -35,7 +35,7 @@ BERT model specijalno obučen za srpski jezik.</h4>
|
|
35 |
|
36 |
<ul style="font-weight:bold">
|
37 |
<li>Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu</li>
|
38 |
-
<li>Zasnovan na RoBERTa-base arhitekturi,
|
39 |
<li>Obučavan na korpusu srpskog jezika veličine 4 milijarde tokena</li>
|
40 |
<li>Među najboljim rezultatima u modelovanju maskiranog jezika za srpski!</li>
|
41 |
<li>Jednaka podrška unosa i na ćirilici i na latinici!</li>
|
@@ -51,7 +51,7 @@ kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752
|
|
51 |
|
52 |
```python
|
53 |
>>> from transformers import pipeline
|
54 |
-
>>> generator = pipeline('fill-mask', model='jerteh/jerteh-
|
55 |
>>> unmasker("Kada bi čovek znao gde će pasti on bi<mask>.")
|
56 |
```
|
57 |
|
@@ -67,8 +67,8 @@ kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752
|
|
67 |
>>> from transformers import AutoTokenizer, AutoModelForMaskedLM
|
68 |
>>> from torch import LongTensor, no_grad
|
69 |
>>> from scipy import spatial
|
70 |
-
>>> tokenizer = AutoTokenizer.from_pretrained('jerteh/jerteh-
|
71 |
-
>>> model = AutoModelForMaskedLM.from_pretrained('jerteh/jerteh-
|
72 |
>>> x = " pas"
|
73 |
>>> y = " mačka"
|
74 |
>>> z = " svemir"
|
|
|
16 |
---
|
17 |
|
18 |
<h4>
|
19 |
+
<i class="highlight-container"><b class="highlight">jerteh-81</b></i> —
|
20 |
BERT model specijalno obučen za srpski jezik.</h4>
|
21 |
|
22 |
<img src="cover.png" class="cover">
|
|
|
35 |
|
36 |
<ul style="font-weight:bold">
|
37 |
<li>Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu</li>
|
38 |
+
<li>Zasnovan na RoBERTa-base arhitekturi, 81 milion parametara</li>
|
39 |
<li>Obučavan na korpusu srpskog jezika veličine 4 milijarde tokena</li>
|
40 |
<li>Među najboljim rezultatima u modelovanju maskiranog jezika za srpski!</li>
|
41 |
<li>Jednaka podrška unosa i na ćirilici i na latinici!</li>
|
|
|
51 |
|
52 |
```python
|
53 |
>>> from transformers import pipeline
|
54 |
+
>>> generator = pipeline('fill-mask', model='jerteh/jerteh-81')
|
55 |
>>> unmasker("Kada bi čovek znao gde će pasti on bi<mask>.")
|
56 |
```
|
57 |
|
|
|
67 |
>>> from transformers import AutoTokenizer, AutoModelForMaskedLM
|
68 |
>>> from torch import LongTensor, no_grad
|
69 |
>>> from scipy import spatial
|
70 |
+
>>> tokenizer = AutoTokenizer.from_pretrained('jerteh/jerteh-81')
|
71 |
+
>>> model = AutoModelForMaskedLM.from_pretrained('jerteh/jerteh-81', output_hidden_states=True)
|
72 |
>>> x = " pas"
|
73 |
>>> y = " mačka"
|
74 |
>>> z = " svemir"
|