Update README.md
Browse files
README.md
CHANGED
@@ -32,8 +32,8 @@ We kindly encourage you to use the Fast version of the tokenizer, namely Herbert
|
|
32 |
from transformers import AutoTokenizer, AutoModel
|
33 |
from sklearn.metrics import pairwise
|
34 |
|
35 |
-
sbert = AutoModel.from_pretrained("Voicelab/
|
36 |
-
tokenizer = AutoTokenizer.from_pretrained("Voicelab/
|
37 |
|
38 |
s0 = "Uczenie maszynowe jest konsekwencją rozwoju idei sztucznej inteligencji i metod jej wdrażania praktycznego."
|
39 |
s1 = "Głębokie uczenie maszynowe jest sktukiem wdrażania praktycznego metod sztucznej inteligencji oraz jej rozwoju."
|
@@ -59,8 +59,8 @@ print(pairwise.cosine_similarity(x[0], x[2))) # Result: 0.58822715
|
|
59 |
|--------------------------|------------|----------------------------------------------------------|
|
60 |
| SBERT-WikiSec-base (EN) | 80.42% | https://arxiv.org/abs/1908.10084 |
|
61 |
| SBERT-WikiSec-large (EN) | 80.78% | https://arxiv.org/abs/1908.10084 |
|
62 |
-
|
|
63 |
-
| **
|
64 |
|
65 |
# License
|
66 |
|
|
|
32 |
from transformers import AutoTokenizer, AutoModel
|
33 |
from sklearn.metrics import pairwise
|
34 |
|
35 |
+
sbert = AutoModel.from_pretrained("Voicelab/sbert-large-cased-pl")
|
36 |
+
tokenizer = AutoTokenizer.from_pretrained("Voicelab/sbert-large-cased-pl")
|
37 |
|
38 |
s0 = "Uczenie maszynowe jest konsekwencją rozwoju idei sztucznej inteligencji i metod jej wdrażania praktycznego."
|
39 |
s1 = "Głębokie uczenie maszynowe jest sktukiem wdrażania praktycznego metod sztucznej inteligencji oraz jej rozwoju."
|
|
|
59 |
|--------------------------|------------|----------------------------------------------------------|
|
60 |
| SBERT-WikiSec-base (EN) | 80.42% | https://arxiv.org/abs/1908.10084 |
|
61 |
| SBERT-WikiSec-large (EN) | 80.78% | https://arxiv.org/abs/1908.10084 |
|
62 |
+
| sbert-base-cased-pl | 82.31% | https://huggingface.co/Voicelab/sherbert-base-cased |
|
63 |
+
| **sbert-large-cased-pl** | **84.42%** | **https://huggingface.co/Voicelab/sherbert-large-cased** |
|
64 |
|
65 |
# License
|
66 |
|