nomic-ai
/

nomic-embed-text-v1.5

@@ -2630,7 +2630,7 @@ This prefix is used for embedding texts as documents, for example as documents f
 ```python
 from sentence_transformers import SentenceTransformer
-model = SentenceTransformer("nomic-ai/nomic-embed-text-v1", trust_remote_code=True)
 sentences = ['search_document: TSNE is a dimensionality reduction algorithm created by Laurens van Der Maaten']
 embeddings = model.encode(sentences)
 print(embeddings)
@@ -2645,7 +2645,7 @@ This prefix is used for embedding texts as questions that documents from a datas
 ```python
 from sentence_transformers import SentenceTransformer
-model = SentenceTransformer("nomic-ai/nomic-embed-text-v1", trust_remote_code=True)
 sentences = ['search_query: Who is Laurens van Der Maaten?']
 embeddings = model.encode(sentences)
 print(embeddings)
@@ -2660,7 +2660,7 @@ This prefix is used for embedding texts in order to group them into clusters, di
 ```python
 from sentence_transformers import SentenceTransformer
-model = SentenceTransformer("nomic-ai/nomic-embed-text-v1", trust_remote_code=True)
 sentences = ['clustering: the quick brown fox']
 embeddings = model.encode(sentences)
 print(embeddings)
@@ -2675,7 +2675,7 @@ This prefix is used for embedding texts into vectors that will be used as featur
 ```python
 from sentence_transformers import SentenceTransformer
-model = SentenceTransformer("nomic-ai/nomic-embed-text-v1", trust_remote_code=True)
 sentences = ['classification: the quick brown fox']
 embeddings = model.encode(sentences)
 print(embeddings)
@@ -2737,8 +2737,8 @@ The model natively supports scaling of the sequence length past 2048 tokens. To
 + tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased', model_max_length=8192)
-- model = AutoModel.from_pretrained('nomic-ai/nomic-embed-text-v1', trust_remote_code=True)
-+ model = AutoModel.from_pretrained('nomic-ai/nomic-embed-text-v1', trust_remote_code=True, rotary_scaling_factor=2)
 ```
 ### Transformers.js

 ```python
 from sentence_transformers import SentenceTransformer
+model = SentenceTransformer("nomic-ai/nomic-embed-text-v1.5", trust_remote_code=True)
 sentences = ['search_document: TSNE is a dimensionality reduction algorithm created by Laurens van Der Maaten']
 embeddings = model.encode(sentences)
 print(embeddings)
 ```python
 from sentence_transformers import SentenceTransformer
+model = SentenceTransformer("nomic-ai/nomic-embed-text-v1.5", trust_remote_code=True)
 sentences = ['search_query: Who is Laurens van Der Maaten?']
 embeddings = model.encode(sentences)
 print(embeddings)
 ```python
 from sentence_transformers import SentenceTransformer
+model = SentenceTransformer("nomic-ai/nomic-embed-text-v1.5", trust_remote_code=True)
 sentences = ['clustering: the quick brown fox']
 embeddings = model.encode(sentences)
 print(embeddings)
 ```python
 from sentence_transformers import SentenceTransformer
+model = SentenceTransformer("nomic-ai/nomic-embed-text-v1.5", trust_remote_code=True)
 sentences = ['classification: the quick brown fox']
 embeddings = model.encode(sentences)
 print(embeddings)
 + tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased', model_max_length=8192)
+- model = AutoModel.from_pretrained('nomic-ai/nomic-embed-text-v1.5', trust_remote_code=True)
++ model = AutoModel.from_pretrained('nomic-ai/nomic-embed-text-v1.5', trust_remote_code=True, rotary_scaling_factor=2)
 ```
 ### Transformers.js