SucheRAG

Sleeping

alexkueck commited on Jul 2, 2024

Commit

14dd3f7

verified ·

1 Parent(s): 3451d79

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -214,8 +214,9 @@ def document_loading_splitting():
 #Chroma DB die splits ablegen - vektorisiert...
 def document_storage_chroma(splits):
     #HF embeddings--------------------------------------
-    Chroma.from_documents(documents = splits, embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2", model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False}),  persist_directory = PATH_WORK + CHROMA_DIR)
 ############################################
 #dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur

 #Chroma DB die splits ablegen - vektorisiert...
 def document_storage_chroma(splits):
     #HF embeddings--------------------------------------
+    vectorstore = Chroma.from_documents(documents = splits, embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2", model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False}),  persist_directory = PATH_WORK + CHROMA_DIR)
+    retriever = vectorstore.as_retriever(search_kwargs = {"k": ANZAHL_DOCS})
+    return vectorstore, retriever
 ############################################
 #dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur