Spaces:

timefullytrue
/

RAG_based_chat_on_patents_data_with_Mistral

Runtime error

timefullytrue commited on May 2, 2024

Commit

0722f22

verified ·

1 Parent(s): f50f0bc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,22 +12,20 @@ import numpy as np
 from chromadb.utils import embedding_functions
 from huggingface_hub import InferenceClient
 dfs = pd.read_csv('Patents.csv')
 ids= [str(x) for x in dfs.index.tolist()]
 docs = dfs['text'].tolist()
 client = chromadb.Client()
 collection = client.get_or_create_collection("patents")
 collection.add(documents=docs,ids=ids)
 def gen_context(query):
-    vector = text_embedding(query).tolist()
-    results = collection.query(
-    query_embeddings=vector,n_results=15,include=["documents"])
     res = "\n".join(str(item) for item in results['documents'][0])
     return res
@@ -38,12 +36,8 @@ def chat_completion(user_prompt):
     return client.text_generation(prompt=final_prompt,max_new_tokens = length).strip()
 client = InferenceClient(model = "mistralai/Mixtral-8x7B-Instruct-v0.1")
 demo = gr.Interface(fn=chat_completion,
                     inputs=[gr.Textbox(label="Query", lines=2)],
                     outputs=[gr.Textbox(label="Result", lines=16)],

 from chromadb.utils import embedding_functions
 from huggingface_hub import InferenceClient
 dfs = pd.read_csv('Patents.csv')
 ids= [str(x) for x in dfs.index.tolist()]
 docs = dfs['text'].tolist()
 client = chromadb.Client()
 collection = client.get_or_create_collection("patents")
 collection.add(documents=docs,ids=ids)
+def text_embedding(input):
+    model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2')
+    return model.encode(input)
 def gen_context(query):
+    vector = text_embedding(query).tolist()
+    results = collection.query(query_embeddings=vector,n_results=15,include=["documents"])
     res = "\n".join(str(item) for item in results['documents'][0])
     return res
     return client.text_generation(prompt=final_prompt,max_new_tokens = length).strip()
 client = InferenceClient(model = "mistralai/Mixtral-8x7B-Instruct-v0.1")
 demo = gr.Interface(fn=chat_completion,
                     inputs=[gr.Textbox(label="Query", lines=2)],
                     outputs=[gr.Textbox(label="Result", lines=16)],