Spaces:

Technologic101
/

AIM-HW15

Sleeping

App Files Files Community

Technologic101 commited on 17 days ago

Commit

0f77dce

1 Parent(s): 3db2294

HW15: working app.py

Browse files

Files changed (1) hide show

app.py +28 -9

app.py CHANGED Viewed

@@ -42,15 +42,18 @@ HF_TOKEN = os.environ["HF_TOKEN"]
 """
 ### 1. CREATE TEXT LOADER AND LOAD DOCUMENTS
 ### NOTE: PAY ATTENTION TO THE PATH THEY ARE IN.
-text_loader =
-documents =
 ### 2. CREATE TEXT SPLITTER AND SPLIT DOCUMENTS
-text_splitter =
-split_documents =
 ### 3. LOAD HUGGINGFACE EMBEDDINGS
-hf_embeddings =
 async def add_documents_async(vectorstore, documents):
     await vectorstore.aadd_documents(documents)
@@ -110,17 +113,33 @@ hf_retriever = asyncio.run(run())
 2. Create a Prompt Template from the String Template
 """
 ### 1. DEFINE STRING TEMPLATE
-RAG_PROMPT_TEMPLATE =
 ### 2. CREATE PROMPT TEMPLATE
-rag_prompt =
 # -- GENERATION -- #
 """
 1. Create a HuggingFaceEndpoint for the LLM
 """
 ### 1. CREATE HUGGINGFACE ENDPOINT FOR LLM
-hf_llm =
 @cl.author_rename
 def rename(original_author: str):
@@ -145,7 +164,7 @@ async def start_chat():
     """
     ### BUILD LCEL RAG CHAIN THAT ONLY RETURNS TEXT
-    lcel_rag_chain =
     cl.user_session.set("lcel_rag_chain", lcel_rag_chain)

 """
 ### 1. CREATE TEXT LOADER AND LOAD DOCUMENTS
 ### NOTE: PAY ATTENTION TO THE PATH THEY ARE IN.
+text_loader = TextLoader("data/paul_graham_essays.txt")
+documents = text_loader.load()
 ### 2. CREATE TEXT SPLITTER AND SPLIT DOCUMENTS
+text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=20)
+split_documents = text_splitter.split_documents(documents)
 ### 3. LOAD HUGGINGFACE EMBEDDINGS
+hf_embeddings = HuggingFaceEndpointEmbeddings(
+    model=HF_EMBED_ENDPOINT,
+    huggingfacehub_api_token=HF_TOKEN
+)
 async def add_documents_async(vectorstore, documents):
     await vectorstore.aadd_documents(documents)
 2. Create a Prompt Template from the String Template
 """
 ### 1. DEFINE STRING TEMPLATE
+RAG_PROMPT_TEMPLATE = """
+<|start_header_id|>system<|end_header_id|>
+You are a helpful assistant. You answer user questions based on provided context. If you can't answer the question with the provided context, say you don't know.<|eot_id|>
+<|start_header_id|>user<|end_header_id|>
+User Query:
+{query}
+Context:
+{context}<|eot_id|>
+<|start_header_id|>assistant<|end_header_id|>
+"""
 ### 2. CREATE PROMPT TEMPLATE
+rag_prompt = PromptTemplate.from_template(RAG_PROMPT_TEMPLATE)
 # -- GENERATION -- #
 """
 1. Create a HuggingFaceEndpoint for the LLM
 """
 ### 1. CREATE HUGGINGFACE ENDPOINT FOR LLM
+hf_llm = HuggingFaceEndpoint(
+    endpoint_url=HF_LLM_ENDPOINT,
+    huggingface_api_token=HF_TOKEN
+    #model_kwargs={"headers": {"Authorization": f"Bearer {HF_TOKEN}"}}
+)
 @cl.author_rename
 def rename(original_author: str):
     """
     ### BUILD LCEL RAG CHAIN THAT ONLY RETURNS TEXT
+    lcel_rag_chain = {"context": itemgetter("context") | hf_retriever, "query": RunnablePassthrough()} | rag_prompt | hf_llm
     cl.user_session.set("lcel_rag_chain", lcel_rag_chain)