Spaces:

saashley
/

capitolati-rag

Sleeping

App Files Files Community

saashley commited on Jul 14

Commit

0152504

verified ·

1 Parent(s): e07150a

Update dspy_wrapper.py

Browse files

Files changed (1) hide show

dspy_wrapper.py +19 -11

dspy_wrapper.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import dspy
 from typing import List, Dict
 import os
@@ -8,7 +9,6 @@ if not OPENAI_API_KEY:
     raise RuntimeError("Missing OPENAI_API_KEY env var")
 gpt_4o_mini = dspy.LM('openai/gpt-4o-mini', api_key=OPENAI_API_KEY)
-# using unimib credentials, switch to PeS if needed!
 dspy.configure(lm=gpt_4o_mini)
@@ -19,7 +19,7 @@ class DSPyHybridRetriever(dspy.Module):
         self.retriever = retriever
     def forward(self, query: str, municipality: str = "", top_k: int = 5):
-        results = self.retriever.rerank(query, top_k=top_k, municipality_filter=municipality) # remember to change to rerank
         return {"retrieved_chunks": results}
 class RetrieveChunks(dspy.Signature):
@@ -37,7 +37,7 @@ class RetrieveChunks(dspy.Signature):
 class AnswerWithEvidence(dspy.Signature):
     """Answer the query using reasoning and retrieved chunks as context."""
-    query = dspy.InputField(desc="User's question")
     retrieved_chunks = dspy.InputField(desc="Retrieved text chunks (List[dict])")
     answer = dspy.OutputField(desc="Final answer")
     rationale = dspy.OutputField(desc="Chain-of-thought reasoning")
@@ -50,21 +50,29 @@ class RAGChain(dspy.Module):
         self.retriever = retriever
         self.answerer = answerer
-    def forward(self, query: str, municipality: str = ""):
-        # retrieve full dicts
-        retrieved = self.retriever(query=query, municipality=municipality)
         chunks = retrieved["retrieved_chunks"]
-        # feed only the raw text into the CoT module
         answer_result = self.answerer(
-            query=query,
             retrieved_chunks=[c["chunk_text"] for c in chunks]
         )
-        # return both the metadata and the LLM answer
         return {
-            "query": query,
-            "municipality": municipality,
             "retrieved_chunks": chunks,
             "chain_of_thought": answer_result.rationale,
             "final_answer": answer_result.answer,

+from query_preprocessing import preprocess_query
 import dspy
 from typing import List, Dict
 import os
     raise RuntimeError("Missing OPENAI_API_KEY env var")
 gpt_4o_mini = dspy.LM('openai/gpt-4o-mini', api_key=OPENAI_API_KEY)
 dspy.configure(lm=gpt_4o_mini)
         self.retriever = retriever
     def forward(self, query: str, municipality: str = "", top_k: int = 5):
+        results = self.retriever.rerank(query, top_k=top_k, municipality_filter=municipality)
         return {"retrieved_chunks": results}
 class RetrieveChunks(dspy.Signature):
 class AnswerWithEvidence(dspy.Signature):
     """Answer the query using reasoning and retrieved chunks as context."""
+    query = dspy.InputField(desc="Rewritten question")
     retrieved_chunks = dspy.InputField(desc="Retrieved text chunks (List[dict])")
     answer = dspy.OutputField(desc="Final answer")
     rationale = dspy.OutputField(desc="Chain-of-thought reasoning")
         self.retriever = retriever
         self.answerer = answerer
+    def forward(self, raw_query: str, municipality: str = "", feedback: str = ""):
+        pre = preprocess_query(raw_query, feedback)
+        rewritten = pre["rewritten_query"] or raw_query
+        extracted_muni = pre["municipality"] or ""
+        intent = pre["intent"]
+        muni = municipality if municipality.strip() else extracted_muni
+        retrieved = self.retriever(query=rewritten, municipality=muni)
         chunks = retrieved["retrieved_chunks"]
+        # Answer + CoT using the rewritten query
         answer_result = self.answerer(
+            query=rewritten,
             retrieved_chunks=[c["chunk_text"] for c in chunks]
         )
+        # Return everything for transparency & downstream use
         return {
+            "original_query": raw_query,
+            "intent": intent,
+            "rewritten_query": rewritten,
+            "llm_municipality": extracted_muni,
+            "municipality": muni,
             "retrieved_chunks": chunks,
             "chain_of_thought": answer_result.rationale,
             "final_answer": answer_result.answer,