Spaces:

edouardlgp
/

Rag_with_Pleias

Runtime error

App Files Files Community

edouardlgp commited on May 10

Commit

88e0a23

verified ·

1 Parent(s): e74cf11

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -14

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ if hasattr(rag, "model"):
 def extract_text_from_pdf_url(url):
     try:
-        response = requests.get(url)
         response.raise_for_status()
         doc = fitz.open(stream=response.content, filetype="pdf")
         text = ""
@@ -35,26 +35,35 @@ def extract_text_from_pdf_url(url):
         return f"[Error loading PDF: {str(e)}]"
 def generate_answer(query, pdf_urls_str):
     pdf_urls = [url.strip() for url in pdf_urls_str.strip().split("\n") if url.strip()]
     sources = []
     feedback = "### PDF Load Report:\n"
     for url in pdf_urls:
-        text = extract_text_from_pdf_url(url)
-        if not text.startswith("[Error"):
-            sources.append({
-                "text": text,
-                "metadata": {"source": url}
-            })
-            feedback += f"- ✅ Loaded: {url[:80]}\n"
-        else:
-            feedback += f"- ❌ Failed: {url[:80]}\n"
     if not sources:
         return feedback + "\n❌ No valid PDFs were successfully processed."
-    response = rag.generate(query, sources)
-    return feedback + f"\n\n### Answer:\n{response['raw_response']}\n\n_Backend used: {response['backend_used']}_"
 iface = gr.Interface(
     fn=generate_answer,
@@ -64,8 +73,9 @@ iface = gr.Interface(
     ],
     outputs=gr.Markdown(label="Model Response"),
     title="Pleias RAG PDF QA",
-    description="Ask a question and get answers grounded in the content of the uploaded PDF URLs using the Pleias RAG model."
 )
 if __name__ == "__main__":
-    iface.launch(ssr_mode=False)  # No `share=True` on Spaces

 def extract_text_from_pdf_url(url):
     try:
+        response = requests.get(url, timeout=10)  # Added timeout
         response.raise_for_status()
         doc = fitz.open(stream=response.content, filetype="pdf")
         text = ""
         return f"[Error loading PDF: {str(e)}]"
 def generate_answer(query, pdf_urls_str):
+    if not query or not pdf_urls_str:  # Added input validation
+        return "Please provide both a question and at least one PDF URL"
     pdf_urls = [url.strip() for url in pdf_urls_str.strip().split("\n") if url.strip()]
     sources = []
     feedback = "### PDF Load Report:\n"
     for url in pdf_urls:
+        try:
+            text = extract_text_from_pdf_url(url)
+            if not text.startswith("[Error"):
+                sources.append({
+                    "text": text,
+                    "metadata": {"source": url}
+                })
+                feedback += f"- ✅ Loaded: {url[:80]}\n"
+            else:
+                feedback += f"- ❌ Failed: {url[:80]}\n"
+        except Exception as e:
+            feedback += f"- ❌ Error processing {url[:80]}: {str(e)}\n"
     if not sources:
         return feedback + "\n❌ No valid PDFs were successfully processed."
+    try:
+        response = rag.generate(query, sources)
+        return feedback + f"\n\n### Answer:\n{response['raw_response']}\n\n_Backend used: {response['backend_used']}_"
+    except Exception as e:
+        return feedback + f"\n\n❌ Error generating answer: {str(e)}"
 iface = gr.Interface(
     fn=generate_answer,
     ],
     outputs=gr.Markdown(label="Model Response"),
     title="Pleias RAG PDF QA",
+    description="Ask a question and get answers grounded in the content of the uploaded PDF URLs using the Pleias RAG model.",
+    allow_flagging="never"  # Disable flagging to simplify interface
 )
 if __name__ == "__main__":
+    iface.launch(server_port=7860, server_name="0.0.0.0", show_error=True)  # Added explicit server settings