Spaces:

DHEIVER
/

my-rag-space

Sleeping

App Files Files Community

DHEIVER commited on Jan 27

Commit

4f1f3fd

verified ·

1 Parent(s): c31a53d

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -23

app.py CHANGED Viewed

@@ -31,8 +31,8 @@ class RAGSystem:
             model=self.model,
             tokenizer=self.tokenizer,
             max_length=512,
-            temperature=0.3,  # Reduzido para respostas mais precisas
-            top_p=0.9,        # Ajustado para permitir diversidade controlada
             repetition_penalty=1.2  # Evita repetições
         )
@@ -153,44 +153,48 @@ class RAGSystem:
             progress(0.4, desc="Buscando informações relevantes...")
             # Configuração do RAG
-            qa_chain = RetrievalQA.from_chain_type(
-                llm=self.llm,
-                chain_type="stuff",
-                retriever=db.as_retriever(
-                    search_kwargs={
-                        "k": 4,
-                        "fetch_k": 6,
-                        "score_threshold": 0.6  # Filtra resultados pouco relevantes
-                    }
-                ),
-                return_source_documents=True
             )
             progress(0.6, desc="Gerando resposta...")
             # Prompt mais estruturado
             prompt = f"""Instruções:
-            1. Analise cuidadosamente os documentos fornecidos.
             2. Responda à seguinte pergunta em português de forma clara e direta: {query}
-            3. Use apenas informações encontradas nos documentos.
             4. Se não houver informações suficientes, indique explicitamente.
             5. Mantenha a resposta objetiva e baseada em fatos.
-            6. Cite exemplos específicos dos documentos quando relevante.
-            7. Evite inventar informações que não estão presentes nos documentos.
             Pergunta: {query}"""
             # Gera resposta
-            result = qa_chain({"query": prompt})
-            # Verifica se encontrou contexto relevante
-            context_found = bool(result.get("source_documents", []))
             # Formata a resposta
             formatted_response = self.format_response(
-                result["result"],
                 source_type,
-                context_found
             )
             elapsed_time = f"{time.time() - start_time:.1f}s"

             model=self.model,
             tokenizer=self.tokenizer,
             max_length=512,
+            temperature=0.3,  # Respostas mais precisas
+            top_p=0.9,        # Diversidade controlada
             repetition_penalty=1.2  # Evita repetições
         )
             progress(0.4, desc="Buscando informações relevantes...")
             # Configuração do RAG
+            retriever = db.as_retriever(
+                search_kwargs={
+                    "k": 6,  # Aumenta o número de trechos recuperados
+                    "fetch_k": 10,
+                    "score_threshold": 0.5  # Limiar de relevância
+                }
             )
+            # Recupera o contexto
+            context_docs = retriever.get_relevant_documents(query)
+            # Verifica se o contexto é relevante
+            if not context_docs:
+                return "🔍 Não foram encontradas informações suficientes nos documentos para responder esta pergunta.", "⚠️ Contexto insuficiente", f"{time.time() - start_time:.1f}s"
+            # Prepara o contexto para o prompt
+            context = "\n\n".join([doc.page_content for doc in context_docs])
             progress(0.6, desc="Gerando resposta...")
             # Prompt mais estruturado
             prompt = f"""Instruções:
+            1. Analise cuidadosamente o contexto fornecido.
             2. Responda à seguinte pergunta em português de forma clara e direta: {query}
+            3. Use apenas informações encontradas no contexto.
             4. Se não houver informações suficientes, indique explicitamente.
             5. Mantenha a resposta objetiva e baseada em fatos.
+            6. Cite exemplos específicos do contexto quando relevante.
+            Contexto:
+            {context}
             Pergunta: {query}"""
             # Gera resposta
+            result = self.llm(prompt)
             # Formata a resposta
             formatted_response = self.format_response(
+                result,
                 source_type,
+                context_found=True
             )
             elapsed_time = f"{time.time() - start_time:.1f}s"