Spaces:

vcasas
/

llama-index_tests

Runtime error

vcasas commited on Dec 7, 2024

Commit

88dfbed

verified ·

1 Parent(s): ed9f945

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,40 @@
-===== Application Startup at 2024-12-07 13:08:38 =====
-Traceback (most recent call last):
-  File "/usr/local/lib/python3.10/site-packages/tenacity/__init__.py", line 478, in __call__
-    result = fn(*args, **kwargs)
-TypeError: PDFReader.load_data() missing 1 required positional argument: 'file'
-The above exception was the direct cause of the following exception:
-Traceback (most recent call last):
-  File "/home/user/app/app.py", line 31, in <module>
-    index = create_index_from_pdf(pdf_path)
-  File "/home/user/app/app.py", line 17, in create_index_from_pdf
-    documents = pdf_reader.load_data()  # No abrir el archivo manualmente
-  File "/usr/local/lib/python3.10/site-packages/tenacity/__init__.py", line 336, in wrapped_f
-    return copy(f, *args, **kw)
-  File "/usr/local/lib/python3.10/site-packages/tenacity/__init__.py", line 475, in __call__
-    do = self.iter(retry_state=retry_state)
-  File "/usr/local/lib/python3.10/site-packages/tenacity/__init__.py", line 376, in iter
-    result = action(retry_state)
-  File "/usr/local/lib/python3.10/site-packages/tenacity/__init__.py", line 419, in exc_check
-    raise retry_exc from fut.exception()
-tenacity.RetryError: RetryError[<Future at 0x7f53588abcd0 state=finished raised TypeError>]

+import os
+import requests
+from llama_index.core import VectorStoreIndex
+from llama_index.readers.file import PDFReader
+import gradio as gr
+# Función para descargar el archivo PDF desde una URL
+def download_pdf(url, destination):
+    os.makedirs(os.path.dirname(destination), exist_ok=True)
+    response = requests.get(url)
+    with open(destination, 'wb') as f:
+        f.write(response.content)
+# Función para crear el índice a partir del PDF
+def create_index_from_pdf(pdf_path):
+    pdf_reader = PDFReader()  # Inicializar el PDFReader sin la ruta del archivo
+    with open(pdf_path, 'rb') as pdf_file:  # Abrir el archivo en modo binario
+        documents = pdf_reader.load_data(file=pdf_file)  # Pasar el archivo abierto
+    # Crear el índice
+    index = VectorStoreIndex.from_documents(documents)
+    return index
+# Ruta del archivo PDF a descargar
+pdf_url = 'https://www.boe.es/buscar/pdf/1995/BOE-A-1995-25444-consolidado.pdf'
+pdf_path = './BOE-A-1995-25444-consolidado.pdf'
+# Descargar el PDF
+download_pdf(pdf_url, pdf_path)
+# Crear el índice a partir del PDF
+index = create_index_from_pdf(pdf_path)
+# Función de búsqueda en el índice
+def search_pdf(query):
+    response = index.query(query)
+    return response
+# Interfaz Gradio
+gr.Interface(fn=search_pdf, inputs="text", outputs="text").launch()