Spaces:

Overglitch
/

document-summarizer

Sleeping

App Files Files Community

Overglitch commited on Dec 17, 2024

Commit

0a6178e

verified ·

1 Parent(s): a49517e

Update app.py

Browse files

Files changed (1) hide show

app.py +78 -0

app.py CHANGED Viewed

@@ -59,6 +59,84 @@ def process_uploaded_file(file):
         return preprocessor.clean_text(raw_text)
     return raw_text
 # Interfaz dinámica
 with gr.Blocks() as interface:
     gr.Markdown("# Aplicación Híbrida para Resumir Documentos de Forma Extractiva y Abstractiva")

         return preprocessor.clean_text(raw_text)
     return raw_text
+#
+def summarize(input_text, file, summary_type, method, num_sentences, model_name, max_length, num_beams):
+    """
+    Genera un resumen basado en el texto de entrada o archivo cargado.
+    Args:
+        input_text (str): Texto ingresado por el usuario.
+        file (UploadedFile): Archivo subido por el usuario.
+        summary_type (str): Tipo de resumen: Extractivo, Abstractivo o Combinado.
+        method (str): Método de resumen extractivo.
+        num_sentences (int): Número de oraciones para el resumen extractivo.
+        model_name (str): Nombre del modelo para resumen abstractivo.
+        max_length (int): Longitud máxima del resumen generado.
+        num_beams (int): Número de haces para búsqueda en el modelo.
+    Returns:
+        str: Resumen generado o mensaje de error.
+    """
+    preprocessor = Preprocessor()
+    # Procesar archivo si se sube uno
+    if file is not None:
+        input_text = process_file(file)
+    # Validar que haya texto para resumir
+    if not input_text.strip():
+        return "Por favor, ingrese texto o cargue un archivo válido."
+    cleaned_text = preprocessor.clean_text(input_text)
+    # Procesar según el tipo de resumen seleccionado
+    if summary_type == "Extractivo":
+        if method == "TF-IDF":
+            summarizer = TFIDFSummarizer()
+        elif method == "TextRank":
+            summarizer = TextRankSummarizer()
+        elif method == "BERT":
+            summarizer = BERTSummarizer()
+        elif method == "TF-IDF + TextRank":
+            summarizer = CombinedSummarizer()
+        else:
+            return "Método no válido para resumen extractivo."
+        return summarizer.summarize(
+            preprocessor.split_into_sentences(cleaned_text),
+            preprocessor.clean_sentences(preprocessor.split_into_sentences(cleaned_text)),
+            num_sentences,
+        )
+    elif summary_type == "Abstractivo":
+        if model_name not in summarizers:
+            return "Modelo no disponible para resumen abstractivo."
+        return handle_long_text(
+            cleaned_text,
+            summarizers[model_name][0],
+            summarizers[model_name][1],
+            max_length=max_length,
+            stride=128,
+        )
+    elif summary_type == "Combinado":
+        if model_name not in summarizers:
+            return "Modelo no disponible para resumen abstractivo."
+        extractive_summary = TFIDFSummarizer().summarize(
+            preprocessor.split_into_sentences(cleaned_text),
+            preprocessor.clean_sentences(preprocessor.split_into_sentences(cleaned_text)),
+            num_sentences,
+        )
+        return handle_long_text(
+            extractive_summary,
+            summarizers[model_name][0],
+            summarizers[model_name][1],
+            max_length=max_length,
+            stride=128,
+        )
+    return "Seleccione un tipo de resumen válido."
 # Interfaz dinámica
 with gr.Blocks() as interface:
     gr.Markdown("# Aplicación Híbrida para Resumir Documentos de Forma Extractiva y Abstractiva")