Spaces:

Overglitch
/

document-summarizer

Sleeping

App Files Files Community

Overglitch commited on Dec 14, 2024

Commit

ad706f3

verified ·

1 Parent(s): 8dec98c

Update modules/extractive.py

Browse files

Files changed (1) hide show

modules/extractive.py +2 -32

modules/extractive.py CHANGED Viewed

@@ -138,39 +138,9 @@ class CombinedSummarizer:
 class BERTSummarizer:
-    """Genera resúmenes usando un modelo BERT extractivo preentrenado."""
     def __init__(self):
-        """
-        Inicializa el modelo BERT extractivo a través de la clase Summarizer.
-        Asegúrate de instalar e importar correctamente la librería 'bert-extractive-summarizer'.
-        """
         self.model = Summarizer()
-    @staticmethod
-    def summarize(sentences: List[str], preprocessed_sentences: List[str], num_sentences: int = 1) -> str:
-        """
-        Genera un resumen extractivo usando un modelo BERT preentrenado basado en oraciones.
-        :param sentences: Lista de oraciones originales (sin procesar).
-        :param preprocessed_sentences: Lista de oraciones preprocesadas.
-        :param num_sentences: Número de oraciones a devolver en el resumen.
-        :return: Un string que contiene el resumen formado por las oraciones más relevantes.
-        """
-        # Unimos las oraciones preprocesadas en un texto completo para resumir
-        text = ' '.join(preprocessed_sentences)
-        summarizer = Summarizer()
-        # Usamos el modelo para generar un resumen con el número de oraciones solicitado
-        summarized_text = summarizer(text, num_sentences=num_sentences)
-        # Dividimos el resumen generado para seleccionar las oraciones originales correspondientes
-        summarized_sentences = summarized_text.split('. ')
-        selected = []
-        for summarized_sentence in summarized_sentences:
-            for sentence in sentences:
-                if summarized_sentence.strip() in sentence:
-                    selected.append(sentence)
-                    break
-        return ' '.join(selected[:num_sentences])

 class BERTSummarizer:
     def __init__(self):
         self.model = Summarizer()
+    def summarize(self, text, num_sentences):
+        return self.model(text, num_sentences=num_sentences)