mt5-small-headlines-summarizer

Runtime error

Nopphakorn commited on May 17, 2023

Commit

649e38c

1 Parent(s): 27a2b18

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,19 +4,18 @@ import nltk
 import math
 import torch
-model_name = "fabiochiu/t5-base-medium-title-generation"
 max_input_length = 512
-st.header("Generate candidate titles for articles")
-st_model_load = st.text('Loading title generator model...')
 @st.cache(allow_output_mutation=True)
 def load_model():
     print("Loading model...")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
-    nltk.download('punkt')
     print("Model loaded!")
     return tokenizer, model
@@ -81,14 +80,14 @@ def generate_title():
     }
     # compute predictions
-    outputs = model.generate(**inputs, do_sample=True, temperature=temperature)
     decoded_outputs = tokenizer.batch_decode(outputs, skip_special_tokens=True)
     predicted_titles = [nltk.sent_tokenize(decoded_output.strip())[0] for decoded_output in decoded_outputs]
     st.session_state.titles = predicted_titles
 # generate title button
-st_generate_button = st.button('Generate title', on_click=generate_title)
 # title generation labels
 if 'titles' not in st.session_state:
@@ -96,6 +95,6 @@ if 'titles' not in st.session_state:
 if len(st.session_state.titles) > 0:
     with st.container():
-        st.subheader("Generated titles")
         for title in st.session_state.titles:
             st.markdown("__" + title + "__")

 import math
 import torch
+model_name = "Nopphakorn/mt5-small-thaisum-512-title"
 max_input_length = 512
+st.header("Generate headline titles for Thai news")
+st_model_load = st.text('Loading headlines summarizer model...')
 @st.cache(allow_output_mutation=True)
 def load_model():
     print("Loading model...")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
     print("Model loaded!")
     return tokenizer, model
     }
     # compute predictions
+    outputs = model.generate(**inputs, do_sample=True, temperature=temperature, max_new_tokens=64)
     decoded_outputs = tokenizer.batch_decode(outputs, skip_special_tokens=True)
     predicted_titles = [nltk.sent_tokenize(decoded_output.strip())[0] for decoded_output in decoded_outputs]
     st.session_state.titles = predicted_titles
 # generate title button
+st_generate_button = st.button('Generate headlines', on_click=generate_title)
 # title generation labels
 if 'titles' not in st.session_state:
 if len(st.session_state.titles) > 0:
     with st.container():
+        st.subheader("Generated headlines")
         for title in st.session_state.titles:
             st.markdown("__" + title + "__")