pere commited on
Commit
6e56ae2
·
1 Parent(s): c75b8f6

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +2 -43
app.py CHANGED
@@ -23,58 +23,17 @@ def deuncase(model, tokenizer, text):
23
  st.title("DeUnCaser")
24
 
25
  st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
26
- st.sidebar.write("You can use the examples below, but too really test the effect of the model: Write or copy text from the Internet, and then use the buttons to remove spaces, puctation, cases etc. Try to restore the text.")
27
 
28
 
29
  option = st.sidebar.selectbox(
30
  "Examples:",
31
  ("tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"))
32
 
33
- col1, col2, col3 = st.columns([1,1,1])
34
- with col1:
35
- uncase=st.checkbox('Remove Casing')
36
- with col2:
37
- unpunct=st.button('Remove Punctation')
38
- with col3:
39
- unspace=st.checkbox('Remove Spaces')
40
-
41
- #else:
42
- # mytext= 'Vi bruker ikke tegnsetting eller store bokstaver når vi prater. Vi slår også sammen ord, og i praksis er dermed heller ikke mellomrom meningsbærende. Prøv å fjerne tegnsetting, store bokstaver og mellomrom fra dette avsnittet. Se om den nye North-T5-modellen greier å sette sammen til et nytt.'
43
-
44
- textbox = st.empty()
45
- text = textbox.text_area(f"",max_chars=1000)
46
-
47
- #if uncase:
48
- # mytext = text.lower()
49
-
50
- if unpunct:
51
- trans_chars = "'\",.:;-_*?/\n"
52
- trans_table = text.maketrans("", "", trans_chars)
53
- text = text.translate(trans_table)
54
- text = textbox.text_area(f"",max_chars=1000, value=text)
55
- st.write("inside unpunct")
56
-
57
- else:
58
- st.write("and here")
59
-
60
- #if unspace:
61
- # mytext = text.replace(" ", "")
62
-
63
 
64
  run = st.button('Run DeUnCaser')
65
 
66
-
67
- #st.text("Fixed text: ")
68
-
69
- #form = st.form(key='my_form')
70
- #form.text_input(value="test",key="test",label='Enter some text')
71
- #submit_button = form.form_submit_button(label='Submit')
72
- #https://blog.streamlit.io/introducing-submit-button-and-forms/
73
-
74
-
75
- #More stuff to try
76
-
77
-
78
  if run:
79
  model, tokenizer = load_model()
80
  translated_text = deuncase(model, tokenizer, text)
 
23
  st.title("DeUnCaser")
24
 
25
  st.sidebar.write("This web app adds spaces, punctation and capitalisation back into the text.")
26
+ st.sidebar.write("You can use the examples below, but too really test the effect of the model: Write or copy text from the Internet, and then manually remove spaces, puctation, cases etc. Try to restore the text.")
27
 
28
 
29
  option = st.sidebar.selectbox(
30
  "Examples:",
31
  ("tirsdag var travel for ukrainas president volodymyr zelenskyj på morgenen tok han imot polens statsminister mateusz morawiecki","tirsdagvartravelforukrainaspresidentvolodymyrzelenskyjpåkveldentokhanimotpolensstatsministermateuszmorawiecki","deterikkelettåholderedepåstoreogsmåbokstavermanmåforeksempelhuskestorforbokstavnårmanskriveromkrimhalvøyamenkunbrukelitenforbokstavnårmanhenvisertilenkrimroman","detteerenlitendemosomerlagetavperegilkummervoldhanerenforskersomtidligerejobbetvednasjonalbiblioteketimoirana", "sentpå60talletvardetfaktisknoensomkalteungensinperegilkummervoldidagerdetikkelengersåvanligåbrukedobbeltnavninorgehvasynesduomdet"))
32
 
33
+ text = st.text_area(f"",max_chars=1000,value=option)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
 
35
  run = st.button('Run DeUnCaser')
36
 
 
 
 
 
 
 
 
 
 
 
 
 
37
  if run:
38
  model, tokenizer = load_model()
39
  translated_text = deuncase(model, tokenizer, text)