Spaces:

datnth1709
/

FantasticFour-S2T-MT-demo

Runtime error

App Files Files Community

datnth1709 commited on Sep 21, 2022

Commit

4357214

1 Parent(s): 85cd50e

revert

Browse files

Files changed (1) hide show

app.py +10 -11

app.py CHANGED Viewed

@@ -162,7 +162,7 @@ def transcribe_vi(audio, state_vi="", state_en=""):
     state_vi += beam_search_output + " "
     en_text = translate_vi2en(beam_search_output)
     state_en += en_text + " "
-    return state_vi, state_en, state_vi, state_en
 def transcribe_en(audio, state_en="", state_vi=""):
     speech = load_data(audio)
@@ -179,7 +179,7 @@ def transcribe_en(audio, state_en="", state_vi=""):
     state_en += transcription + " "
     vi_text = translate_en2vi(transcription)
     state_vi += vi_text + " "
-    return state_en, state_vi, state_en, state_vi
 """Gradio demo"""
@@ -207,27 +207,27 @@ with gr.Blocks() as demo:
             translate_button_vien_1.click(lambda text: translate_vi2en(text), inputs=vietnamese_text, outputs=english_out_1)
             gr.Examples(examples=vi_example_text,
                         inputs=[vietnamese_text])
         with gr.TabItem("Speech2text and Vi-En Translation"):
             with gr.Row():
                 with gr.Column():
-                    vi_audio = gr.Audio(source="microphone", label="Input Vietnamese Audio", type="file", streaming=False)
                     translate_button_vien_2 = gr.Button(value="Translate To English")
                 with gr.Column():
                     speech2text_vi1 = gr.Textbox(label="Vietnamese Text")
                     english_out_2 = gr.Textbox(label="English Text")
-            translate_button_vien_2.click(lambda vi_voice: inference_vien(vi_voice), inputs=vi_audio, outputs=[speech2text_vi1, english_out_2])
             gr.Examples(examples=vi_example_voice,
-                        inputs=[vi_audio])
         with gr.TabItem("Vi-En Realtime Translation"):
             with gr.Row():
                 with gr.Column():
-                    vi_audio = gr.Audio(source="microphone", label="Input Vietnamese Audio", type="file", streaming=True)
-                    translate_button_vien_2 = gr.Button(value="Translate To English")
                 with gr.Column():
                     speech2text_vi2 = gr.Textbox(label="Vietnamese Text")
                     english_out_3 = gr.Textbox(label="English Text")
-            vi_audio.change(transcribe_vi, [vi_audio, "state_vi", "state_en"], [speech2text_vi2, english_out_3, "state_vi", "state_en"])
     with gr.Tabs():
@@ -258,11 +258,10 @@ with gr.Blocks() as demo:
             with gr.Row():
                 with gr.Column():
                     en_audio_2 = gr.Audio(source="microphone", label="Input English Audio", type="filepath", streaming=True)
-                    # translate_button_envi_2 = gr.Button(value="Translate To Vietnamese")
                 with gr.Column():
                     speech2text_en2 = gr.Textbox(label="English Text")
                     vietnamese_out_3 = gr.Textbox(label="Vietnamese Text")
-            en_audio_2.change(transcribe_en, [en_audio_2, "state_en", "state_vi"], [speech2text_en2, vietnamese_out_3, "state_en", "state_vi"])
 if __name__ == "__main__":
     demo.launch()

     state_vi += beam_search_output + " "
     en_text = translate_vi2en(beam_search_output)
     state_en += en_text + " "
+    return state_vi, state_en
 def transcribe_en(audio, state_en="", state_vi=""):
     speech = load_data(audio)
     state_en += transcription + " "
     vi_text = translate_en2vi(transcription)
     state_vi += vi_text + " "
+    return state_en, state_vi
 """Gradio demo"""
             translate_button_vien_1.click(lambda text: translate_vi2en(text), inputs=vietnamese_text, outputs=english_out_1)
             gr.Examples(examples=vi_example_text,
                         inputs=[vietnamese_text])
         with gr.TabItem("Speech2text and Vi-En Translation"):
             with gr.Row():
                 with gr.Column():
+                    vi_audio_1 = gr.Audio(source="microphone", label="Input Vietnamese Audio", type="file", streaming=False)
                     translate_button_vien_2 = gr.Button(value="Translate To English")
                 with gr.Column():
                     speech2text_vi1 = gr.Textbox(label="Vietnamese Text")
                     english_out_2 = gr.Textbox(label="English Text")
+            translate_button_vien_2.click(lambda vi_voice: inference_vien(vi_voice), inputs=vi_audio_1, outputs=[speech2text_vi1, english_out_2])
             gr.Examples(examples=vi_example_voice,
+                        inputs=[vi_audio_1])
         with gr.TabItem("Vi-En Realtime Translation"):
             with gr.Row():
                 with gr.Column():
+                    vi_audio_2 = gr.Audio(source="microphone", label="Input Vietnamese Audio", type="file", streaming=True)
                 with gr.Column():
                     speech2text_vi2 = gr.Textbox(label="Vietnamese Text")
                     english_out_3 = gr.Textbox(label="English Text")
+            vi_audio_2.change(transcribe_vi, [vi_audio_2, speech2text_vi2, english_out_3], [speech2text_vi2, english_out_3])
     with gr.Tabs():
             with gr.Row():
                 with gr.Column():
                     en_audio_2 = gr.Audio(source="microphone", label="Input English Audio", type="filepath", streaming=True)
                 with gr.Column():
                     speech2text_en2 = gr.Textbox(label="English Text")
                     vietnamese_out_3 = gr.Textbox(label="Vietnamese Text")
+            en_audio_2.change(transcribe_en, [en_audio_2, speech2text_en2, vietnamese_out_3], [speech2text_en2, vietnamese_out_3])
 if __name__ == "__main__":
     demo.launch()