Spaces:

clr
/

w2v2asr

Sleeping

clr commited on Dec 9, 2022

Commit

509f052

1 Parent(s): a64c958

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,19 +45,20 @@ def recc(a_f):
         wav = torch.from_numpy(wav).unsqueeze(0)
         if torch.cuda.is_available():
             wav = wav.cuda()
-        input_values = processor(wav).input_values
-        return input_values
 bl = gr.Blocks()
 with bl:
-    text_input = gr.Textbox()
-    text_output = gr.Textbox()
-    text_button = gr.Button("Run")
-    #text_button.click(show_ex, inputs=text_input, outputs=text_output)
     audio_file = gr.Audio(type="filepath")
-    #ipt =
     text_button.click(recc, inputs=audio_file, outputs=text_output)

         wav = torch.from_numpy(wav).unsqueeze(0)
         if torch.cuda.is_available():
             wav = wav.cuda()
+        input_values = processor(wav,sampling_rate=16000).input_values[0]
+        input_values = torch.tensor(input_values, device=device).unsqueeze(0)
+        logits = model(input_values).logits
+        pred_ids = torch.argmax(logits, dim=-1)
+        xcp = processor.decode(pred_ids)
+        return xcp
 bl = gr.Blocks()
 with bl:
     audio_file = gr.Audio(type="filepath")
+    text_button = gr.Button("Recognise")
+    text_output = gr.Textbox()
     text_button.click(recc, inputs=audio_file, outputs=text_output)