Spaces:

ilokavat
/

arman-space-1

Sleeping

ilokavat commited on 23 days ago

Commit

3396324

verified ·

1 Parent(s): 838f1b5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,23 @@
 import gradio as gr
 from transformers import pipeline
-asr_pipeline = pipeline("automatic-speech-recognition", model="monadical-labs/whisper-medium.en")
 def transcribe(audio):
-    text = asr_pipeline(audio)["text"]
     return text
 demo = gr.Interface(fn=transcribe, inputs=gr.Audio(type="filepath"), outputs="text")
-demo.launch()

 import gradio as gr
 from transformers import pipeline
+import torch
+import librosa
+# Load ASR pipeline
+device = "cuda" if torch.cuda.is_available() else "cpu"
+asr_pipeline = pipeline("automatic-speech-recognition", model="monadical-labs/whisper-medium.en", device=device)
 def transcribe(audio):
+    if audio is None:
+        return "Error: No audio file received."
+    # Load the audio file correctly
+    audio_data, sr = librosa.load(audio, sr=16000)  # Resample to 16kHz (Whisper requirement)
+    # Process the audio
+    text = asr_pipeline(audio_data)["text"]
     return text
+# Create Gradio interface
 demo = gr.Interface(fn=transcribe, inputs=gr.Audio(type="filepath"), outputs="text")
+demo.launch()