voicemenu1433

Sleeping

lokesh341 commited on Feb 1

Commit

fbefe20

verified ·

1 Parent(s): a06166a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,9 +9,9 @@ from waitress import serve
 app = Flask(__name__)
-# Load Whisper ASR Model for Faster Response (Switch to medium for better speed)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-asr_model = pipeline("automatic-speech-recognition", model="openai/whisper-medium", device=0 if device == "cuda" else -1)
 # Function to generate voice prompts
 def generate_audio_prompt(text, filename):
@@ -54,7 +54,7 @@ def convert_to_wav(input_path, output_path):
 # Function to check if audio contains actual speech
 def is_silent_audio(audio_path):
     audio = AudioSegment.from_wav(audio_path)
-    nonsilent_parts = detect_nonsilent(audio, min_silence_len=500, silence_thresh=audio.dBFS-16)
     return len(nonsilent_parts) == 0
 @app.route("/")

 app = Flask(__name__)
+# Load Whisper ASR Model for Better Speed & Accuracy
 device = "cuda" if torch.cuda.is_available() else "cpu"
+asr_model = pipeline("automatic-speech-recognition", model="openai/whisper-small", device=0 if device == "cuda" else -1)  # Small model for faster inference
 # Function to generate voice prompts
 def generate_audio_prompt(text, filename):
 # Function to check if audio contains actual speech
 def is_silent_audio(audio_path):
     audio = AudioSegment.from_wav(audio_path)
+    nonsilent_parts = detect_nonsilent(audio, min_silence_len=300, silence_thresh=audio.dBFS-16)  # Reduced silence duration
     return len(nonsilent_parts) == 0
 @app.route("/")