voicemenulogin625

Sleeping

Subbu1304 commited on 22 days ago

Commit

81cc16d

verified ·

1 Parent(s): 79296ac

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,9 +3,11 @@ import time
 import logging
 import json
 import requests
 from flask import Flask, render_template, request, jsonify, session
 from flask_session import Session
 from simple_salesforce import Salesforce
 from gtts import gTTS
 from pydub import AudioSegment
 from pydub.silence import detect_nonsilent
@@ -28,6 +30,11 @@ try:
 except Exception as e:
     print(f"❌ Failed to connect to Salesforce: {str(e)}")
 # Voice prompts
 prompts = {
     "welcome": "Welcome to Biryani Hub.",
@@ -139,7 +146,7 @@ def transcribe():
         if is_silent_audio(output_audio_path):
             return jsonify({"error": "No speech detected. Please try again."}), 400
-        result = pipeline("automatic-speech-recognition", model="openai/whisper-small", device=0 if torch.cuda.is_available() else -1)
         transcribed_text = result(output_audio_path)["text"].strip().capitalize()
         return jsonify({"text": transcribed_text})

 import logging
 import json
 import requests
+import torch
 from flask import Flask, render_template, request, jsonify, session
 from flask_session import Session
 from simple_salesforce import Salesforce
+from transformers import pipeline, AutoConfig
 from gtts import gTTS
 from pydub import AudioSegment
 from pydub.silence import detect_nonsilent
 except Exception as e:
     print(f"❌ Failed to connect to Salesforce: {str(e)}")
+# Whisper ASR Configuration
+device = "cuda" if torch.cuda.is_available() else "cpu"
+config = AutoConfig.from_pretrained("openai/whisper-small")
+config.update({"timeout": 60})
 # Voice prompts
 prompts = {
     "welcome": "Welcome to Biryani Hub.",
         if is_silent_audio(output_audio_path):
             return jsonify({"error": "No speech detected. Please try again."}), 400
+        result = pipeline("automatic-speech-recognition", model="openai/whisper-small", device=0 if torch.cuda.is_available() else -1, config=config)
         transcribed_text = result(output_audio_path)["text"].strip().capitalize()
         return jsonify({"text": transcribed_text})