Spaces:

2506minecraft
/

Arabic-Chatbot

Running

App Files Files Community

2506minecraft commited on 16 days ago

Commit

0073e6e

verified ·

1 Parent(s): fbabb43

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -15

app.py CHANGED Viewed

@@ -7,10 +7,11 @@ import librosa
 import soundfile as sf
 from pydub import AudioSegment
 from telegram import Update
-from telegram.ext import ApplicationBuilder, MessageHandler, filters
 from transformers import pipeline, AutoTokenizer, VitsModel
 from huggingface_hub import login
 import asyncio
 # ===== تهيئة التوكن =====
 login(token=os.getenv("HF_TOKEN"))
@@ -22,20 +23,22 @@ logging.basicConfig(
 )
 logger = logging.getLogger(__name__)
-# ===== تحميل النماذج =====
 try:
     asr_pipeline = pipeline(
         "automatic-speech-recognition",
         model="jonatasgrosman/wav2vec2-large-xlsr-53-arabic",
         token=os.getenv("HF_TOKEN")
     )
     tts_tokenizer = AutoTokenizer.from_pretrained(
-        "facebook/mms-tts-ara",
         token=os.getenv("HF_TOKEN")
     )
     tts_model = VitsModel.from_pretrained(
-        "facebook/mms-tts-ara",
         token=os.getenv("HF_TOKEN")
     )
@@ -43,13 +46,16 @@ except Exception as e:
     logger.error(f"فشل تحميل النماذج: {str(e)}")
     raise
 # ===== دوال معالجة الصوت =====
 def enhance_audio(input_path: str, output_path: str) -> bool:
     try:
         audio = AudioSegment.from_wav(input_path)
-        audio = audio.low_pass_filter(3000)
-        audio = audio.high_pass_filter(100)
-        audio = audio.normalize()
         audio = audio.fade_in(150).fade_out(150)
         audio.export(output_path, format="wav")
         return True
@@ -67,16 +73,22 @@ async def speech_to_text(audio_path: str) -> str:
         logger.error(f"فشل التعرف على الصوت: {str(e)}")
         return ""
-async def generate_response(text: str) -> str:
     try:
         chatbot = pipeline(
             "text-generation",
             model="aubmindlab/aragpt2-base",
-            token=os.getenv("HF_TOKEN")
         )
         response = chatbot(
-            text,
-            max_length=100,
             num_return_sequences=1,
             pad_token_id=50256
         )
@@ -86,25 +98,33 @@ async def generate_response(text: str) -> str:
         return "حدث خطأ في توليد الرد."
 async def text_to_speech(text: str) -> None:
     try:
         inputs = tts_tokenizer(text, return_tensors="pt")
         with torch.no_grad():
-            output = tts_model(**inputs)
         waveform = output.waveform[0].numpy()
         sf.write("bot_response.wav", waveform, tts_model.config.sampling_rate)
     except Exception as e:
         logger.error(f"فشل تحويل النص إلى صوت: {str(e)}")
-# ===== الدالة الرئيسية مع Threading =====
 async def process_voice(update: Update, context):
     try:
         voice_file = await update.message.voice.get_file()
         await voice_file.download_to_drive("user_voice.ogg")
         user_text = await speech_to_text("user_voice.ogg")
-        bot_response = await generate_response(user_text)
         await text_to_speech(bot_response)
         if enhance_audio("bot_response.wav", "bot_response_enhanced.wav"):
             await update.message.reply_voice("bot_response_enhanced.wav")
         else:
@@ -114,11 +134,13 @@ async def process_voice(update: Update, context):
         logger.error(f"خطأ غير متوقع: {str(e)}")
         await update.message.reply_text("⚠️ عذرًا، حدث خطأ في المعالجة.")
 def run_bot():
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     application = ApplicationBuilder().token(os.getenv("TELEGRAM_TOKEN")).build()
     application.add_handler(MessageHandler(filters.VOICE, process_voice))
     application.run_polling(
@@ -127,7 +149,6 @@ def run_bot():
     )
 if __name__ == "__main__":
-    # تشغيل البوت في خيط منفصل
     bot_thread = threading.Thread(target=run_bot, daemon=True)
     bot_thread.start()
     bot_thread.join()

 import soundfile as sf
 from pydub import AudioSegment
 from telegram import Update
+from telegram.ext import ApplicationBuilder, MessageHandler, filters, CommandHandler
 from transformers import pipeline, AutoTokenizer, VitsModel
 from huggingface_hub import login
 import asyncio
+from collections import defaultdict
 # ===== تهيئة التوكن =====
 login(token=os.getenv("HF_TOKEN"))
 )
 logger = logging.getLogger(__name__)
+# ===== تحميل النماذج مع صوت أنثوي محسّن =====
 try:
+    # 1. نموذج التعرف على الكلام
     asr_pipeline = pipeline(
         "automatic-speech-recognition",
         model="jonatasgrosman/wav2vec2-large-xlsr-53-arabic",
         token=os.getenv("HF_TOKEN")
     )
+    # 2. نموذج توليف الصوت الأنثوي (Mishkal TTS)
     tts_tokenizer = AutoTokenizer.from_pretrained(
+        "miscellaneous-stuff/mishkal-tts",
         token=os.getenv("HF_TOKEN")
     )
     tts_model = VitsModel.from_pretrained(
+        "miscellaneous-stuff/mishkal-tts",
         token=os.getenv("HF_TOKEN")
     )
     logger.error(f"فشل تحميل النماذج: {str(e)}")
     raise
+# ===== ذاكرة المحادثة =====
+conversation_history = defaultdict(list)
 # ===== دوال معالجة الصوت =====
 def enhance_audio(input_path: str, output_path: str) -> bool:
     try:
         audio = AudioSegment.from_wav(input_path)
+        audio = audio.low_pass_filter(3000)  # تقليل الضوضاء
+        audio = audio.high_pass_filter(100)   # إزالة الترددات المنخفضة
+        audio = audio.normalize()             # توحيد مستوى الصوت
         audio = audio.fade_in(150).fade_out(150)
         audio.export(output_path, format="wav")
         return True
         logger.error(f"فشل التعرف على الصوت: {str(e)}")
         return ""
+async def generate_response(text: str, user_id: str) -> str:
+    """توليد رد قصير مترابط"""
     try:
+        # تحديث ذاكرة المحادثة
+        conversation_history[user_id].append(text)
+        context = "\n".join(conversation_history[user_id][-3:])  # أخر 3 رسائل
         chatbot = pipeline(
             "text-generation",
             model="aubmindlab/aragpt2-base",
+            token=os.getenv("HF_TOKEN"),
+            max_length=50,    # تقليل طول الرد
+            temperature=0.7,  # زيادة التركيز
         )
         response = chatbot(
+            context,
             num_return_sequences=1,
             pad_token_id=50256
         )
         return "حدث خطأ في توليد الرد."
 async def text_to_speech(text: str) -> None:
+    """تحويل النص إلى صوت أنثوي"""
     try:
         inputs = tts_tokenizer(text, return_tensors="pt")
         with torch.no_grad():
+            output = tts_model(**inputs, speaker_id=2)  # اختيار الصوت الأنثوي
         waveform = output.waveform[0].numpy()
         sf.write("bot_response.wav", waveform, tts_model.config.sampling_rate)
     except Exception as e:
         logger.error(f"فشل تحويل النص إلى صوت: {str(e)}")
+# ===== دوال التفاعل مع المستخدم =====
+async def start(update: Update, context):
+    """رسالة الترحيب"""
+    await update.message.reply_text("مرحبًا! أنا بوت الدردشة الصوتية الأنثوي. أرسل لي رسالة صوتية وسأرد عليك بصوت أنثوي عالي الجودة 🎤")
 async def process_voice(update: Update, context):
     try:
+        user_id = update.message.from_user.id
         voice_file = await update.message.voice.get_file()
         await voice_file.download_to_drive("user_voice.ogg")
+        # معالجة الصوت
         user_text = await speech_to_text("user_voice.ogg")
+        bot_response = await generate_response(user_text, str(user_id))
         await text_to_speech(bot_response)
+        # إرسال الرد
         if enhance_audio("bot_response.wav", "bot_response_enhanced.wav"):
             await update.message.reply_voice("bot_response_enhanced.wav")
         else:
         logger.error(f"خطأ غير متوقع: {str(e)}")
         await update.message.reply_text("⚠️ عذرًا، حدث خطأ في المعالجة.")
+# ===== التشغيل الرئيسي =====
 def run_bot():
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     application = ApplicationBuilder().token(os.getenv("TELEGRAM_TOKEN")).build()
+    application.add_handler(CommandHandler("start", start))
     application.add_handler(MessageHandler(filters.VOICE, process_voice))
     application.run_polling(
     )
 if __name__ == "__main__":
     bot_thread = threading.Thread(target=run_bot, daemon=True)
     bot_thread.start()
     bot_thread.join()