Persian-tts-fa

Runtime error

App Files Files Community

suprimedev commited on Jun 9

Commit

99d49d2

verified ·

1 Parent(s): d9e5c15

Update app.py

Browse files

Files changed (1) hide show

app.py +65 -36

app.py CHANGED Viewed

@@ -8,9 +8,6 @@ import os
 # --- دیکشنری زبان‌ها و صداها با کلیدهای فارسی (نمونه) ---
 # توجه: این فقط یک نمونه کوچک است. شما باید کل دیکشنری را به این شکل فارسی کنید.
-# برای سادگی، من فقط چند مورد اول را تغییر می دهم و بقیه را انگلیسی نگه می دارم.
-# شما باید برای هر کلید، نام زبان و جنسیت را به فارسی ترجمه کنید.
 language_dict_persian_keys = {
     'انگلیسی - جنی (زن)': 'en-US-JennyNeural',
     'انگلیسی - گای (مرد)': 'en-US-GuyNeural',
@@ -271,7 +268,7 @@ language_dict_persian_keys = {
     'سواحیلی (کنیا) - رفیقی (مرد)': 'sw-KE-RafikiNeural',
     'سواحیلی (کنیا) - زوری (زن)': 'sw-KE-ZuriNeural',
     'سواحیلی (تانزانیا) - داوودی (مرد)': 'sw-TZ-DaudiNeural',
-    'سواحیلی (تانزانیا) - رхема (زن)': 'sw-TZ-RehemaNeural',
     'تامیلی (هند) - پالاوی (زن)': 'ta-IN-PallaviNeural',
     'تامیلی (هند) - والووار (مرد)': 'ta-IN-ValluvarNeural',
     'تامیلی (مالزی) - کانی (زن)': 'ta-MY-KaniNeural',
@@ -303,45 +300,76 @@ language_dict_persian_keys = {
 }
 # --- توابع تبدیل متن به گفتار و wrapper (همانند قبل) ---
-async def text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch): # language_code_persian نام پارامتر تغییر کرد
     try:
-        if not text: return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
-        # دریافت voice_id از دیکشنری با کلیدهای فارسی
         voice_id = language_dict_persian_keys.get(language_code_persian)
-        if voice_id is None: return f"خطا: مدل صدای انتخاب شده ('{language_code_persian}') یافت نشد.", None
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
-        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file: tmp_path = tmp_file.name
-        await communicate.save(tmp_path)
-        return "تبدیل با موفقیت انجام شد.", tmp_path
     except edge_tts.exceptions.NoAudioReceived:
         error_msg = f"خطا: صدایی برای متن و صدای انتخاب شده دریافت نشد (صدا: {voice_id})."
         return error_msg, None
     except ValueError as ve:
-        error_msg = f"خطا در پارامترهای ورودی: {ve}" # حذف اشاره به edge-tts
         return error_msg, None
     except Exception as e:
-        return f"خطای غیرمنتظره در سرور: {type(e).__name__}", None
 _event_loops_by_thread = {}
 def _get_or_create_event_loop():
     thread_id = threading.get_ident()
-    if thread_id not in _event_loops_by_thread or _event_loops_by_thread[thread_id].is_closed():
-        _event_loops_by_thread[thread_id] = asyncio.new_event_loop()
-    return _event_loops_by_thread[thread_id]
 def text_to_speech_edge_sync_wrapper(text, language_code_persian, rate, volume, pitch):
     try:
-        loop = _get_or_create_event_loop(); asyncio.set_event_loop(loop)
         result = loop.run_until_complete(text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch))
-    except RuntimeError as e:
-        if "no current event loop" in str(e).lower() or "cannot be called from a running event loop" in str(e).lower():
-            new_loop = asyncio.new_event_loop(); asyncio.set_event_loop(new_loop)
-            try: result = new_loop.run_until_complete(text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch))
-            finally: new_loop.close()
-        else: return f"خطای اجرایی: {e}", None
-    except Exception as e: return f"خطای غیرمنتظره: {type(e).__name__}", None
-    return result
 # --- تعریف تم و CSS ---
 app_theme = gr.themes.Soft(
@@ -374,7 +402,6 @@ body { font-family: 'Vazirmatn', 'Arial', sans-serif; direction: rtl; }
 }
 .app-header p { color: #bdc3c7 !important; font-size: 0.9em !important; margin-top: 5px; }
 .main-content-row > .gr-column { margin-bottom: 1rem; }
 .gr-button.lg.primary {
     background: #3498db !important; color: white !important; font-weight: 500 !important;
     border-radius: 8px !important; padding: 12px 15px !important; width: 100% !important;
@@ -403,7 +430,6 @@ label > span {
 }
 .gr-examples table { font-size: 0.85em; }
 .gr-examples th, .gr-examples td { padding: 6px 8px !important; }
 footer { display: none !important; visibility: hidden !important; }
 .gradio-footer { display: none !important; visibility: hidden !important; }
 .flagging-container { display: none !important; visibility: hidden !important; }
@@ -411,7 +437,6 @@ footer { display: none !important; visibility: hidden !important; }
 div[data-testid="flag"] { display: none !important; }
 button[title="Flag"], button[aria-label="Flag"] {display: none !important; }
 .footer-utils { display: none !important; visibility: hidden !important; }
 @keyframes float_soft {
 	0% { transform: translatey(0px) scale(1); }
 	50% { transform: translatey(-5px) scale(1.05); }
@@ -432,7 +457,6 @@ button[title="Flag"], button[aria-label="Flag"] {display: none !important; }
 # انتخاب صدای پیش فرض فارسی
 default_voice_key_persian = 'فارسی (ایران) - فرید (مرد)'
 if default_voice_key_persian not in language_dict_persian_keys:
-    # اگر به هر دلیلی صدای پیش فرض فارسی ما در لیست نبود، اولین مورد لیست را انتخاب کن
     default_voice_key_persian = list(language_dict_persian_keys.keys())[0] if language_dict_persian_keys else None
 # LOGO_URL دیگر استفاده نمی‌شود چون لوگو حذف شده است، اما برای حفظ سایر بخش‌های کد دست نخورده، آن را نگه می‌داریم
@@ -455,7 +479,7 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
                 placeholder="اینجا بنویسید...",
                 value=""
             )
-            language_dropdown = gr.Dropdown( # نام متغیر برای وضوح بیشتر
                 choices=list(language_dict_persian_keys.keys()),
                 value=default_voice_key_persian,
                 label="🗣️ زبان و گوینده را انتخاب کنید"
@@ -469,8 +493,9 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
             submit_button = gr.Button("🔊 تولید و پخش صدا", variant="primary")
         with gr.Column(scale=2):
             output_text_status = gr.Textbox(label="📊 وضعیت عملیات", interactive=False, lines=1, placeholder="نتیجه اینجا نمایش داده می‌شود...")
-            output_audio = gr.Audio(type="filepath", label="🎧 فایل صوتی خروجی", interactive=False)
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
@@ -480,17 +505,21 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
             ["This is a test of the speech synthesis system.", 'انگلیسی - جنی (زن)', +5, 0, 0],
             ["تجربه کاربری در این سامانه بسیار روان است.", 'فارسی (ایران) - فرید (مرد)', -5, 0, 0],
         ],
-        inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider], # استفاده از نام متغیرهای جدید
-        outputs=[output_text_status, output_audio],
         fn=text_to_speech_edge_sync_wrapper,
         cache_examples=False,
         label="💡 چند نمونه برای شروع"
     )
     submit_button.click(
         fn=text_to_speech_edge_sync_wrapper,
-        inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider], # استفاده از نام متغیرهای جدید
-        outputs=[output_text_status, output_audio],
     )
-demo.launch()

 # --- دیکشنری زبان‌ها و صداها با کلیدهای فارسی (نمونه) ---
 # توجه: این فقط یک نمونه کوچک است. شما باید کل دیکشنری را به این شکل فارسی کنید.
 language_dict_persian_keys = {
     'انگلیسی - جنی (زن)': 'en-US-JennyNeural',
     'انگلیسی - گای (مرد)': 'en-US-GuyNeural',
     'سواحیلی (کنیا) - رفیقی (مرد)': 'sw-KE-RafikiNeural',
     'سواحیلی (کنیا) - زوری (زن)': 'sw-KE-ZuriNeural',
     'سواحیلی (تانزانیا) - داوودی (مرد)': 'sw-TZ-DaudiNeural',
+    'سواحیلی (تانزانیا) - رهمه (زن)': 'sw-TZ-RehemaNeural',
     'تامیلی (هند) - پالاوی (زن)': 'ta-IN-PallaviNeural',
     'تامیلی (هند) - والووار (مرد)': 'ta-IN-ValluvarNeural',
     'تامیلی (مالزی) - کانی (زن)': 'ta-MY-KaniNeural',
 }
 # --- توابع تبدیل متن به گفتار و wrapper (همانند قبل) ---
+async def text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch):
+    """
+    تابع ناهمزمان برای تبدیل متن به گفتار با استفاده از Edge TTS.
+    خروجی: (پیام وضعیت, مسیر فایل صوتی یا None)
+    """
+    temp_path = None # مسیر فایل موقت را مقداردهی اولیه می‌کنیم
     try:
+        if not text:
+            return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
         voice_id = language_dict_persian_keys.get(language_code_persian)
+        if voice_id is None:
+            return f"خطا: مدل صدای انتخاب شده ('{language_code_persian}') یافت نشد.", None
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
+        # ایجاد یک فایل موقت برای ذخیره صدا
+        # Gradio مسئول حذف این فایل موقت خواهد بود اگر از tempfile استفاده شود
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file:
+            temp_path = tmp_file.name
+        await communicate.save(temp_path)
+        return "تبدیل با موفقیت انجام شد.", temp_path
     except edge_tts.exceptions.NoAudioReceived:
         error_msg = f"خطا: صدایی برای متن و صدای انتخاب شده دریافت نشد (صدا: {voice_id})."
+        # اگر خطا وجود داشت و فایل موقت ایجاد شده بود، آن را حذف می‌کنیم
+        if temp_path and os.path.exists(temp_path):
+            os.remove(temp_path)
         return error_msg, None
     except ValueError as ve:
+        error_msg = f"خطا در پارامترهای ورودی: {ve}"
+        if temp_path and os.path.exists(temp_path):
+            os.remove(temp_path)
         return error_msg, None
     except Exception as e:
+        error_msg = f"خطای غیرمنتظره در سرور: {type(e).__name__} - {e}"
+        traceback.print_exc() # برای مشاهده traceback در کنسول
+        if temp_path and os.path.exists(temp_path):
+            os.remove(temp_path)
+        return error_msg, None
 _event_loops_by_thread = {}
 def _get_or_create_event_loop():
+    """
+    برای مدیریت حلقه رویداد asyncio در ترد‌های مختلف.
+    هر ترد یک حلقه رویداد مخصوص به خود را دارد.
+    """
     thread_id = threading.get_ident()
+    loop = _event_loops_by_thread.get(thread_id)
+    if loop is None or loop.is_closed():
+        loop = asyncio.new_event_loop()
+        _event_loops_by_thread[thread_id] = loop
+    return loop
 def text_to_speech_edge_sync_wrapper(text, language_code_persian, rate, volume, pitch):
+    """
+    یک wrapper همزمان برای تابع ناهمزمان text_to_speech_edge_async.
+    این تابع توسط Gradio فراخوانی می‌شود.
+    """
     try:
+        loop = _get_or_create_event_loop()
+        # اجرای تابع ناهمزمان در حلقه رویداد
+        # run_until_complete مسدودکننده است تا عملیات ناهمزمان کامل شود
         result = loop.run_until_complete(text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch))
+        return result
+    except Exception as e:
+        # در صورت بروز هرگونه خطا در زمان اجرا، آن را گزارش می‌کنیم
+        return f"خطای حین اجرای عملیات تبدیل: {type(e).__name__} - {e}", None
 # --- تعریف تم و CSS ---
 app_theme = gr.themes.Soft(
 }
 .app-header p { color: #bdc3c7 !important; font-size: 0.9em !important; margin-top: 5px; }
 .main-content-row > .gr-column { margin-bottom: 1rem; }
 .gr-button.lg.primary {
     background: #3498db !important; color: white !important; font-weight: 500 !important;
     border-radius: 8px !important; padding: 12px 15px !important; width: 100% !important;
 }
 .gr-examples table { font-size: 0.85em; }
 .gr-examples th, .gr-examples td { padding: 6px 8px !important; }
 footer { display: none !important; visibility: hidden !important; }
 .gradio-footer { display: none !important; visibility: hidden !important; }
 .flagging-container { display: none !important; visibility: hidden !important; }
 div[data-testid="flag"] { display: none !important; }
 button[title="Flag"], button[aria-label="Flag"] {display: none !important; }
 .footer-utils { display: none !important; visibility: hidden !important; }
 @keyframes float_soft {
 	0% { transform: translatey(0px) scale(1); }
 	50% { transform: translatey(-5px) scale(1.05); }
 # انتخاب صدای پیش فرض فارسی
 default_voice_key_persian = 'فارسی (ایران) - فرید (مرد)'
 if default_voice_key_persian not in language_dict_persian_keys:
     default_voice_key_persian = list(language_dict_persian_keys.keys())[0] if language_dict_persian_keys else None
 # LOGO_URL دیگر استفاده نمی‌شود چون لوگو حذف شده است، اما برای حفظ سایر بخش‌های کد دست نخورده، آن را نگه می‌داریم
                 placeholder="اینجا بنویسید...",
                 value=""
             )
+            language_dropdown = gr.Dropdown(
                 choices=list(language_dict_persian_keys.keys()),
                 value=default_voice_key_persian,
                 label="🗣️ زبان و گوینده را انتخاب کنید"
             submit_button = gr.Button("🔊 تولید و پخش صدا", variant="primary")
         with gr.Column(scale=2):
+            # اطمینان از اینکه خروجی‌ها به درستی به کامپوننت‌های هدف متصل شوند
             output_text_status = gr.Textbox(label="📊 وضعیت عملیات", interactive=False, lines=1, placeholder="نتیجه اینجا نمایش داده می‌شود...")
+            output_audio = gr.Audio(type="filepath", label="🎧 فایل صوتی خروجی", interactive=False, elem_id="output_audio", autoplay=True) # interactive=True لازم نیست، بلکه type="filepath" و اتصال درست کافیست. autoplay=True برای پخش خودکار
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
             ["This is a test of the speech synthesis system.", 'انگلیسی - جنی (زن)', +5, 0, 0],
             ["تجربه کاربری در این سامانه بسیار روان است.", 'فارسی (ایران) - فرید (مرد)', -5, 0, 0],
         ],
+        inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
+        outputs=[output_text_status, output_audio], # اطمینان از اینکه هر دو خروجی به درستی به تابع Examples متصل شده‌اند
         fn=text_to_speech_edge_sync_wrapper,
         cache_examples=False,
         label="💡 چند نمونه برای شروع"
     )
+    # اتصال دکمه submit به تابع تبدیل
     submit_button.click(
         fn=text_to_speech_edge_sync_wrapper,
+        inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
+        outputs=[output_text_status, output_audio], # اطمینان از اینکه هر دو خروجی به درستی به تابع کلیک متصل شده‌اند
     )
+# برای اجرای برنامه Gradio
+if __name__ == "__main__":
+    demo.launch()