Persian-tts-fa

Runtime error

App Files Files Community

suprimedev commited on Jun 10

Commit

77c595e

verified ·

1 Parent(s): 99d49d2

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -51

app.py CHANGED Viewed

@@ -3,11 +3,10 @@ import edge_tts
 import tempfile
 import asyncio
 import traceback
-import threading
 import os
 # --- دیکشنری زبان‌ها و صداها با کلیدهای فارسی (نمونه) ---
-# توجه: این فقط یک نمونه کوچک است. شما باید کل دیکشنری را به این شکل فارسی کنید.
 language_dict_persian_keys = {
     'انگلیسی - جنی (زن)': 'en-US-JennyNeural',
     'انگلیسی - گای (مرد)': 'en-US-GuyNeural',
@@ -299,16 +298,19 @@ language_dict_persian_keys = {
     'زولو (آفریقای جنوبی) - تمبا (مرد)': 'zu-ZA-ThembaNeural',
 }
-# --- توابع تبدیل متن به گفتار و wrapper (همانند قبل) ---
 async def text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch):
     """
     تابع ناهمزمان برای تبدیل متن به گفتار با استفاده از Edge TTS.
     خروجی: (پیام وضعیت, مسیر فایل صوتی یا None)
     """
-    temp_path = None # مسیر فایل موقت را مقداردهی اولیه می‌کنیم
     try:
         if not text:
             return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
         voice_id = language_dict_persian_keys.get(language_code_persian)
         if voice_id is None:
             return f"خطا: مدل صدای انتخاب شده ('{language_code_persian}') یافت نشد.", None
@@ -316,19 +318,24 @@ async def text_to_speech_edge_async(text, language_code_persian, rate, volume, p
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
-        # ایجاد یک فایل موقت برای ذخیره صدا
-        # Gradio مسئول حذف این فایل موقت خواهد بود اگر از tempfile استفاده شود
-        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file:
             temp_path = tmp_file.name
         await communicate.save(temp_path)
         return "تبدیل با موفقیت انجام شد.", temp_path
     except edge_tts.exceptions.NoAudioReceived:
         error_msg = f"خطا: صدایی برای متن و صدای انتخاب شده دریافت نشد (صدا: {voice_id})."
-        # اگر خطا وجود داشت و فایل موقت ایجاد شده بود، آن را حذف می‌کنیم
         if temp_path and os.path.exists(temp_path):
-            os.remove(temp_path)
         return error_msg, None
     except ValueError as ve:
         error_msg = f"خطا در پارامترهای ورودی: {ve}"
@@ -337,41 +344,12 @@ async def text_to_speech_edge_async(text, language_code_persian, rate, volume, p
         return error_msg, None
     except Exception as e:
         error_msg = f"خطای غیرمنتظره در سرور: {type(e).__name__} - {e}"
-        traceback.print_exc() # برای مشاهده traceback در کنسول
         if temp_path and os.path.exists(temp_path):
             os.remove(temp_path)
         return error_msg, None
-_event_loops_by_thread = {}
-def _get_or_create_event_loop():
-    """
-    برای مدیریت حلقه رویداد asyncio در ترد‌های مختلف.
-    هر ترد یک حلقه رویداد مخصوص به خود را دارد.
-    """
-    thread_id = threading.get_ident()
-    loop = _event_loops_by_thread.get(thread_id)
-    if loop is None or loop.is_closed():
-        loop = asyncio.new_event_loop()
-        _event_loops_by_thread[thread_id] = loop
-    return loop
-def text_to_speech_edge_sync_wrapper(text, language_code_persian, rate, volume, pitch):
-    """
-    یک wrapper همزمان برای تابع ناهمزمان text_to_speech_edge_async.
-    این تابع توسط Gradio فراخوانی می‌شود.
-    """
-    try:
-        loop = _get_or_create_event_loop()
-        # اجرای تابع ناهمزمان در حلقه رویداد
-        # run_until_complete مسدودکننده است تا عملیات ناهمزمان کامل شود
-        result = loop.run_until_complete(text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch))
-        return result
-    except Exception as e:
-        # در صورت بروز هرگونه خطا در زمان اجرا، آن را گزارش می‌کنیم
-        return f"خطای حین اجرای عملیات تبدیل: {type(e).__name__} - {e}", None
-# --- تعریف تم و CSS ---
 app_theme = gr.themes.Soft(
     primary_hue=gr.themes.colors.blue,
     secondary_hue=gr.themes.colors.sky,
@@ -459,8 +437,7 @@ default_voice_key_persian = 'فارسی (ایران) - فرید (مرد)'
 if default_voice_key_persian not in language_dict_persian_keys:
     default_voice_key_persian = list(language_dict_persian_keys.keys())[0] if language_dict_persian_keys else None
-# LOGO_URL دیگر استفاده نمی‌شود چون لوگو حذف شده است، اما برای حفظ سایر بخش‌های کد دست نخورده، آن را نگه می‌داریم
-LOGO_URL = "https://www.gstatic.com/lamda/images/gemini/google_bard_logo_150_v2_dark_color_1x.png"
 with gr.Blocks(theme=app_theme, css=custom_css) as demo:
     with gr.Row():
@@ -493,9 +470,10 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
             submit_button = gr.Button("🔊 تولید و پخش صدا", variant="primary")
         with gr.Column(scale=2):
-            # اطمینان از اینکه خروجی‌ها به درستی به کامپوننت‌های هدف متصل شوند
             output_text_status = gr.Textbox(label="📊 وضعیت عملیات", interactive=False, lines=1, placeholder="نتیجه اینجا نمایش داده می‌شود...")
-            output_audio = gr.Audio(type="filepath", label="🎧 فایل صوتی خروجی", interactive=False, elem_id="output_audio", autoplay=True) # interactive=True لازم نیست، بلکه type="filepath" و اتصال درست کافیست. autoplay=True برای پخش خودکار
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
@@ -505,21 +483,23 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
             ["This is a test of the speech synthesis system.", 'انگلیسی - جنی (زن)', +5, 0, 0],
             ["تجربه کاربری در این سامانه بسیار روان است.", 'فارسی (ایران) - فرید (مرد)', -5, 0, 0],
         ],
         inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
-        outputs=[output_text_status, output_audio], # اطمینان از اینکه هر دو خروجی به درستی به تابع Examples متصل شده‌اند
-        fn=text_to_speech_edge_sync_wrapper,
-        cache_examples=False,
         label="💡 چند نمونه برای شروع"
     )
-    # اتصال دکمه submit به تابع تبدیل
     submit_button.click(
-        fn=text_to_speech_edge_sync_wrapper,
         inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
-        outputs=[output_text_status, output_audio], # اطمینان از اینکه هر دو خروجی به درستی به تابع کلیک متصل شده‌اند
     )
-# برای اجرای برنامه Gradio
 if __name__ == "__main__":
     demo.launch()

 import tempfile
 import asyncio
 import traceback
 import os
 # --- دیکشنری زبان‌ها و صداها با کلیدهای فارسی (نمونه) ---
+# ... (بدون تغییر) ...
 language_dict_persian_keys = {
     'انگلیسی - جنی (زن)': 'en-US-JennyNeural',
     'انگلیسی - گای (مرد)': 'en-US-GuyNeural',
     'زولو (آفریقای جنوبی) - تمبا (مرد)': 'zu-ZA-ThembaNeural',
 }
+# --- توابع تبدیل متن به گفتار (نسخه Async که مستقیماً در Gradio استفاده می‌شود) ---
 async def text_to_speech_edge_async(text, language_code_persian, rate, volume, pitch):
     """
     تابع ناهمزمان برای تبدیل متن به گفتار با استفاده از Edge TTS.
+    این تابع مستقیماً توسط Gradio فراخوانی می‌شود، نیازی به wrapper همزمان نیست.
     خروجی: (پیام وضعیت, مسیر فایل صوتی یا None)
     """
+    temp_path = None
     try:
         if not text:
             return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
         voice_id = language_dict_persian_keys.get(language_code_persian)
         if voice_id is None:
             return f"خطا: مدل صدای انتخاب شده ('{language_code_persian}') یافت نشد.", None
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
+        # Gradio خودش یک پوشه 'temp' محلی برای فایل‌های موقت دارد.
+        # استفاده از tempfile.gettempdir() برای اطمینان از ایجاد فایل در مکانی قابل دسترسی توسط سیستم.
+        # Gradio فایل‌ها را از این مکان به درستی مدیریت می‌کند.
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav", dir=tempfile.gettempdir()) as tmp_file:
             temp_path = tmp_file.name
         await communicate.save(temp_path)
+        # مهم: Gradio پس از استفاده از فایل (که به output_audio منتقل می‌شود)، آن را خودش پاک می‌کند.
+        # نیازی به os.remove در اینجا نیست مگر اینکه بخواهید فایل را بلافاصله پس از اولین استفاده (و قبل از اینکه Gradio آن را به کلاینت بفرستد) پاک کنید.
+        # اما برای نمایش در Gradio، باید فایل تا زمانی که Gradio آن را Serving کند وجود داشته باشد.
         return "تبدیل با موفقیت انجام شد.", temp_path
     except edge_tts.exceptions.NoAudioReceived:
         error_msg = f"خطا: صدایی برای متن و صدای انتخاب شده دریافت نشد (صدا: {voice_id})."
         if temp_path and os.path.exists(temp_path):
+            os.remove(temp_path) # در صورت خطا، فایل موقت را پاک می‌کنیم
         return error_msg, None
     except ValueError as ve:
         error_msg = f"خطا در پارامترهای ورودی: {ve}"
         return error_msg, None
     except Exception as e:
         error_msg = f"خطای غیرمنتظره در سرور: {type(e).__name__} - {e}"
+        traceback.print_exc() # برای مشاهده traceback در کنسول (در محیط Hugging Face در logs دیده می‌شود)
         if temp_path and os.path.exists(temp_path):
             os.remove(temp_path)
         return error_msg, None
+# --- تعریف تم و CSS (بدون تغییر) ---
 app_theme = gr.themes.Soft(
     primary_hue=gr.themes.colors.blue,
     secondary_hue=gr.themes.colors.sky,
 if default_voice_key_persian not in language_dict_persian_keys:
     default_voice_key_persian = list(language_dict_persian_keys.keys())[0] if language_dict_persian_keys else None
+LOGO_URL = "https://www.gstatic.com/lamda/images/gemini/google_bard_logo_150_v2_dark_color_1x.png" # بدون تغییر
 with gr.Blocks(theme=app_theme, css=custom_css) as demo:
     with gr.Row():
             submit_button = gr.Button("🔊 تولید و پخش صدا", variant="primary")
         with gr.Column(scale=2):
             output_text_status = gr.Textbox(label="📊 وضعیت عملیات", interactive=False, lines=1, placeholder="نتیجه اینجا نمایش داده می‌شود...")
+            # مهم: type="filepath" و interactive=False برای نمایش فایل در Gradio کافیست.
+            # autoplay=True برای شروع خودکار پخش پس از بارگذاری فایل.
+            output_audio = gr.Audio(type="filepath", label="🎧 فایل صوتی خروجی", interactive=False, autoplay=True)
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
             ["This is a test of the speech synthesis system.", 'انگلیسی - جنی (زن)', +5, 0, 0],
             ["تجربه کاربری در این سامانه بسیار روان است.", 'فارسی (ایران) - فرید (مرد)', -5, 0, 0],
         ],
+        # نکته مهم: اگر تابع شما async است، Gradio آن را در یک ترد جداگانه اجرا می‌کند.
+        # نیازی به wrapper همزمان نیست (حذف text_to_speech_edge_sync_wrapper و جایگزینی با text_to_speech_edge_async)
+        fn=text_to_speech_edge_async,
         inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
+        outputs=[output_text_status, output_audio],
+        cache_examples=False, # cache_examples=True ممکن است با این نوع خروجی فایل موقت مشکل ایجاد کند
         label="💡 چند نمونه برای شروع"
     )
     submit_button.click(
+        # نکته مهم: اگر تابع شما async است، Gradio آن را در یک ترد جداگانه اجرا می‌کند.
+        # نیازی به wrapper همزمان نیست (حذف text_to_speech_edge_sync_wrapper و جایگزینی با text_to_speech_edge_async)
+        fn=text_to_speech_edge_async,
         inputs=[input_text, language_dropdown, rate_slider, volume_slider, pitch_slider],
+        outputs=[output_text_status, output_audio],
     )
 if __name__ == "__main__":
     demo.launch()