Persian-tts-fa

Runtime error

App Files Files Community

Hamed744 commited on May 11

Commit

6371ad1

verified ·

1 Parent(s): da89421

Update app.py

Browse files

Files changed (1) hide show

app.py +66 -113

app.py CHANGED Viewed

@@ -6,62 +6,54 @@ import traceback
 import threading
 import os
-# --- دیکشنری زبان‌ها و صداها با اضافه کردن نام فارسی (نمونه) ---
-# شما باید این لیست را برای همه زبان ها کامل کنید
-# ساختار جدید کلید: 'نام نمایشی فارسی (نام انگلیسی - جنسیت)'
-# یا: 'نام نمایشی فارسی (نام انگلیسی)' اگر جنسیت مشخص نیست یا برای همه است
-original_language_dict = {
-    'English-Jenny (Female)': ('en-US-JennyNeural', 'زن'),
-    'English-Guy (Male)': ('en-US-GuyNeural', 'مرد'),
-    'English-Ana (Female)': ('en-US-AnaNeural', 'زن'),
-    'English-Aria (Female)': ('en-US-AriaNeural', 'زن'),
-    'English-Christopher (Male)': ('en-US-ChristopherNeural', 'مرد'),
-    'English-Eric (Male)': ('en-US-EricNeural', 'مرد'),
-    'English-Michelle (Female)': ('en-US-MichelleNeural', 'زن'),
-    'English-Roger (Male)': ('en-US-RogerNeural', 'مرد'),
-    'Spanish (Mexican)-Dalia (Female)': ('es-MX-DaliaNeural', 'زن'),
-    'Spanish (Mexican)-Jorge- (Male)': ('es-MX-JorgeNeural', 'مرد'),
-    'Korean-Sun-Hi- (Female)': ('ko-KR-SunHiNeural', 'زن'),
-    'Korean-InJoon- (Male)': ('ko-KR-InJoonNeural', 'مرد'),
-    'Persian (Iran)-Dilara- (Female)': ('fa-IR-DilaraNeural', 'زن'), # فارسی اضافه شده
-    'Persian (Iran)-Farid- (Male)': ('fa-IR-FaridNeural', 'مرد'),   # فارسی اضافه شده
-    # ... بقیه زبان‌ها را به همین ترتیب با (voice_id, gender_tag) تکمیل کنید ...
-    # مثال برای زبانی که فقط یک مدل دارد یا جنسیت نامشخص است
-    # 'Some Language-Model': ('xx-XX-ModelNeural', 'همه'),
 }
-# ساخت دیکشنری جدید برای نمایش و استفاده در برنامه
-# کلیدها نام های نمایشی جدید خواهند بود
-language_display_dict = {}
-for display_key_english, (voice_id, gender_tag) in original_language_dict.items():
-    # استخراج زبان و نام از کلید انگلیسی
-    lang_name_part = display_key_english.split('-')[0]
-    model_name_part = display_key_english.split('-', 1)[1] if '-' in display_key_english else display_key_english
-    persian_lang_name = lang_name_part # به طور پیش فرض، اگر ترجمه نداشتیم
-    if "English" in lang_name_part:
-        persian_lang_name = "انگلیسی"
-    elif "Spanish (Mexican)" in lang_name_part:
-        persian_lang_name = "اسپانیایی (مکزیک)"
-    elif "Korean" in lang_name_part:
-        persian_lang_name = "کره‌ای"
-    elif "Persian (Iran)" in lang_name_part:
-        persian_lang_name = "فارسی (ایران)"
-    # ... اضافه کردن ترجمه برای سایر زبان ها ...
-    new_display_key = f"{persian_lang_name} - {model_name_part}"
-    language_display_dict[new_display_key] = {'id': voice_id, 'gender': gender_tag.lower()}
-# --- توابع تبدیل متن به گفتار و wrapper (همانند قبل، اما از language_display_dict استفاده می کند) ---
-async def text_to_speech_edge_async(text, language_display_key, rate, volume, pitch): # ورودی به language_display_key تغییر کرد
     try:
         if not text: return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
-        voice_info = language_display_dict.get(language_display_key)
-        if not voice_info: return f"خطا: مدل صدای انتخاب شده ('{language_display_key}') یافت نشد.", None
-        voice_id = voice_info['id']
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
         with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file: tmp_path = tmp_file.name
@@ -83,20 +75,20 @@ def _get_or_create_event_loop():
         _event_loops_by_thread[thread_id] = asyncio.new_event_loop()
     return _event_loops_by_thread[thread_id]
-def text_to_speech_edge_sync_wrapper(text, language_display_key, rate, volume, pitch):
     try:
         loop = _get_or_create_event_loop(); asyncio.set_event_loop(loop)
-        result = loop.run_until_complete(text_to_speech_edge_async(text, language_display_key, rate, volume, pitch))
     except RuntimeError as e:
         if "no current event loop" in str(e).lower() or "cannot be called from a running event loop" in str(e).lower():
             new_loop = asyncio.new_event_loop(); asyncio.set_event_loop(new_loop)
-            try: result = new_loop.run_until_complete(text_to_speech_edge_async(text, language_display_key, rate, volume, pitch))
             finally: new_loop.close()
         else: return f"خطای اجرایی: {e}", None
     except Exception as e: return f"خطای غیرمنتظره: {type(e).__name__}", None
     return result
-# --- تعریف تم و CSS (همانند قبل، با تغییرات جزئی در صورت نیاز) ---
 app_theme = gr.themes.Soft(
     primary_hue=gr.themes.colors.blue,
     secondary_hue=gr.themes.colors.sky,
@@ -138,13 +130,10 @@ body { font-family: 'Vazirmatn', 'Arial', sans-serif; direction: rtl; }
     background: #2980b9 !important; transform: translateY(-2px) !important;
     box-shadow: 0 5px 10px rgba(52, 152, 219, 0.35) !important;
 }
-.gr-input, .gr-dropdown, .gr-textbox, .gr-slider, .gr-radio label span { /* استایل برای رادیو هم اضافه شد */
     border-radius: 8px !important; border: 1px solid #ced4da !important;
     font-size: 0.95em !important;
 }
-.gr-radio label input { margin-left: 5px; margin-right: 2px; } /* تنظیم فاصله دکمه های رادیو */
-.gr-radio { padding: 5px; border:none !important; } /* حذف حاشیه اضافی از رادیو */
 .gr-input:focus, .gr-dropdown:focus, .gr-textbox:focus {
     box-shadow: 0 0 0 3px rgba(52, 152, 219, 0.15) !important;
     border-color: #5dade2 !important;
@@ -153,7 +142,7 @@ body { font-family: 'Vazirmatn', 'Arial', sans-serif; direction: rtl; }
     border-radius: 10px !important; border: 1px solid #e9ecef !important;
     background-color: #f8f9fa !important; padding: 0.75rem !important;
 }
-label > span { /* شامل برچسب های رادیو هم می شود */
   font-weight: 500 !important; color: #495057 !important; font-size: 0.9em !important;
   margin-bottom: 3px !important; display: block;
 }
@@ -182,38 +171,17 @@ button[title="Flag"], button[aria-label="Flag"] {display: none !important; }
     .main-content-row > .gr-column:nth-child(1) { flex-basis: 60%; }
     .main-content-row > .gr-column:nth-child(2) { flex-basis: 40%; }
     .gr-button.lg.primary { width: auto !important; }
-    .gr-radio { display: flex; justify-content: center; gap: 15px; margin-bottom: 10px;} /* چیدمان بهتر رادیو در دسکتاپ */
-    .gr-radio label { margin-bottom: 0 !important; } /* جلوگیری از پرش برچسب رادیو */
 }
 """
-# --- تابع برای آپدیت لیست زبان ها بر اساس جنسیت ---
-def update_language_dropdown(gender_filter):
-    filtered_choices = []
-    first_choice = None
-    if gender_filter == "همه":
-        filtered_choices = list(language_display_dict.keys())
-    else: # "مرد" یا "زن"
-        for display_key, voice_info in language_display_dict.items():
-            if voice_info['gender'] == gender_filter:
-                filtered_choices.append(display_key)
-    if filtered_choices:
-        first_choice = filtered_choices[0]
-    # برگرداندن آپدیت برای Dropdown
-    return gr.Dropdown(choices=filtered_choices, value=first_choice, label="🗣️ زبان و مدل صدا (فیلتر شده)")
-default_voice_key_display = "فارسی (ایران) - Farid- (Male)" # نام نمایشی جدید برای صدای پیش فرض
-if default_voice_key_display not in language_display_dict:
-    # اگر صدای پیش فرض فارسی در لیست نبود (مثلا به خاطر فیلتر اولیه)، اولین مورد موجود را انتخاب کن
-    if list(language_display_dict.keys()):
-        default_voice_key_display = list(language_display_dict.keys())[0]
-    else:
-        default_voice_key_display = None # اگر لیست کلا خالی است
-LOGO_URL = "https://raw.githubusercontent.com/gradio-app/gradio/main/guides/assets/gradio-logo.svg"
 with gr.Blocks(theme=app_theme, css=custom_css) as demo:
     with gr.Row():
@@ -225,14 +193,6 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
         </div>
         """)
-    # --- دکمه های رادیویی برای انتخاب جنسیت ---
-    gender_radio = gr.Radio(
-        choices=["همه", "مرد", "زن"],
-        value="همه",
-        label="انتخاب جنسیت صدا",
-        elem_classes="gr-radio" # برای استایل دهی بهتر
-    )
     with gr.Row(elem_classes="main-content-row"):
         with gr.Column(scale=3):
             input_text = gr.Textbox(
@@ -241,10 +201,9 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
                 placeholder="متن برای تبدیل...",
                 value=""
             )
-            # --- Dropdown زبان با قابلیت آپدیت ---
-            language_dropdown = gr.Dropdown(
-                choices=list(language_display_dict.keys()), # لیست اولیه
-                value=default_voice_key_display,
                 label="🗣️ زبان و مدل صدا"
             )
             with gr.Accordion("⚙️ تنظیمات بیشتر (اختیاری)", open=False):
@@ -261,29 +220,23 @@ with gr.Blocks(theme=app_theme, css=custom_css) as demo:
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
     gr.Examples(
         examples=[
-            ["سلام بر شما، این یک آزمایش تبدیل متن به گفتار با صدای فارسی است.", "فارسی (ایران) - Dilara- (Female)", 0, 0, 0],
-            ["Gradio is a fantastic library for building ML demos quickly and easily.", "انگلیسی - Jenny (Female)", +10, -5, 0],
-            ["株式会社グラディオへようこそ。", "ژاپنی - Keita- (Male)", -5, 0, +5],
         ],
-        inputs=[input_text, language_dropdown, rate, volume, pitch], # ورودی language_dropdown است
         outputs=[output_text_status, output_audio],
         fn=text_to_speech_edge_sync_wrapper,
         cache_examples=False,
         label="💡 نمونه‌های آماده برای تست"
     )
-    # --- اتصال دکمه رادیو به تابع آپدیت Dropdown ---
-    gender_radio.change(
-        fn=update_language_dropdown,
-        inputs=gender_radio,
-        outputs=language_dropdown
-    )
     submit_button.click(
         fn=text_to_speech_edge_sync_wrapper,
-        inputs=[input_text, language_dropdown, rate, volume, pitch], # ورودی language_dropdown است
         outputs=[output_text_status, output_audio],
     )

 import threading
 import os
+# --- دیکشنری زبان‌ها و صداها با کلیدهای فارسی ---
+language_dict = {
+    'انگلیسی - جنی (زن)': 'en-US-JennyNeural',
+    'انگلیسی - گای (مرد)': 'en-US-GuyNeural',
+    'انگلیسی - آنا (زن)': 'en-US-AnaNeural',
+    'انگلیسی - آریا (زن)': 'en-US-AriaNeural',
+    'انگلیسی - کریستوفر (مرد)': 'en-US-ChristopherNeural',
+    'انگلیسی - اریک (مرد)': 'en-US-EricNeural',
+    'انگلیسی - میشل (زن)': 'en-US-MichelleNeural',
+    'انگلیسی - راجر (مرد)': 'en-US-RogerNeural',
+    'فارسی (ایران) - دلارا (زن)': 'fa-IR-DilaraNeural',
+    'فارسی (ایران) - فرید (مرد)': 'fa-IR-FaridNeural',
+    'اسپانیایی (مکزیک) - دالیا (زن)': 'es-MX-DaliaNeural',
+    'اسپانیایی (مکزیک) - خورخه (مرد)': 'es-MX-JorgeNeural', # "Jorge-" به "خورخه"
+    'کره‌ای - سان-هی (زن)': 'ko-KR-SunHiNeural', # "Sun-Hi-" به "سان-هی"
+    'کره‌ای - اینجون (مرد)': 'ko-KR-InJoonNeural', # "InJoon-" به "اینجون"
+    'ژاپنی - نانامی (زن)': 'ja-JP-NanamiNeural', # "Nanami-" به "نانامی"
+    'ژاپنی - کیتا (مرد)': 'ja-JP-KeitaNeural',   # "Keita-" به "کیتا"
+    'فرانسوی - دنیز (زن)': 'fr-FR-DeniseNeural', # "Denise-" به "دنیز"
+    'فرانسوی - الوئیز (زن)': 'fr-FR-EloiseNeural',# "Eloise-" به "الوئیز"
+    'فرانسوی - هانری (مرد)': 'fr-FR-HenriNeural', # "Henri-" به "هانری"
+    'آلمانی - کاتیا (زن)': 'de-DE-KatjaNeural', # "Katja-" به "کاتیا"
+    'آلمانی - آملا (زن)': 'de-DE-AmalaNeural', # "Amala-" به "آملا"
+    'آلمانی - کنراد (مرد)': 'de-DE-ConradNeural', # "Conrad-" به "کنراد"
+    'آلمانی - کیلیان (مرد)': 'de-DE-KillianNeural', # "Killian-" به "کیلیان"
+    # ... شما باید بقیه زبان‌ها را به همین ترتیب فارسی‌سازی کنید ...
+    # مثال های بیشتر:
+    'عربی (عربستان) - حامد (مرد)': 'ar-SA-HamedNeural',
+    'عربی (عربستان) - زاریا (زن)': 'ar-SA-ZariyahNeural',
+    'چینی (ماندارین ساده) - شیائوشیاو (زن)': 'zh-CN-XiaoxiaoNeural',
+    'چینی (ماندارین ساده) - یون‌یانگ (مرد)': 'zh-CN-YunyangNeural',
 }
+# --- توابع تبدیل متن به گفتار و wrapper (بدون تغییر باقی می‌مانند) ---
+async def text_to_speech_edge_async(text, language_code, rate, volume, pitch):
     try:
         if not text: return "خطا: لطفاً متنی را برای تبدیل وارد کنید.", None
+        # language_code در اینجا کلید فارسی از dropdown است
+        voice_id = language_dict.get(language_code) # مقدار voice_id همان کد انگلیسی مثل 'en-US-JennyNeural' خواهد بود
+        if voice_id is None: return f"خطا: مدل صدای انتخاب شده ('{language_code}') یافت نشد.", None
         rate_str, volume_str, pitch_str = f"{int(rate):+g}%", f"{int(volume):+g}%", f"{int(pitch):+g}Hz"
         communicate = edge_tts.Communicate(text, voice_id, rate=rate_str, volume=volume_str, pitch=pitch_str)
         with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file: tmp_path = tmp_file.name
         _event_loops_by_thread[thread_id] = asyncio.new_event_loop()
     return _event_loops_by_thread[thread_id]
+def text_to_speech_edge_sync_wrapper(text, language_code, rate, volume, pitch):
     try:
         loop = _get_or_create_event_loop(); asyncio.set_event_loop(loop)
+        result = loop.run_until_complete(text_to_speech_edge_async(text, language_code, rate, volume, pitch))
     except RuntimeError as e:
         if "no current event loop" in str(e).lower() or "cannot be called from a running event loop" in str(e).lower():
             new_loop = asyncio.new_event_loop(); asyncio.set_event_loop(new_loop)
+            try: result = new_loop.run_until_complete(text_to_speech_edge_async(text, language_code, rate, volume, pitch))
             finally: new_loop.close()
         else: return f"خطای اجرایی: {e}", None
     except Exception as e: return f"خطای غیرمنتظره: {type(e).__name__}", None
     return result
+# --- تعریف تم و CSS (بدون تغییر باقی می‌مانند) ---
 app_theme = gr.themes.Soft(
     primary_hue=gr.themes.colors.blue,
     secondary_hue=gr.themes.colors.sky,
     background: #2980b9 !important; transform: translateY(-2px) !important;
     box-shadow: 0 5px 10px rgba(52, 152, 219, 0.35) !important;
 }
+.gr-input, .gr-dropdown, .gr-textbox, .gr-slider {
     border-radius: 8px !important; border: 1px solid #ced4da !important;
     font-size: 0.95em !important;
 }
 .gr-input:focus, .gr-dropdown:focus, .gr-textbox:focus {
     box-shadow: 0 0 0 3px rgba(52, 152, 219, 0.15) !important;
     border-color: #5dade2 !important;
     border-radius: 10px !important; border: 1px solid #e9ecef !important;
     background-color: #f8f9fa !important; padding: 0.75rem !important;
 }
+label > span {
   font-weight: 500 !important; color: #495057 !important; font-size: 0.9em !important;
   margin-bottom: 3px !important; display: block;
 }
     .main-content-row > .gr-column:nth-child(1) { flex-basis: 60%; }
     .main-content-row > .gr-column:nth-child(2) { flex-basis: 40%; }
     .gr-button.lg.primary { width: auto !important; }
 }
 """
+# --- تعریف رابط کاربری با Blocks ---
+# مقدار پیش فرض برای زبان، حالا باید کلید فارسی باشد
+default_voice_key_fa = 'فارسی (ایران) - فرید (مرد)'
+if default_voice_key_fa not in language_dict:
+    # اگر به هر دلیلی کلید فارسی بالا در لیست نبود، اولین مورد لیست را انتخاب کن
+    default_voice_key_fa = list(language_dict.keys())[0] if language_dict else None
+LOGO_URL = "https://raw.githubusercontent.com/gradio-app/gradio/main/guides/assets/gradio-logo.svg" # یا URL لوگوی خودتان
 with gr.Blocks(theme=app_theme, css=custom_css) as demo:
     with gr.Row():
         </div>
         """)
     with gr.Row(elem_classes="main-content-row"):
         with gr.Column(scale=3):
             input_text = gr.Textbox(
                 placeholder="متن برای تبدیل...",
                 value=""
             )
+            language = gr.Dropdown(
+                choices=list(language_dict.keys()), # کلیدهای فارسی برای نمایش به کاربر
+                value=default_voice_key_fa,       # استفاده از کلید فارسی برای مقدار پیش فرض
                 label="🗣️ زبان و مدل صدا"
             )
             with gr.Accordion("⚙️ تنظیمات بیشتر (اختیاری)", open=False):
     gr.HTML("<hr style='margin-top: 1rem; margin-bottom: 1rem; border: 0; border-top: 1px solid #dee2e6;'>")
+    # مثال ها هم باید از کلیدهای فارسی استفاده کنند
     gr.Examples(
         examples=[
+            ["سلام بر شما، این یک آزمایش تبدیل متن به گفتار با صدای فارسی است.", 'فارسی (ایران) - دلارا (زن)', 0, 0, 0],
+            ["Gradio is a fantastic library for building ML demos quickly and easily.", 'انگلیسی - جنی (زن)', +10, -5, 0],
+            ["株式会社グラディオへようこそ。", 'ژاپنی - کیتا (مرد)', -5, 0, +5],
         ],
+        inputs=[input_text, language, rate, volume, pitch],
         outputs=[output_text_status, output_audio],
         fn=text_to_speech_edge_sync_wrapper,
         cache_examples=False,
         label="💡 نمونه‌های آماده برای تست"
     )
     submit_button.click(
         fn=text_to_speech_edge_sync_wrapper,
+        inputs=[input_text, language, rate, volume, pitch],
         outputs=[output_text_status, output_audio],
     )