Spaces:

Den4ikAI
/

ESpeech-TTS

Running on Zero

App Files Files Community

Den4ikAI commited on 10 days ago

Commit

af5fbc8

verified ·

1 Parent(s): 80d1f1b

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -16

app.py CHANGED Viewed

@@ -163,6 +163,17 @@ def process_text_with_accent(text, accentizer):
         # Прогоняем через RUAccent
         return accentizer.process_all(text)
 # ----------------- Основная функция синтеза (GPU-aware) -----------------
 # Декорируем synthesize, чтобы при вызове Space выделял GPU (если доступно).
 # duration — сколько секунд просим GPU (адаптируйте под ваш инференс).
@@ -320,9 +331,9 @@ def synthesize(
 # ----------------- Gradio UI (как у вас) -----------------
 with gr.Blocks(title="ESpeech-TTS") as app:
     gr.Markdown("# ESpeech-TTS")
-    gr.Markdown("See more on https://huggingface.co/ESpeech")
-    gr.Markdown("💡 **Tip:** Add '+' symbol in text to mark custom stress (e.g., 'прив+ет'). Text with '+' won't be processed by RUAccent.")
     # Описание моделей на русском языке
     gr.Markdown("""
     ## 📋 Описание моделей:
@@ -349,11 +360,6 @@ with gr.Blocks(title="ESpeech-TTS") as app:
                 lines=2,
                 placeholder="leave empty → ASR will transcribe"
             )
-            ref_text_output = gr.Textbox(
-                label="Processed Reference Text (with accents)",
-                lines=2,
-                interactive=False
-            )
         with gr.Column():
             gen_text_input = gr.Textbox(
                 label="Text to Generate",
@@ -361,12 +367,9 @@ with gr.Blocks(title="ESpeech-TTS") as app:
                 max_lines=20,
                 placeholder="Enter text to synthesize..."
             )
-            gen_text_output = gr.Textbox(
-                label="Processed Text to Generate (with accents)",
-                lines=5,
-                max_lines=20,
-                interactive=False
-            )
     with gr.Row():
         with gr.Column():
@@ -408,12 +411,20 @@ with gr.Blocks(title="ESpeech-TTS") as app:
             nfe_slider,
             speed_slider,
         ],
-        outputs=[audio_output, spectrogram_output, ref_text_output, gen_text_output],
         fn=lambda *args: synthesize(model_choice.value, *args),
         cache_examples=True,
         run_on_click=True,
     )
     generate_btn.click(
         synthesize,
         inputs=[
@@ -427,7 +438,7 @@ with gr.Blocks(title="ESpeech-TTS") as app:
             nfe_slider,
             speed_slider,
         ],
-        outputs=[audio_output, spectrogram_output, ref_text_output, gen_text_output]
     )
 if __name__ == "__main__":

         # Прогоняем через RUAccent
         return accentizer.process_all(text)
+# ----------------- Функция для обработки текста без синтеза -----------------
+def process_texts_only(ref_text, gen_text):
+    """
+    Обрабатывает только тексты через RUAccent, не делая синтез.
+    Возвращает обработанные тексты для обновления полей ввода.
+    """
+    processed_ref_text = process_text_with_accent(ref_text, accentizer)
+    processed_gen_text = process_text_with_accent(gen_text, accentizer)
+    return processed_ref_text, processed_gen_text
 # ----------------- Основная функция синтеза (GPU-aware) -----------------
 # Декорируем synthesize, чтобы при вызове Space выделял GPU (если доступно).
 # duration — сколько секунд просим GPU (адаптируйте под ваш инференс).
 # ----------------- Gradio UI (как у вас) -----------------
 with gr.Blocks(title="ESpeech-TTS") as app:
     gr.Markdown("# ESpeech-TTS")
+    gr.Markdown("Подробнее см. на https://huggingface.co/ESpeech")
+    gr.Markdown("💡 **Совет:** Добавьте символ '+' в тексте, чтобы указать пользовательское ударение (например, 'прив+ет'). Текст с '+' не будет обрабатываться RUAccent.")
     # Описание моделей на русском языке
     gr.Markdown("""
     ## 📋 Описание моделей:
                 lines=2,
                 placeholder="leave empty → ASR will transcribe"
             )
         with gr.Column():
             gen_text_input = gr.Textbox(
                 label="Text to Generate",
                 max_lines=20,
                 placeholder="Enter text to synthesize..."
             )
+    # Кнопка для обработки текста без синтеза
+    process_text_btn = gr.Button("✏️ Process Text (Add Accents)", variant="secondary")
     with gr.Row():
         with gr.Column():
             nfe_slider,
             speed_slider,
         ],
+        outputs=[audio_output, spectrogram_output, ref_text_input, gen_text_input],
         fn=lambda *args: synthesize(model_choice.value, *args),
         cache_examples=True,
         run_on_click=True,
     )
+    # Обработка текста без синтеза
+    process_text_btn.click(
+        process_texts_only,
+        inputs=[ref_text_input, gen_text_input],
+        outputs=[ref_text_input, gen_text_input]
+    )
+    # Основная генерация
     generate_btn.click(
         synthesize,
         inputs=[
             nfe_slider,
             speed_slider,
         ],
+        outputs=[audio_output, spectrogram_output, ref_text_input, gen_text_input]
     )
 if __name__ == "__main__":