Spaces:

Dmtlant
/

Image

Running

App Files Files Community

Dmtlant commited on Nov 15, 2024

Commit

cb152c0

verified ·

1 Parent(s): 23856b9

Update app.py

Browse files

Files changed (1) hide show

app.py +65 -41

app.py CHANGED Viewed

@@ -1,21 +1,14 @@
-import os
 import streamlit as st
 import speech_recognition as sr
-# Функция для записи звука с микрофона с использованием `arecord` (Linux)
-def record_audio_linux(filename, duration=5):
-    command = f"arecord -d {duration} -f cd {filename}"
-    os.system(command)  # Выполняем системную команду для записи
-# Функция для распознавания речи
-def recognize_speech_from_file(filename, language="en-US"):
     recognizer = sr.Recognizer()
-    # Открываем записанный файл
-    with sr.AudioFile(filename) as source:
-        audio = recognizer.record(source)  # Читаем аудио из файла
         try:
             # Распознаём речь
             text = recognizer.recognize_google(audio, language=language)
@@ -25,36 +18,67 @@ def recognize_speech_from_file(filename, language="en-US"):
         except sr.RequestError as e:
             return f"❌ Ошибка сервиса распознавания речи: {e}"
 # Интерфейс Streamlit
-st.title("🎙️ Диктофон и распознавание речи (без PyAudio)")
-st.write("Это приложение записывает вашу речь с помощью системных средств и распознаёт её (на русском или английском языке).")
-# Выбор языка
 language = st.radio("Выберите язык для распознавания:", ("Русский", "Английский"))
 language_code = "ru-RU" if language == "Русский" else "en-US"
-# Длительность записи
-duration = st.slider("Длительность записи (секунды):", 1, 10, 5)
-# Имя временного файла
-filename = "recorded_audio.wav"
-# Кнопка для начала записи
-if st.button("Начать запись"):
-    # Проверяем, поддерживается ли команда `arecord`
-    if os.system("which arecord") != 0:
-        st.error("Для записи звука требуется утилита 'arecord'. Установите её с помощью команды: sudo apt install alsa-utils")
-    else:
-        st.write("🎙️ Идёт запись...")
-        record_audio_linux(filename, duration)
-        st.write("✅ Запись завершена!")
-        # Распознаём речь
-        st.write("🔍 Распознаём текст...")
-        recognized_text = recognize_speech_from_file(filename, language=language_code)
-        st.write("### Распознанный текст:")
-        st.write(recognized_text)
-        # Показываем аудиоплеер
-        st.audio(filename, format="audio/wav")

 import streamlit as st
 import speech_recognition as sr
+import os
+# Функция для распознавания речи из загруженного файла
+def recognize_speech_from_file(file, language="en-US"):
     recognizer = sr.Recognizer()
+    # Читаем аудио-файл
+    with sr.AudioFile(file) as source:
+        audio = recognizer.record(source)  # Загружаем запись
         try:
             # Распознаём речь
             text = recognizer.recognize_google(audio, language=language)
         except sr.RequestError as e:
             return f"❌ Ошибка сервиса распознавания речи: {e}"
 # Интерфейс Streamlit
+st.title("🎙️ Веб-диктофон и распознавание речи")
+st.write("Запишите звук прямо в браузере, загрузите его и распознайте текст.")
+# Выбор языка для распознавания
 language = st.radio("Выберите язык для распознавания:", ("Русский", "Английский"))
 language_code = "ru-RU" if language == "Русский" else "en-US"
+# HTML и JavaScript для записи звука
+st.markdown("""
+    <h3>🎤 Запись звука через браузер</h3>
+    <p>Нажмите "Start Recording", чтобы начать запись, и "Stop Recording", чтобы завершить.</p>
+    <button id="start" onclick="startRecording()">Start Recording</button>
+    <button id="stop" onclick="stopRecording()" disabled>Stop Recording</button>
+    <p><strong>Внимание:</strong> После завершения записи появится кнопка для сохранения аудио.</p>
+    <script>
+        let mediaRecorder;
+        let audioChunks = [];
+        // Начало записи
+        function startRecording() {
+            audioChunks = [];
+            navigator.mediaDevices.getUserMedia({ audio: true })
+                .then(stream => {
+                    mediaRecorder = new MediaRecorder(stream);
+                    mediaRecorder.start();
+                    mediaRecorder.addEventListener("dataavailable", event => {
+                        audioChunks.push(event.data);
+                    });
+                    mediaRecorder.addEventListener("stop", () => {
+                        const audioBlob = new Blob(audioChunks, { type: 'audio/wav' });
+                        const audioUrl = URL.createObjectURL(audioBlob);
+                        const downloadLink = document.createElement("a");
+                        downloadLink.href = audioUrl;
+                        downloadLink.download = "recorded_audio.wav";
+                        downloadLink.innerHTML = "💾 Сохранить аудио";
+                        document.body.appendChild(downloadLink);
+                    });
+                    document.getElementById("start").disabled = true;
+                    document.getElementById("stop").disabled = false;
+                });
+        }
+        // Остановка записи
+        function stopRecording() {
+            mediaRecorder.stop();
+            document.getElementById("start").disabled = false;
+            document.getElementById("stop").disabled = true;
+        }
+    </script>
+""", unsafe_allow_html=True)
+# Загрузка записанного файла
+uploaded_file = st.file_uploader("Загрузите записанный аудиофайл для распознавания:", type=["wav"])
+if uploaded_file is not None:
+    st.audio(uploaded_file, format="audio/wav")  # Воспроизведение загруженного файла
+    st.write("🔍 Распознаём текст из аудиофайла...")
+    recognized_text = recognize_speech_from_file(uploaded_file, language=language_code)
+    st.write("### Распознанный текст:")
+    st.write(recognized_text)