Spaces:
Sleeping
Sleeping
[refactor] app.pyの関数とパラメータ名のリファクタリング
Browse filesプロジェクトの主要なコードファイルであるapp.pyにおける関数定義とパラメータのリファクタリングを行いました。具体的な変更内容は以下の通りです:
### 音声処理関数の変更
- `transcribe` 関数のパラメータ名を `audio_file` から `audio` に簡略化しました。これにより、パラメータの意図がより明確になります。
- 関数内でのローカル変数名を `audio` から `audio_data` に変更し、その用途を明確にしました。
- 音声のリサンプリング処理における変数名を変更し、処理の意図をより直感的に理解しやすくしました。
### Gradioインターフェースの入力設定の更新
- Gradioインターフェースの `inputs` パラメータでファイルタイプを `"filepath"` から `"file"` に変更しました。これにより、入力として受け付けるファイルタイプがより適切に定義され、ユーザーインターフェースの利便性が向上します。
これらの変更により、アプリケーションのコードが簡潔かつ効率的になり、エンドユーザーにとっての使いやすさが向上しました。
app.py
CHANGED
@@ -21,14 +21,13 @@ pipe = pipeline(
|
|
21 |
)
|
22 |
|
23 |
@spaces.GPU(duration=120)
|
24 |
-
|
25 |
-
def transcribe(audio_file):
|
26 |
# 音声の読み込み
|
27 |
-
|
28 |
|
29 |
# 音声をリサンプリング
|
30 |
target_sr = 16000
|
31 |
-
audio_resampled = librosa.resample(
|
32 |
|
33 |
# 推論の実行
|
34 |
result = pipe(audio_resampled, generate_kwargs=generate_kwargs)
|
@@ -52,7 +51,7 @@ theme = gr.themes.Soft(
|
|
52 |
iface = gr.Interface(
|
53 |
fn=transcribe,
|
54 |
# fn=None,
|
55 |
-
inputs=gr.Audio(type="
|
56 |
outputs="text",
|
57 |
title="KotobaTranscriber",
|
58 |
description=description,
|
|
|
21 |
)
|
22 |
|
23 |
@spaces.GPU(duration=120)
|
24 |
+
def transcribe(audio):
|
|
|
25 |
# 音声の読み込み
|
26 |
+
audio_data, sr = librosa.load(audio, sr=None)
|
27 |
|
28 |
# 音声をリサンプリング
|
29 |
target_sr = 16000
|
30 |
+
audio_resampled = librosa.resample(audio_data, orig_sr=sr, target_sr=target_sr)
|
31 |
|
32 |
# 推論の実行
|
33 |
result = pipe(audio_resampled, generate_kwargs=generate_kwargs)
|
|
|
51 |
iface = gr.Interface(
|
52 |
fn=transcribe,
|
53 |
# fn=None,
|
54 |
+
inputs=gr.Audio(type="file", label="Upload Audio (MP3 or MP4)"),
|
55 |
outputs="text",
|
56 |
title="KotobaTranscriber",
|
57 |
description=description,
|