Spaces:
Running
on
Zero
Running
on
Zero
[refactor] GitHub Actions設定とapp.pyファイルの更新
Browse filesプロジェクトの自動デプロイ設定とアプリケーションのUIを更新しました。具体的な変更内容は以下の通りです:
### .github/workflows/run.yamlの更新
- GitHub Actionsのスクリプト内のデプロイメントコマンドを更新しました。Hugging Face Spacesのリポジトリを `HarmonAI_II` から `KotobaTranscriber` へ変更しました。これにより、最新のリポジトリ設定に基づいた自動デプロイが可能となります。
### app.pyの大幅な更新
- **画像配置の変更**: アプリケーションの説明部分で使用される画像のHTMLタグを更新し、画像を中央に配置し、サイズを70%に調整しました。
- **テーマのカスタマイズ**: Gradioのテーマをカスタマイズし、プライマリカラーをグレーに設定しました。カラーコードも新しいスキームに基づいて更新されています。
- **インターフェースの定義更新**: `Interface` の定義を更新し、タイトルを `Speech-to-Text App` から `KotobaTranscriber` に変更しました。これにより、アプリケーションのブランディングが強化されます。
これらの変更により、プロジェクトのデプロイメントプロセスとユーザーインターフェースが最新のプロジェクト要件に適合し、より効率的かつ魅力的なものとなりました。
- .SourceSageignore +2 -1
- .github/workflows/run.yaml +1 -1
- README.md +28 -36
- app.py +13 -3
.SourceSageignore
CHANGED
|
@@ -22,4 +22,5 @@ modules\__pycache__
|
|
| 22 |
sourcesage.egg-info
|
| 23 |
.pytest_cache
|
| 24 |
dist
|
| 25 |
-
build
|
|
|
|
|
|
| 22 |
sourcesage.egg-info
|
| 23 |
.pytest_cache
|
| 24 |
dist
|
| 25 |
+
build
|
| 26 |
+
.cache
|
.github/workflows/run.yaml
CHANGED
|
@@ -16,4 +16,4 @@ jobs:
|
|
| 16 |
- name: Push to hub
|
| 17 |
env:
|
| 18 |
HF_TOKEN: ${{ secrets.HF_TOKEN }}
|
| 19 |
-
run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/
|
|
|
|
| 16 |
- name: Push to hub
|
| 17 |
env:
|
| 18 |
HF_TOKEN: ${{ secrets.HF_TOKEN }}
|
| 19 |
+
run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main
|
README.md
CHANGED
|
@@ -32,76 +32,68 @@ pinned: false
|
|
| 32 |
>[!IMPORTANT]
|
| 33 |
>このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
|
| 34 |
|
|
|
|
| 35 |
|
| 36 |
-
|
| 37 |
|
| 38 |
-
|
| 39 |
|
| 40 |
-
## 🎥
|
| 41 |
|
| 42 |
-
|
| 43 |
|
| 44 |
[](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
|
| 45 |
|
| 46 |
-
## 🚀
|
| 47 |
|
| 48 |
-
###
|
| 49 |
|
| 50 |
-
|
| 51 |
|
| 52 |
1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
|
| 53 |
2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
|
| 54 |
|
| 55 |
-
###
|
| 56 |
|
| 57 |
-
|
| 58 |
|
| 59 |
-
|
| 60 |
-
|
| 61 |
-
|
| 62 |
-
|
| 63 |
-
|
| 64 |
-
|
| 65 |
-
git lfs track "*.mp4"
|
| 66 |
-
```
|
| 67 |
|
| 68 |
-
リポジトリ名を適切に変更してください:
|
| 69 |
|
| 70 |
```bash
|
| 71 |
-
|
| 72 |
```
|
| 73 |
|
| 74 |
-
|
| 75 |
-
|
| 76 |
-
HarmonAI IIは、ユーザーのニーズに合わせてカスタマイズ可能です。設定ファイルを編集することで、プロジェクトの動作を柔軟に調整できます。
|
| 77 |
-
|
| 78 |
-
## 📝 Updates
|
| 79 |
|
| 80 |
- v1.1.0 (2024-04-24):
|
| 81 |
- フロントページの作成
|
| 82 |
- READMEの全体的な改善
|
| 83 |
- GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
|
| 84 |
-
- .gitignoreと.
|
| 85 |
- プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
|
| 86 |
- v1.0.0 (2024-04-20):
|
| 87 |
- 初回リリース
|
| 88 |
-
-
|
| 89 |
-
|
| 90 |
|
| 91 |
-
## 🤝
|
| 92 |
|
| 93 |
-
|
| 94 |
|
| 95 |
-
## 📄
|
| 96 |
|
| 97 |
-
|
| 98 |
|
| 99 |
-
## 🙏
|
| 100 |
|
| 101 |
-
|
| 102 |
|
| 103 |
- [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
|
| 104 |
-
- [
|
| 105 |
-
- [claude.ai](https://claude.ai/)チーム
|
| 106 |
|
| 107 |
-
引き続き、
|
|
|
|
| 32 |
>[!IMPORTANT]
|
| 33 |
>このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
|
| 34 |
|
| 35 |
+
## 🌟 イントロダクション
|
| 36 |
|
| 37 |
+
KotobaTranscriberは、日本語音声をテキストに変換するための最先端のソリューションです。最新の機械学習モデルを活用し、高精度な文字起こしを実現します。
|
| 38 |
|
| 39 |
+
音声ファイルをアップロードするだけで、KotobaTranscriberが自動的に音声を認識し、テキストに変換します。ビジネスミーティングや講義、インタビューなど、あらゆるシーンで活躍します。
|
| 40 |
|
| 41 |
+
## 🎥 デモ
|
| 42 |
|
| 43 |
+
KotobaTranscriberのデモアプリケーションをHugging Face Spacesで公開しています。ぜひ、実際に体験してみてください。
|
| 44 |
|
| 45 |
[](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
|
| 46 |
|
| 47 |
+
## 🚀 はじめに
|
| 48 |
|
| 49 |
+
### インストール
|
| 50 |
|
| 51 |
+
KotobaTranscriberのインストール手順は以下の通りです:
|
| 52 |
|
| 53 |
1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
|
| 54 |
2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
|
| 55 |
|
| 56 |
+
### 使用方法
|
| 57 |
|
| 58 |
+
KotobaTranscriberの基本的な使用方法は以下の通りです:
|
| 59 |
|
| 60 |
+
1. `app.py`を実行します: `python app.py`
|
| 61 |
+
2. ブラウザで`http://localhost:7860`にアクセスします
|
| 62 |
+
3. 音声ファイルをアップロードします
|
| 63 |
+
4. 文字起こし結果が表示されます
|
| 64 |
+
|
| 65 |
+
詳細な使用方法については、[ドキュメント](https://github.com/Sunwood-ai-labs/KotobaTranscriber/wiki)をご参照ください。
|
|
|
|
|
|
|
| 66 |
|
|
|
|
| 67 |
|
| 68 |
```bash
|
| 69 |
+
docker-compose up
|
| 70 |
```
|
| 71 |
|
| 72 |
+
## 📝 アップデート
|
|
|
|
|
|
|
|
|
|
|
|
|
| 73 |
|
| 74 |
- v1.1.0 (2024-04-24):
|
| 75 |
- フロントページの作成
|
| 76 |
- READMEの全体的な改善
|
| 77 |
- GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
|
| 78 |
+
- .gitignoreと.gitattributesの更新
|
| 79 |
- プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
|
| 80 |
- v1.0.0 (2024-04-20):
|
| 81 |
- 初回リリース
|
| 82 |
+
- 基本的な文字起こし機能を実装
|
|
|
|
| 83 |
|
| 84 |
+
## 🤝 コントリビューション
|
| 85 |
|
| 86 |
+
KotobaTranscriberへのご協力は大歓迎です!バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
|
| 87 |
|
| 88 |
+
## 📄 ライセンス
|
| 89 |
|
| 90 |
+
KotobaTranscriberは[MIT License](LICENSE)の下でリリースされています。
|
| 91 |
|
| 92 |
+
## 🙏 謝辞
|
| 93 |
|
| 94 |
+
KotobaTranscriberの開発にあたり、以下の方々に感謝いたします:
|
| 95 |
|
| 96 |
- [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
|
| 97 |
+
- [kotoba-tech/kotoba-whisper-v1.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v1.0)モデルの開発者の方々
|
|
|
|
| 98 |
|
| 99 |
+
引き続き、KotobaTranscriberプロジェクトをよろしくお願いいたします!
|
app.py
CHANGED
|
@@ -34,17 +34,27 @@ def transcribe(audio_file):
|
|
| 34 |
return result["text"]
|
| 35 |
|
| 36 |
description = """
|
| 37 |
-
<
|
|
|
|
|
|
|
|
|
|
| 38 |
"""
|
| 39 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 40 |
# Gradioインターフェースの定義
|
| 41 |
iface = gr.Interface(
|
| 42 |
fn=transcribe,
|
|
|
|
| 43 |
inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
|
| 44 |
outputs="text",
|
| 45 |
-
title="
|
| 46 |
description=description,
|
| 47 |
-
theme=
|
| 48 |
)
|
| 49 |
# アプリの起動
|
| 50 |
iface.launch(server_name="0.0.0.0", server_port=7860, share=True)
|
|
|
|
| 34 |
return result["text"]
|
| 35 |
|
| 36 |
description = """
|
| 37 |
+
<p align="center">
|
| 38 |
+
<img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width="70%">
|
| 39 |
+
<br>
|
| 40 |
+
</p>
|
| 41 |
"""
|
| 42 |
|
| 43 |
+
theme = gr.themes.Soft(
|
| 44 |
+
# neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#6b7280", c600="#4b5563", c700="#374151", c800="#1f2937", c900="#1E2D2F", c950="#1E2D2F"),
|
| 45 |
+
primary_hue="gray",
|
| 46 |
+
neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#1E2D2F", c600="#1E2D2F", c700="#374151", c800="#1f2937", c900="#111827", c950="#0b0f19"),
|
| 47 |
+
)
|
| 48 |
+
|
| 49 |
# Gradioインターフェースの定義
|
| 50 |
iface = gr.Interface(
|
| 51 |
fn=transcribe,
|
| 52 |
+
# fn=None,
|
| 53 |
inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
|
| 54 |
outputs="text",
|
| 55 |
+
title="KotobaTranscriber",
|
| 56 |
description=description,
|
| 57 |
+
theme=theme,
|
| 58 |
)
|
| 59 |
# アプリの起動
|
| 60 |
iface.launch(server_name="0.0.0.0", server_port=7860, share=True)
|