Spaces:

MakiAi
/

KotobaTranscriber

Running on Zero

MakiAi commited on Apr 24, 2024

Commit

db1910e

1 Parent(s): 6075b24

[refactor] GitHub Actions設定とapp.pyファイルの更新

プロジェクトの自動デプロイ設定とアプリケーションのUIを更新しました。具体的な変更内容は以下の通りです：

### .github/workflows/run.yamlの更新
- GitHub Actionsのスクリプト内のデプロイメントコマンドを更新しました。Hugging Face Spacesのリポジトリを `HarmonAI_II` から `KotobaTranscriber` へ変更しました。これにより、最新のリポジトリ設定に基づいた自動デプロイが可能となります。

### app.pyの大幅な更新
- **画像配置の変更**: アプリケーションの説明部分で使用される画像のHTMLタグを更新し、画像を中央に配置し、サイズを70%に調整しました。
- **テーマのカスタマイズ**: Gradioのテーマをカスタマイズし、プライマリカラーをグレーに設定しました。カラーコードも新しいスキームに基づいて更新されています。
- **インターフェースの定義更新**: `Interface` の定義を更新し、タイトルを `Speech-to-Text App` から `KotobaTranscriber` に変更しました。これにより、アプリケーションのブランディングが強化されます。

これらの変更により、プロジェクトのデプロイメントプロセスとユーザーインターフェースが最新のプロジェクト要件に適合し、より効率的かつ魅力的なものとなりました。

Files changed (4) hide show

.SourceSageignore +2 -1
.github/workflows/run.yaml +1 -1
README.md +28 -36
app.py +13 -3

.SourceSageignore CHANGED Viewed

@@ -22,4 +22,5 @@ modules\__pycache__
 sourcesage.egg-info
 .pytest_cache
 dist
-build

 sourcesage.egg-info
 .pytest_cache
 dist
+build
+.cache

.github/workflows/run.yaml CHANGED Viewed

@@ -16,4 +16,4 @@ jobs:
       - name: Push to hub
         env:
           HF_TOKEN: ${{ secrets.HF_TOKEN }}
-        run: git push --force  https://MakiAi:[email protected]/spaces/MakiAi/HarmonAI_II main

       - name: Push to hub
         env:
           HF_TOKEN: ${{ secrets.HF_TOKEN }}
+        run: git push --force  https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main

README.md CHANGED Viewed

@@ -32,76 +32,68 @@ pinned: false
 >[!IMPORTANT]
 >このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) ＋ [claude.ai](https://claude.ai/)で生成しています。
-## 🌟 Introduction
-HarmonAI IIは、AIとの調和と無限の可能性を追求するプロジェクトです。このリポジトリは、HarmonAI IIの開発テンプレートとして機能します。
-## 🎥 Demo
-HarmonAI IIのデモアプリケーションは、GitHub Actionsと連携し、自動的にデプロイされています。デモアプリを体験することで、HarmonAI IIの機能を直感的に理解することができます。
 [![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
-## 🚀 Getting Started
-### Installation
-HarmonAI IIのインストール手順は以下の通りです:
 1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
 2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
-### Usage
-HarmonAI IIの使用方法は以下の通りです:
-```bash
-git lfs install
-git lfs track "*.png"
-git lfs track "*.gif"
-git lfs track "*.jpeg"
-git lfs track "*.jpg"
-git lfs track "*.mp4"
-```
-リポジトリ名を適切に変更してください:
 ```bash
-run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main
 ```
-### Customization
-HarmonAI IIは、ユーザーのニーズに合わせてカスタマイズ可能です。設定ファイルを編集することで、プロジェクトの動作を柔軟に調整できます。
-## 📝 Updates
 - v1.1.0 (2024-04-24):
   - フロントページの作成
   - READMEの全体的な改善
   - GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
-  - .gitignoreと.SourceSageignoreの更新
   - プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
 - v1.0.0 (2024-04-20):
   - 初回リリース
-  - 基本的な機能を実装
-## 🤝 Contributing
-HarmonAI IIへのご協力は大歓迎です！バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
-## 📄 License
-HarmonAI IIは[MIT License](LICENSE)の下でリリースされています。
-## 🙏 Acknowledgements
-HarmonAI IIの開発にあたり、以下の方々に感謝いたします:
 - [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
-- [SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)プロジェクト
-- [claude.ai](https://claude.ai/)チーム
-引き続き、HarmonAI IIプロジェクトをよろしくお願いいたします！

 >[!IMPORTANT]
 >このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) ＋ [claude.ai](https://claude.ai/)で生成しています。
+## 🌟 イントロダクション
+KotobaTranscriberは、日本語音声をテキストに変換するための最先端のソリューションです。最新の機械学習モデルを活用し、高精度な文字起こしを実現します。
+音声ファイルをアップロードするだけで、KotobaTranscriberが自動的に音声を認識し、テキストに変換します。ビジネスミーティングや講義、インタビューなど、あらゆるシーンで活躍します。
+## 🎥 デモ
+KotobaTranscriberのデモアプリケーションをHugging Face Spacesで公開しています。ぜひ、実際に体験してみてください。
 [![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
+## 🚀 はじめに
+### インストール
+KotobaTranscriberのインストール手順は以下の通りです:
 1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
 2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
+### 使用方法
+KotobaTranscriberの基本的な使用方法は以下の通りです:
+1. `app.py`を実行します: `python app.py`
+2. ブラウザで`http://localhost:7860`にアクセスします
+3. 音声ファイルをアップロードします
+4. 文字起こし結果が表示されます
+詳細な使用方法については、[ドキュメント](https://github.com/Sunwood-ai-labs/KotobaTranscriber/wiki)をご参照ください。
 ```bash
+docker-compose up
 ```
+## 📝 アップデート
 - v1.1.0 (2024-04-24):
   - フロントページの作成
   - READMEの全体的な改善
   - GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
+  - .gitignoreと.gitattributesの更新
   - プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
 - v1.0.0 (2024-04-20):
   - 初回リリース
+  - 基本的な文字起こし機能を実装
+## 🤝 コントリビューション
+KotobaTranscriberへのご協力は大歓迎です！バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
+## 📄 ライセンス
+KotobaTranscriberは[MIT License](LICENSE)の下でリリースされています。
+## 🙏 謝辞
+KotobaTranscriberの開発にあたり、以下の方々に感謝いたします:
 - [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
+- [kotoba-tech/kotoba-whisper-v1.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v1.0)モデルの開発者の方々
+引き続き、KotobaTranscriberプロジェクトをよろしくお願いいたします！

app.py CHANGED Viewed

@@ -34,17 +34,27 @@ def transcribe(audio_file):
     return result["text"]
 description = """
-<img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width=200px>
 """
 # Gradioインターフェースの定義
 iface = gr.Interface(
     fn=transcribe,
     inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
     outputs="text",
-    title="Speech-to-Text App",
     description=description,
-    theme=gr.themes.Soft(),
 )
 # アプリの起動
 iface.launch(server_name="0.0.0.0", server_port=7860, share=True)

     return result["text"]
 description = """
+<p align="center">
+<img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width="70%">
+<br>
+</p>
 """
+theme = gr.themes.Soft(
+    # neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#6b7280", c600="#4b5563", c700="#374151", c800="#1f2937", c900="#1E2D2F", c950="#1E2D2F"),
+    primary_hue="gray",
+    neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#1E2D2F", c600="#1E2D2F", c700="#374151", c800="#1f2937", c900="#111827", c950="#0b0f19"),
+)
 # Gradioインターフェースの定義
 iface = gr.Interface(
     fn=transcribe,
+    # fn=None,
     inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
     outputs="text",
+    title="KotobaTranscriber",
     description=description,
+    theme=theme,
 )
 # アプリの起動
 iface.launch(server_name="0.0.0.0", server_port=7860, share=True)