Spaces:
Sleeping
A newer version of the Gradio SDK is available:
5.22.0
title: KotobaTranscriber
emoji: 🌍
colorFrom: blue
colorTo: red
sdk: gradio
sdk_version: 4.27.0
app_file: app.py
pinned: false
KotobaTranscriber
このリポジトリはSourceSageを活用しており、リリースノートやREADME、コミットメッセージの9割はSourceSage + claude.aiで生成しています。
Introduction
KotobaTranscriber は、日本語音声をテキストに変換するための最先端のソリューションです。最新の機械学習モデルを活用し、高精度な文字起こしを実現します。
音声ファイルをアップロードするだけで、KotobaTranscriber が自動的に音声を認識し、テキストに変換します。ビジネスミーティングや講義、インタビューなど、あらゆるシーンで活躍します。
Demo
KotobaTranscriber のデモアプリケーションを Hugging Face Spaces で公開しています。ぜひ、実際に体験してみてください。
Getting Started
インストール
KotobaTranscriber のインストール手順は以下の通りです:
リポジトリをクローンします:
git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git
必要な依存関係をインストールします:
pip install -r requirements.txt
使用方法
KotobaTranscriber の基本的な使用方法は以下の通りです:
app.py
を実行します:python app.py
ブラウザで
http://localhost:7860
にアクセスします音声ファイルをアップロードします
文字起こし結果が表示されます
詳細な使用方法については、ドキュメントをご参照ください。
Docker の起動方法
KotobaTranscriber を Docker で起動するには、以下のコマンドを実行します:
docker-compose up
Changelog
v1.1.0 (2024-04-24):
- フロントページの作成
- README の全体的な改善
- GitHub Actions を使用した HuggingFace hub への自動シンク機能の追加
- .gitignore と .gitattributes の更新
- プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
v1.0.0 (2024-04-20):
- 初回リリース
- 基本的な文字起こし機能を実装
Contributing
KotobaTranscriber へのご協力は大歓迎です!バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細はCONTRIBUTING.mdをご覧ください。
License
KotobaTranscriber はMIT Licenseの下でリリースされています。
Acknowledgements
KotobaTranscriber の開発にあたり、以下の方々に感謝いたします:
- Sunwood-ai-labsチームのメンバー
- kotoba-tech/kotoba-whisper-v1.0モデルの開発者の方々
引き続き、KotobaTranscriber プロジェクトをよろしくお願いいたします!