Whisperを超える音声認識をスマホでもラズパイでも!リアルタイム対応の軽量AIエンジン — moonshine
Moonshine Voiceは、リアルタイムの音声認識(話した言葉を文字に変換する技術)をスマートフォンやRaspberry Piのような小型デバイスでも高速に動かせるオープンソースのAIツールキットです。すべての処理がデバイス上で完結するため、クラウドへの通信が不要で、プライバシーが守られ、APIキーやアカウント登録も必要ありません。OpenAIのWhisperと比べて、同等以上の精度を保ちながら最大数十倍高速に動作し、ユーザーが話している最中からリアルタイムに文字起こしを更新できます。英語・日本語・韓国語・スペイン語・中国語など複数言語に対応し、Python・iOS・Android・Windows・Linuxなど主要なプラットフォームで統一されたAPIから利用できます。音声コマンドの意図認識機能も内蔵されており、「電気をつけて」のような自然な言い回しのバリエーションも認識できます。
moonshine-ai/moonshine·C·6.4k+496 Whisperを超える音声認識をスマホでもラズパイでも!リアルタイム対応の軽量AIエンジン — moonshine
Moonshine Voiceは、リアルタイムの音声認識(話した言葉を文字に変換する技術)をスマートフォンやRaspberry Piのような小型デバイスでも高速に動かせるオープンソースのAIツールキットです。すべての処理がデバイス上で完結するため、クラウドへの通信が不要で、プライバシーが守られ、APIキーやアカウント登録も必要ありません。OpenAIのWhisperと比べて、同等以上の精度を保ちながら最大数十倍高速に動作し、ユーザーが話している最中からリアルタイムに文字起こしを更新できます。英語・日本語・韓国語・スペイン語・中国語など複数言語に対応し、Python・iOS・Android・Windows・Linuxなど主要なプラットフォームで統一されたAPIから利用できます。音声コマンドの意図認識機能も内蔵されており、「電気をつけて」のような自然な言い回しのバリエーションも認識できます。
moonshine-ai/moonshineCAI6.4k+496