リアルタイム音声会話AI — 声も性格も自在に操る全二重通話モデル — personaplex
PersonaPlexは、NVIDIAが開発したリアルタイムの音声対話AIモデルです。人間同士の会話のように、相手が話している途中でも割り込んだり相づちを打ったりできる「全二重通信(電話のように双方向で同時に話せる仕組み)」に対応しています。テキストでキャラクター設定(例:『あなたはレストランの店員です』)を与えたり、声のサンプルで話し方を指定したりすることで、AIの人格や声色を自由にコントロールできます。カスタマーサービスの応対、カジュアルな雑談、QAアシスタントなど幅広い会話シナリオに対応しており、ブラウザ上のWebUIから直接リアルタイムで会話できます。
🔥 なぜ話題?
リアルタイム音声AIが急速に注目される中、NVIDIAが「声」と「キャラクター」の両方を制御できる全二重音声対話モデルをオープンに公開したことが大きな話題を呼んでいます。特に、従来の音声AIでは難しかった割り込みや相づちといった自然な会話のやりとりを実現している点が、開発者や研究者の関心を集めています。
💡 こう使える!
例えば、レストランの注文受付をシミュレーションしたいとき、『あなたはシャクシュカ専門店の店員オーウェンです。クラシック9.50ドル、スパイシー10.25ドル…』とプロンプトを設定すると、PersonaPlexがその店員になりきって音声でお客さん役のあなたと自然にやりとりしてくれます。途中で質問を割り込んでも、人間のように対応してくれます。
ユースケース: AIキャラクターとリアルタイムで音声会話したり、カスタマーサービスの応対シミュレーションを行いたい人向け。
- 電話のように双方向で同時に話せる全二重リアルタイム音声対話に対応
- テキストプロンプトで人格設定、音声サンプルで声質を自由にカスタマイズ可能
- NVIDIAが開発し、モデル重みとコードの両方をオープンに公開
PersonaPlex code.