MOSS‑TTS Family is an open‑source speech and sound generation model family from MOSI.AI and the OpenMOSS team. It is designed for high‑fidelity, high‑expressiveness, and complex real‑world scenarios, covering stable long‑form speech, multi‑speaker dialogue, voice/character design, environmental sound effects, and real‑time streaming TTS.
OpenMOSS/MOSS-TTSPython2.0k
GitHubで見る →
技術情報
言語
Python
ライセンス
Apache-2.0
最終更新
2026-05-27
スター数
2,036
フォーク数
202
Issue数
5
トピック
audioaudio-tokenizerllmmultimodaltext-to-speechvoice-cloning
関連リポジトリ
AIモデルの実行も学習もブラウザ画面ひとつで完結!最大2倍速・VRAM70%削減の万能ツール — unsloth
unslothai/unslothPython57.0k
Unslothは、Qwen、DeepSeek、Gemma、LlamaなどのオープンソースAIモデルを自分のパソコンで動かしたり、追加学習(ファインチューニング)したりできる統合ツールです。ブラウザから
30言語対応・声のデザインも自由自在!スタジオ品質の音声を生成するオープンソースAI — VoxCPM
OpenBMB/VoxCPMPython10.4k
VoxCPMは、テキストを入力するだけで人間そっくりの音声を生成できるAI音声合成システムです。最新版のVoxCPM2は20億パラメータのモデルで、日本語を含む30言語に対応し、48kHzのスタジオ品
NousResearch/hermes-agent
NousResearch/hermes-agentPython143.7k
AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use
browser-use/browser-usePython84.1k
browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自
TauricResearch/TradingAgents
TauricResearch/TradingAgentsPython68.5k