# text-to-speech

このトピックのトレンドリポジトリ(4件)

AIモデルの実行も学習もブラウザ画面ひとつで完結!最大2倍速・VRAM70%削減の万能ツール — unsloth

unslothai/unslothAIPython
57.0k2回登場

Unslothは、Qwen、DeepSeek、Gemma、LlamaなどのオープンソースAIモデルを自分のパソコンで動かしたり、追加学習(ファインチューニング)したりできる統合ツールです。ブラウザから操作できるWeb画面(Unsloth S

agentdeepseekdeepseek-r1fine-tuninggemmagemma3gpt-ossllamallama3llmllmsmistralopenaiqwenqwen3reinforcement-learningtext-to-speechttsunslothvoice-cloning

30言語対応・声のデザインも自由自在!スタジオ品質の音声を生成するオープンソースAI — VoxCPM

OpenBMB/VoxCPMAIPython
10.4k2回登場

VoxCPMは、テキストを入力するだけで人間そっくりの音声を生成できるAI音声合成システムです。最新版のVoxCPM2は20億パラメータのモデルで、日本語を含む30言語に対応し、48kHzのスタジオ品質の音声を出力できます。「若い女性の優し

audiodeeplearningminicpmmultilingualpythonpytorchspeechspeech-synthesistext-to-speechttstts-modelvoice-cloningvoice-designvoxcpm

supertone-inc/supertonic

supertone-inc/supertonicOtherSwift
8.0k6回登場

Lightning-Fast, On-Device, Multilingual TTS — running natively via ONNX.

cppcsharpfluttergoiosjavalightweightmultilingualnodejson-deviceonnxonnxruntimepythonrustspeech-synthesisswifttext-to-speechttswebwebgpu

OpenMOSS/MOSS-TTS

OpenMOSS/MOSS-TTSOtherPython
2.0k

MOSS‑TTS Family is an open‑source speech and sound generation model family from MOSI.AI and the OpenMOSS team. It is designed for high‑fidelity, high‑expressiveness, and complex real‑world scenarios, covering stable long‑form speech, multi‑speaker dialogue, voice/character design, environmental sound effects, and real‑time streaming TTS.

audioaudio-tokenizerllmmultimodaltext-to-speechvoice-cloning