# pytorch

このトピックのトレンドリポジトリ(3件)

30言語対応・声のデザインも自由自在!スタジオ品質の音声を生成するオープンソースAI — VoxCPM

OpenBMB/VoxCPMAIPython
10.4k2回登場

VoxCPMは、テキストを入力するだけで人間そっくりの音声を生成できるAI音声合成システムです。最新版のVoxCPM2は20億パラメータのモデルで、日本語を含む30言語に対応し、48kHzのスタジオ品質の音声を出力できます。「若い女性の優し

audiodeeplearningminicpmmultilingualpythonpytorchspeechspeech-synthesistext-to-speechttstts-modelvoice-cloningvoice-designvoxcpm

LLMの応答を3〜10倍高速化!KVキャッシュを賢く再利用する省エネエンジン — LMCache

LMCache/LMCacheAIPython
7.5k

LMCacheは、大規模言語モデル(AIチャットボットの頭脳にあたるもの)の応答速度を大幅に向上させるための拡張ツールです。AIが文章を生成する際に内部で作られる計算結果(KVキャッシュ)を、GPU・CPU・ディスク・クラウドストレージなど

amdcudafastinferencekv-cachellmpytorchrocmspeedvllm

テキスト・画像・音声・動画をまるごと高速推論!万能AIモデルの配信基盤 — vllm-omni

vllm-project/vllm-omniAIPython
3.6k

vLLM-Omniは、テキストだけでなく画像・動画・音声など複数の種類のデータを同時に扱えるAIモデルを、高速かつ低コストで動かすためのフレームワーク(ソフトウェアの骨組み)です。もともとテキスト専用だったvLLMという人気の高速推論エンジ

audio-generationdiffusionimage-generationinferencemodel-servingmultimodalpytorchtransformervideo-generation