AIモデルの実行も学習もこれ1つ!最大2倍速・VRAM70%削減のローカルAI統合環境 — unsloth

unslothai/unslothPython57.0k

Unslothは、Qwen、DeepSeek、Gemma、LlamaなどのオープンソースAIモデルを自分のパソコンで動かしたり、追加学習(ファインチューニング)したりできる統合ツールです。ブラウザから操作できるWeb画面(Unsloth Studio)を備えており、プログラミングのコードを書かなくても、チャット・画像認識・音声合成などのAIモデルを手軽に試せます。Unslothの最大の特徴は、通常の最大2倍の速度で学習でき、GPU(グラフィックボード)のメモリ使用量を最大70〜80%も削減できる点です。Windows、Linux、macOSに対応し、Google Colabの無料ノートブックも多数用意されているため、高価なGPUがなくても始められます。AIモデルを自分のデータで育てたい開発者や研究者にとって、学習コストを大幅に下げてくれる心強い存在です。

🔥 なぜ話題?

OpenAIがgpt-ossを公開し、QwenやGemmaなど高性能なオープンモデルが続々登場する中で、これらを『自分のPC上で安く・速く学習させたい』というニーズが急増しています。Unsloth Studioという直感的なWeb UIの登場により、コードを書かなくてもローカルでAIモデルの実行・学習ができるようになった点が、幅広い層の注目を集めています。

💡 こう使える!

例えば、自社の製品マニュアル(PDF)をAIに読み込ませて、お客様からの問い合わせに自動応答するチャットボットを作りたいとき、Unsloth StudioのWeb画面でPDFをアップロードしてデータセットを自動生成し、Qwen3やLlamaなどのモデルをファインチューニングすれば、専門用語にも正確に答えられるカスタムAIを自分のPC上で構築できます。

ユースケース: オープンソースのAIモデルを自分のパソコンで動かしたり、自社データで追加学習させてカスタムAIを作りたい人向けの統合ツール。

  • 通常比で最大2倍高速・GPUメモリ使用量を最大80%削減してAIモデルを学習可能
  • ブラウザ操作のWeb UI(Unsloth Studio)でコード不要でもAIの実行・学習ができる
  • テキスト・画像・音声・埋め込みモデルなど500種類以上のモデルに対応
  • PDF・CSV・DOCXから学習用データセットを自動生成する「Data Recipes」機能
  • Google Colabの無料ノートブックが多数用意されており、GPU無しでも試せる
GitHubで見る →

Unified web UI for training and running open models like Qwen, DeepSeek, gpt-oss and Gemma locally.

技術情報

言語

Python

ライセンス

Apache-2.0

最終更新

2026-03-20

スター数

56,963

フォーク数

4,781

Issue数

998

トピック

agentdeepseekdeepseek-r1fine-tuninggemmagemma3gpt-ossllamallama3llmllmsmistralopenaiqwenqwen3reinforcement-learningtext-to-speechttsunslothvoice-cloning

技術詳細

アーキテクチャ・仕組み

Unslothは2つの構成要素からなります:

  • Unsloth Studio:ブラウザベースのWeb UIで、モデルの検索・ダウンロード・チャット・学習・エクスポートを統合的に行える
  • Unsloth Core:Pythonコードから直接利用するライブラリ版。Hugging Faceのtransformers/TRLライブラリと連携

内部では独自のTritonカーネル(RoPE・MLP用)やPadding Free + Packing技術を使い、学習を最大3倍高速化しています。推論にはllama.cppを活用しています。

対応環境・プラットフォーム

  • OS: Windows、Linux、WSL、macOS
  • GPU: NVIDIA RTX 30/40/50シリーズ、Blackwell(B200等)、DGX Spark/Station
  • AMD GPU: チャットは動作、学習はUnsloth Core経由で対応
  • macOS(Apple Silicon): チャットとData Recipesが利用可能。MLXによる学習は近日対応予定
  • CPU: チャットとData Recipesで利用可能
  • Python: 3.13推奨(uvパッケージマネージャー使用)
  • Docker: unsloth/unsloth 公式イメージあり
  • マルチGPU: 対応済み、大規模アップグレード予定

パフォーマンス・ベンチマーク

モデル速度向上メモリ削減
gpt-oss (20B) ファインチューニング2x高速70%削減
gpt-oss (20B) GRPO2x高速80%削減
Qwen3 GRPO2x高速50%削減
Gemma 3 (4B) Vision1.7x高速60%削減
埋め込みモデル1.8〜3.3x高速20%削減
MoEモデル12x高速35%削減
  • 80GB GPUで20Bモデルの50万トークンコンテキスト学習が可能
  • 通常の7倍長いコンテキストでの強化学習(RL)を実現

主要な機能一覧

推論機能

  • GGUF / LoRAアダプター / safetensors形式のモデル検索・ダウンロード・実行
  • GGUF / 16-bit safetensors等へのモデルエクスポート
  • 自己修復型ツールコーリング・Web検索
  • コード実行(Claude artifacts風のサンドボックス環境)
  • 推論パラメータの自動チューニング
  • 画像・音声・PDF・DOCX等のファイルアップロードによるチャット

学習機能

  • フルファインチューニング、事前学習、4-bit / 16-bit / FP8学習
  • リアルタイムのロス監視・GPU使用量トラッキング
  • Data Recipes:PDF/CSV/DOCXからデータセットを自動生成、ビジュアルノードワークフロー
  • 強化学習(GRPO等):VRAM80%削減、FP8 RL、Vision RL対応
  • テキスト・音声(TTS)・埋め込み・画像認識モデルの学習

対応モデル

500以上のモデルに対応。主要なもの:

  • Qwen3.5(0.8B〜112B)、DeepSeek、gpt-oss(OpenAI)、Gemma 3、Llama 3.1/3.2、Mistral Ministral、Orpheus-TTS など

ライセンス

  • Unsloth Core: Apache 2.0(商用利用可能)
  • Unsloth Studio UI: AGPL-3.0(オープンソースだが、商用利用時はAGPLの条件に注意)

デュアルライセンスモデルにより、コアライブラリは自由に商用利用でき、UI部分はAGPLで公開されています。

連携・依存ライブラリ

  • llama.cpp(推論・モデル保存)
  • Hugging Face transformers / TRL
  • PyTorch / Torch AO
  • NVIDIA NeMo DataDesigner
  • uvパッケージマネージャー(インストール推奨)

インストール・クイックスタート

Unsloth Studio(Web UI)のインストール

macOS / Linux / WSL:
curl -fsSL https://raw.githubusercontent.com/unslothai/unsloth/main/install.sh | sh

起動:

source unsloth_studio/bin/activate
unsloth studio -H 0.0.0.0 -p 8888
Windows (PowerShell):
irm https://raw.githubusercontent.com/unslothai/unsloth/main/install.ps1 | iex

起動:

& .\unsloth_studio\Scripts\unsloth.exe studio -H 0.0.0.0 -p 8888
Docker:
docker run -d -e JUPYTER_PASSWORD="mypassword" \
  -p 8888:8888 -p 8000:8000 -p 2222:22 \
  -v $(pwd)/work:/workspace/work \
  --gpus all \
  unsloth/unsloth

Unsloth Core(コードベース)のインストール

Linux / WSL:
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_env --python 3.13
source unsloth_env/bin/activate
uv pip install unsloth --torch-backend=auto

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ

自分のパソコンでAIを動かそう!最新の大規模言語モデルをワンコマンドで実行 — ollama

ollama/ollamaGo168.0k

Ollamaは、ChatGPTのようなAIモデルを自分のパソコン上で簡単に動かせるツールです。通常、AIモデルを使うにはクラウドサービスへの課金や複雑な環境構築が必要ですが、Ollamaを使えばたった

LINEもQQもSlackも!あらゆるチャットアプリにAIボットを一発導入できる万能プラットフォーム — AstrBot

AstrBotDevs/AstrBotPython24.2k

AstrBotは、さまざまなチャットアプリ(メッセージングアプリ)にAIチャットボットを簡単に導入できるオープンソースのプラットフォームです。QQ、Telegram、Slack、Discord、LIN

Stripe・Ramp・Coinbaseが社内で作ったAIコーディングエージェントをオープンソースで再現 — open-swe

langchain-ai/open-swePython7.8k

Open SWEは、組織内部で使えるAIコーディングエージェント(プログラムを自動で書いてくれるAIアシスタント)を構築するためのオープンソースフレームワークです。SlackやLinear(タスク管理

コード変更ほぼゼロでAIエージェントを強化学習で鍛える!どのフレームワークでもOK — agent-lightning

microsoft/agent-lightningPython16.4k

Agent Lightningは、AIエージェント(自律的にタスクをこなすAIプログラム)を強化学習(試行錯誤から学ぶ手法)で訓練するためのMicrosoft製ツールです。最大の特徴は、既存のAIエー

30言語対応・声のデザインも自由自在!スタジオ品質の音声を生成するオープンソースAI — VoxCPM

OpenBMB/VoxCPMPython10.4k

VoxCPMは、テキストを入力するだけで人間そっくりの音声を生成できるAI音声合成システムです。最新版のVoxCPM2は20億パラメータのモデルで、日本語を含む30言語に対応し、48kHzのスタジオ品