NVIDIA-NeMo/AutomodelPython318

NeMo AutoModelは、NVIDIAが開発したPyTorch分散学習ライブラリで、大規模言語モデル(LLM)や視覚言語モデル(VLM)の学習を効率化します。Hugging Faceモデルとの統合が標準でサポートされており、面倒な設定なしにファインチューニングや事前学習が可能です。分散並列処理、カスタムカーネル、最適化されたレシピを活用して、企業レベルでの大規模モデル学習を実現できます。QwenやGLM、MiniMaxなど最新の大規模モデルに対応しており、即座に利用可能な学習レシピが豊富に提供されています。

ユースケース: 大規模言語モデルや視覚言語モデルの効率的な分散学習・ファインチューニング

  • Hugging Faceモデルとの標準統合
  • 最新大規模モデル(Qwen3.5、GLM-4.7など)への対応
GitHubで見る →

Pytorch Distributed native training library for LLMs/VLMs with OOTB Hugging Face support

関連リポジトリ

LLMアプリのレシピ集!ChatGPTから音声エージェントまで実例満載 — awesome-llm-apps

Shubhamsaboo/awesome-llm-appsPython99.0k

awesome-llm-appsは、ChatGPTやGeminiなどの大規模言語モデル(AIの文章生成技術)を使った実用的なアプリケーションの作り方を集めたレシピ集です。AIエージェント(自動でタスク

PDF・Word・Excel・画像…あらゆるファイルをMarkdownに一発変換!AI時代の必携ツール — markitdown

microsoft/markitdownPython89.9k

MarkItDownは、PDF、Word、Excel、PowerPoint、画像、音声、HTMLなど、さまざまなファイル形式をMarkdown(シンプルな書式付きテキスト)に変換するPython製のツ

写真1枚でリアルタイム顔すり替え!ワンクリックで誰にでもなれるAIディープフェイク — Deep-Live-Cam

hacksider/Deep-Live-CamPython86.8k

Deep-Live-Camは、たった1枚の顔写真を用意するだけで、リアルタイムにウェブカメラの映像や動画の顔を別人の顔に置き換えられるAIツールです。ビデオ通話やライブ配信中に、まるで別人になったかの

AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use

browser-use/browser-usePython84.1k

browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自

PDFや画像を一瞬で構造化データに変換!100言語以上対応のAI文字認識エンジン — PaddleOCR

PaddlePaddle/PaddleOCRPython74.5k

PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応してお