Qwenモデルで自分だけのAIエージェントを構築!ツール呼び出し・コード実行・RAGを全部のせ — Qwen-Agent

QwenLM/Qwen-AgentPython15.1k

Qwen-Agentは、アリババが開発したAIモデル「Qwen」を使って、自分だけのAIアシスタント(エージェント)を作れるフレームワーク(開発の土台となる仕組み)です。たとえばAIに「この画像を生成して」「このPDFの内容を要約して」と指示すると、AIが自分で道具(ツール)を選び、コードを書いて実行し、答えを返してくれます。ブラウザアシスタントやコード実行環境、超長文ドキュメントへの質問応答(RAG)、さらにはMCP(外部ツール連携の標準規格)にも対応しており、実際に「Qwen Chat」というチャットサービスのバックエンドとしても使われています。プログラマーがAIを活用したアプリケーションを素早く開発したいときに最適なツールキットです。

🔥 なぜ話題?

Qwen3.5の公開やMCP対応の追加など、最新のAIエージェント技術トレンドに素早く対応していることが注目を集めています。特に、関数呼び出し・コード実行・RAG・MCP連携といったエージェントに必要な機能をオールインワンで提供し、実際の商用サービス(Qwen Chat)で使われている実績がある点が開発者の信頼を得ています。

💡 こう使える!

たとえば社内に大量のPDFマニュアルがあるとき、Qwen-Agentを使って『このPDFの中から○○の手順を教えて』と質問できるチャットボットを作れます。AIがPDFを読み込み、関連箇所を見つけて回答し、必要に応じてPythonコードを実行してグラフや画像の加工まで自動でやってくれます。

ユースケース: AIモデルにツールの使用やコードの自動実行、長文ドキュメントの質問応答などの高度な機能を持たせた独自のAIアシスタントを開発する。

  • 関数呼び出し・コード実行・RAG・MCPなどエージェント開発に必要な機能がオールインワン
  • Qwen3/3.5・QwQ・Qwen3-Coderなど最新モデルに対応し並列・マルチステップのツール呼び出しが可能
  • Gradioベースの管理画面を数行のコードで立ち上げられ、すぐにチャットボットとして使える
  • 100万トークン級の超長文ドキュメントにも対応するRAG機能搭載
  • 実際にQwen Chatの本番バックエンドとして稼働している実績
GitHubで見る →

Agent framework and applications built upon Qwen>=3.0, featuring Function Calling, MCP, Code Interpreter, RAG, Chrome extension, etc.

技術情報

言語

Python

ライセンス

Apache-2.0

最終更新

2026-03-04

スター数

15,141

フォーク数

1,447

Issue数

451

技術詳細

アーキテクチャ・仕組み

Qwen-Agentは3層構造で設計されています:

  • LLM層: BaseChatModel を継承し、関数呼び出し(Function Calling)機能を内蔵
  • Tool層: BaseTool を継承し、カスタムツールを @register_tool デコレータで簡単に登録可能
  • Agent層: Agent クラスを継承し、AssistantFnCallAgentReActChat などの高レベルエージェントを提供

対応モデル・サービス

  • DashScope API: qwen-max-latest など Alibaba Cloud のモデルサービス
  • OpenAI互換API: vLLM、Ollama などのセルフホストサービス
  • 対応モデル: Qwen2.5シリーズ、QwQ-32B、Qwen3、Qwen3-Coder、Qwen3.5、Qwen3-VL
  • QwQ/Qwen3 では vLLM の --enable-auto-tool-choice パラメータは非推奨(Qwen-Agent側で独自パース)
  • Qwen3-Coder では vLLM のビルトインツールパース + use_raw_api パラメータの使用を推奨

主要機能一覧

  • Function Calling(関数呼び出し): 並列関数呼び出し(Parallel Function Calls)をデフォルトでサポート
  • Code Interpreter: Dockerコンテナベースのサンドボックスでコードを安全に実行
  • RAG(検索拡張生成): 100万トークン級の超長文ドキュメントに対応。ネイティブ長文コンテキストモデルを上回る性能
  • MCP(Model Context Protocol): 外部ツールとの標準的な連携規格に対応。SQLite、ファイルシステム、メモリなど
  • Browser Assistant(BrowserQwen): Chrome拡張機能として動作するブラウザアシスタント
  • Qwen3-VL対応: 画像のズームイン、画像検索、Web検索などのビジョン系ツール
  • Gradio 5 ベースGUI: WebUI(bot).run() の一行でデモ画面を起動可能(Python 3.10以上が必要)
  • reasoning_content フィールド: 思考過程の分離表示に対応

設定オプション

generate_cfg で以下のパラメータを調整可能:

  • thought_in_content: 思考内容をcontentに含めるかどうか(デフォルト: False)
  • fncall_prompt_type: ツール呼び出しテンプレート(デフォルト: nous、Qwen3推奨)
  • max_input_tokens: 最大入力トークン数(超過時はメッセージを切り詰め)
  • use_raw_api: APIのネイティブなツール呼び出しインターフェースを使用
  • top_p 等のLLMハイパーパラメータ

パフォーマンス

  • RAGソリューションは2つの高難度ベンチマークでネイティブ長文コンテキストモデルを上回る性能を達成
  • 100万トークンの「Needle-in-the-Haystack」テストで完璧なスコア
  • エージェント評価ベンチマーク「DeepPlanning」を公開

制約・注意点

  • Code Interpreterの利用にはDockerのインストールと起動が必要
  • Dockerベースのサンドボックスは基本的な分離のみ。本番環境での利用は慎重に
  • GUIはPython 3.10以上が必要
  • Qwen2.5-Mathのコード実行環境はサンドボックス化されておらず、ローカルテスト専用

MCP利用の前提環境

  • Node.js(最新版)、uv 0.4.18以上、Git、SQLite が必要

ライセンス

  • Apache License 2.0(商用利用可能)

インストール・クイックスタート

インストール手順

PyPIから安定版をインストール(オプション機能は角括弧で指定):

pip install -U "qwen-agent[gui,rag,code_interpreter,mcp]"
# 最小構成の場合:
# pip install -U qwen-agent

最新の開発版をソースからインストール:

git clone https://github.com/QwenLM/Qwen-Agent.git
cd Qwen-Agent
pip install -e ./"[gui,rag,code_interpreter,mcp]"

モデルサービスの準備

DashScope(アリババクラウドのAPIサービス)を使う場合:

export DASHSCOPE_API_KEY=あなたのAPIキー

またはvLLM/Ollamaで自前のモデルサーバーを立てて、OpenAI互換APIとして利用可能です。

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ

PDF・Word・Excel・画像…なんでもMarkdownに一発変換!AI時代の万能ファイル変換ツール — markitdown

microsoft/markitdownPython109.1k

MarkItDownは、PDF、Word、Excel、PowerPoint、画像、音声、HTMLなど、さまざまな形式のファイルをMarkdown(シンプルな書式付きテキスト)に変換するPython製の

LLMアプリのレシピ集!ChatGPTから音声エージェントまで実例満載 — awesome-llm-apps

Shubhamsaboo/awesome-llm-appsPython99.0k

awesome-llm-appsは、ChatGPTやGeminiなどの大規模言語モデル(AIの文章生成技術)を使った実用的なアプリケーションの作り方を集めたレシピ集です。AIエージェント(自動でタスク

写真1枚でリアルタイム顔入れ替え!ワンクリックでディープフェイク映像を生成 — Deep-Live-Cam

hacksider/Deep-Live-CamPython90.5k

Deep-Live-Camは、たった1枚の写真を用意するだけで、ウェブカメラの映像やビデオの中の顔をリアルタイムに別人の顔に入れ替えられるソフトウェアです。「顔を選ぶ→カメラを選ぶ→ライブボタンを押す

使うほど賢くなるAIエージェント — 学習・記憶・自動化を全部入りで月5ドルから運用 — hermes-agent

NousResearch/hermes-agentPython87.5k

Hermes Agentは、Nous Research社が開発した「自己改善するAIエージェント」です。会話するたびに経験からスキルを自動生成し、ユーザーの好みや過去のやり取りを記憶して、使えば使うほ

AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use

browser-use/browser-usePython84.1k

browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自