AIが仮説→実験→論文執筆まで全自動で科学研究!査読も通過した次世代システム — AI-Scientist-v2

SakanaAI/AI-Scientist-v2Python3.7k

AI-Scientist-v2は、AIが完全に自律して科学研究を行うシステムです。研究テーマを与えるだけで、仮説の生成、実験の実行、データ分析、そして学術論文の執筆までを人間の手を借りずに一貫して行います。実際にこのシステムが書いた論文が、学会の査読(専門家による品質チェック)を通過して採択された実績があります。前バージョン(v1)では人間が作ったテンプレートが必要でしたが、v2では「エージェント型木探索」という手法により、テンプレートなしでも幅広い機械学習分野の研究を探索的に進められるようになりました。研究者やAI開発者が、新しいアイデアの検証や論文作成の効率化に活用できるツールです。

🔥 なぜ話題?

AIが書いた論文が実際に国際学会(ICLR 2025ワークショップ)の査読を通過して採択されたという前例のない成果が大きな話題を呼んでいます。科学研究の自動化という次世代のAI活用の姿を具体的に示したプロジェクトとして、研究者・エンジニアの双方から注目を集めています。

💡 こう使える!

例えば、機械学習の新しいテーマ(「画像分類でデータが少ないときの精度改善」など)をMarkdownファイルに書いて渡すと、AIが自動で20個の研究アイデアを考え出し、その中から有望なものを選んで実験コードを書き、結果をグラフにまとめ、最終的にPDF形式の学術論文を数時間で生成してくれます。

ユースケース: 機械学習分野の研究テーマについて、仮説の立案から実験・論文執筆までをAIに任せて自動化したいときに使えるシステム。

  • AIだけで書いた論文が学会の査読を通過・採択された世界初の実績
  • テンプレート不要で幅広い機械学習テーマに対応するエージェント型木探索
  • 仮説生成→実験→分析→論文執筆→レビューまで完全自動のパイプライン
GitHubで見る →

The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search

技術情報

言語

Python

ライセンス

NOASSERTION

最終更新

2025-12-19

スター数

3,675

フォーク数

550

Issue数

56

技術詳細

アーキテクチャ・仕組み

AI-Scientist-v2は以下の段階で動作するエージェントシステムです:

  1. アイデア生成(Ideation): LLMがトピック記述ファイルを元に研究仮説を複数生成し、Semantic Scholar APIで新規性を確認
  2. エージェント型木探索(Agentic Tree Search): 「実験マネージャーエージェント」が主導する**Progressive Best-First Tree Search(BFTS)**により、複数の実験パスを並列探索
  3. 論文執筆(Write-up): 実験結果を元にLLMが学術論文のPDFを自動生成
  4. 自動レビュー: 生成した論文をLLMが査読

木探索コンポーネントは AIDE プロジェクトをベースに構築されています。

対応モデル

  • OpenAI: GPT-4o、o1-preview、o3-mini など
  • Google Gemini: OpenAI API互換で利用
  • Claude(AWS Bedrock経由): Claude 3.5 Sonnet など(実験フェーズで推奨)

対応環境

  • OS: Linux
  • GPU: NVIDIA GPU(CUDA対応必須)
  • Python: 3.11
  • PyTorch: CUDA 12.4対応版
  • 追加ツール: LaTeX(chktex)、Poppler(PDF処理)

木探索の設定パラメータ(bfts_config.yaml

  • num_workers: 並列探索パス数
  • steps: 探索ノードの最大数
  • num_seeds: 初期ルートノード数(num_workers < 3の場合は同じ値を推奨)
  • max_debug_depth: 失敗ノードのデバッグ試行回数上限
  • debug_prob: 失敗ノードのデバッグ試行確率
  • num_drafts: Stage 1での独立した木の数

コスト目安

フェーズ推定コスト
アイデア生成数ドル程度
実験(Claude 3.5 Sonnet使用)約$15〜$20/回
論文執筆約$5(デフォルトモデル使用時)

v1との比較

特徴v1v2
テンプレート人間が作成したもの必要不要
対応領域テンプレートに依存ML全般に汎用
探索方式テンプレート追従型エージェント型木探索
成功率高い低い(探索的なため)
得意領域明確な目標がある研究オープンエンドな探索

実績

  • ICLR 2025 Workshopに採択された論文をAIのみで生成

制約・注意点

  • LLMが生成したコードを自動実行するため、サンドボックス環境(Dockerコンテナ等)での実行を強く推奨
  • 危険なパッケージの使用、制御されないWeb接続、意図しないプロセスの生成リスクあり
  • GPU メモリ不足エラーが出る場合はプロンプトで小さいモデルの使用を指示する必要あり
  • 成功率はモデルの性能とアイデアの複雑さに依存

ライセンス・商用利用

  • The AI Scientist Source Code License(Responsible AI Licenseの派生)
  • 必須開示義務: 生成された論文にはAIの使用を明確に開示する法的義務あり
  • 推奨表記: "This manuscript was autonomously generated using The AI Scientist."

インストール・クイックスタート

インストール手順

Linux + NVIDIA GPU(CUDA対応)環境が必要です。

# conda環境の作成
conda create -n ai_scientist python=3.11
conda activate ai_scientist

# PyTorchのインストール(CUDAバージョンは環境に合わせて調整)
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

# PDFとLaTeX関連ツールのインストール
conda install anaconda::poppler
conda install conda-forge::chktex

# Python依存パッケージのインストール
pip install -r requirements.txt

APIキーの設定

export OPENAI_API_KEY="YOUR_OPENAI_KEY_HERE"
export S2_API_KEY="YOUR_S2_KEY_HERE"  # 任意(論文検索用)

アイデア生成の実行

python ai_scientist/perform_ideation_temp_free.py \
 --workshop-file "ai_scientist/ideas/my_research_topic.md" \
 --model gpt-4o-2024-05-13 \
 --max-num-generations 20 \
 --num-reflections 5

論文生成パイプラインの実行

python launch_scientist_bfts.py \
 --load_ideas "ai_scientist/ideas/my_research_topic.json" \
 --load_code --add_dataset_ref \
 --model_writeup o1-preview-2024-09-12 \
 --model_citation gpt-4o-2024-11-20 \
 --model_review gpt-4o-2024-11-20 \
 --model_agg_plots o3-mini-2025-01-31 \
 --num_cite_rounds 20

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ

PDF・Word・Excel・画像…なんでもMarkdownに一発変換!AI時代の万能ファイル変換ツール — markitdown

microsoft/markitdownPython109.1k

MarkItDownは、PDF、Word、Excel、PowerPoint、画像、音声、HTMLなど、さまざまな形式のファイルをMarkdown(シンプルな書式付きテキスト)に変換するPython製の

LLMアプリのレシピ集!ChatGPTから音声エージェントまで実例満載 — awesome-llm-apps

Shubhamsaboo/awesome-llm-appsPython99.0k

awesome-llm-appsは、ChatGPTやGeminiなどの大規模言語モデル(AIの文章生成技術)を使った実用的なアプリケーションの作り方を集めたレシピ集です。AIエージェント(自動でタスク

写真1枚でリアルタイム顔入れ替え!ワンクリックでディープフェイク映像を生成 — Deep-Live-Cam

hacksider/Deep-Live-CamPython90.5k

Deep-Live-Camは、たった1枚の写真を用意するだけで、ウェブカメラの映像やビデオの中の顔をリアルタイムに別人の顔に入れ替えられるソフトウェアです。「顔を選ぶ→カメラを選ぶ→ライブボタンを押す

使うほど賢くなるAIエージェント — 学習・記憶・自動化を全部入りで月5ドルから運用 — hermes-agent

NousResearch/hermes-agentPython87.5k

Hermes Agentは、Nous Research社が開発した「自己改善するAIエージェント」です。会話するたびに経験からスキルを自動生成し、ユーザーの好みや過去のやり取りを記憶して、使えば使うほ

AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use

browser-use/browser-usePython84.1k

browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自