AIエージェントに"学習する記憶"を与える!会話履歴の先を行くバイオミメティック記憶システム — hindsight

vectorize-io/hindsightPython3.8k

Hindsightは、AIエージェント(自動で仕事をこなすAIプログラム)に人間のような「学習する記憶」を持たせるためのシステムです。従来のAI記憶システムは会話履歴を単に保存するだけでしたが、Hindsightは「世界の事実」「体験」「メンタルモデル(経験から学んだ理解)」という人間の脳に近い仕組みで情報を整理し、過去の経験から新しい気づきを生み出せます。記憶の保存(Retain)、検索(Recall)、振り返り・分析(Reflect)の3つのシンプルな操作だけで使え、わずか2行のコード変更で既存のAIエージェントに組み込めます。長期記憶の精度を測るベンチマークで最高スコアを達成しており、Fortune 500企業やAIスタートアップで実際に使われています。

🔥 なぜ話題?

AIエージェントが単なるチャットボットから「仕事を任せられるAI社員」へ進化する流れの中で、記憶と学習能力がボトルネックとして注目されています。Hindsightはベンチマークで他のメモリシステムを大きく上回る精度を示し、しかもDockerで簡単にセルフホストできる手軽さから、エージェント開発者の間で急速に広まっています。

💡 こう使える!

例えば、社内のAIカスタマーサポートボットに導入すると、ユーザーごとの過去のやり取りや好みを記憶するだけでなく、『最近このタイプの質問が増えているので、製品ドキュメントにこの情報を追加すべきかもしれない』といった振り返り分析を自動で行い、サポート品質の改善提案まで出してくれるようになります。

ユースケース: AIチャットボットやAI営業アシスタントなどに長期記憶を持たせ、ユーザーごとの好みや過去のやり取りを学習して、より賢い対応ができるようにする。

  • 長期記憶ベンチマーク(LongMemEval)で最高精度を達成し、バージニア工科大学とワシントン・ポストが独立検証済み
  • 人間の脳を模した「世界の事実・体験・メンタルモデル」の3層構造で記憶を整理し、単なる検索ではなく学習と気づきを実現
  • 既存のAIエージェントにわずか2行のコード変更で導入可能、Python・Node.js・REST APIに対応
GitHubで見る →

Hindsight: Agent Memory That Learns

技術情報

言語

Python

ライセンス

MIT

最終更新

2026-03-13

スター数

3,812

フォーク数

270

Issue数

14

トピック

agentic-aiagentsmemory

技術詳細

アーキテクチャ・仕組み

Hindsightは「バイオミメティック(生体模倣)データ構造」を採用しており、人間の記憶に近い形で情報を整理する。記憶は以下の3種類に分類される:

  • World(世界の事実): 「ストーブは熱くなる」のような一般的事実
  • Experiences(体験): 「ストーブに触って痛かった」のようなエージェント自身の経験
  • Mental Models(メンタルモデル): 生の記憶や体験を振り返ることで形成される、より深い理解

記憶は「メモリバンク」という単位で管理され、エンティティ(実体)、リレーションシップ(関係性)、時系列データとして表現され、スパース/デンスベクトル表現で検索性を向上させている。

3つの基本操作

  • Retain(保持): LLMを使って入力からキーファクト、時間データ、エンティティ、関係性を自動抽出し、正規化プロセスを経て保存
  • Recall(想起): 4つの検索戦略を並列実行
    • セマンティック検索(ベクトル類似度)
    • キーワード検索(BM25完全一致)
    • グラフ検索(エンティティ/時間/因果リンク)
    • 時間範囲フィルタリング
    • 結果はReciprocal Rank FusionとCross-Encoderリランキングモデルで統合・順位付け
  • Reflect(振り返り): 既存の記憶を深く分析し、新しい洞察や接続を生成

対応LLMプロバイダー

HINDSIGHT_API_LLM_PROVIDER 環境変数で以下を指定可能:

  • OpenAI
  • Anthropic
  • Gemini
  • Groq
  • Ollama
  • LM Studio
  • MiniMax

デプロイオプション

  • Docker単体: 内蔵PostgreSQLを使用(データは $HOME/.hindsight-docker にマウント)
  • Docker Compose: 外部PostgreSQLと連携
  • Python組み込み: hindsight-all パッケージでサーバーレス実行可能
  • Hindsight Cloud: マネージドクラウドサービスも提供

SDK・クライアント

  • Python SDK (hindsight-client)
  • Node.js / TypeScript SDK (@vectorize-io/hindsight-client)
  • REST API
  • CLI

ベンチマーク性能

LongMemEvalベンチマーク(会話型AIの長期記憶を評価する標準テスト)で最高スコアを達成。バージニア工科大学Sanghani Center for AI and Data Analyticsおよびワシントン・ポストが独立再現済み。

ユーザーごとのメモリ分離

Retain操作時にカスタムメタデータを付与することで、ユーザー単位でメモリを分離・フィルタリング可能。マルチテナント対応のチャットボットやパーソナライズドエージェントに適している。

LLM Wrapper統合

既存のLLMクライアントをHindsightのLLM Wrapperに置き換えるだけで(2行のコード変更)、記憶の保存と検索が自動的に行われる。

コーディングエージェント向けドキュメントスキル

Claude Code、Cursorなどのコーディングアシスタントから npx skills add コマンドでドキュメントを直接参照可能。

ライセンス

MITライセンス(商用利用可能)

インストール・クイックスタート

Docker(推奨)

export OPENAI_API_KEY=sk-xxx

docker run --rm -it --pull always -p 8888:8888 -p 9999:9999 \
  -e HINDSIGHT_API_LLM_API_KEY=$OPENAI_API_KEY \
  -v $HOME/.hindsight-docker:/home/hindsight/.pg0 \
  ghcr.io/vectorize-io/hindsight:latest

クライアントのインストール

# Python
pip install hindsight-client -U

# Node.js
npm install @vectorize-io/hindsight-client

Pythonでの基本的な使い方

from hindsight_client import Hindsight

client = Hindsight(base_url="http://localhost:8888")

# 記憶を保存
client.retain(bank_id="my-bank", content="AliceはGoogleでソフトウェアエンジニアとして働いている")

# 記憶を検索
client.recall(bank_id="my-bank", query="Aliceは何をしている?")

# 振り返り分析
client.reflect(bank_id="my-bank", query="Aliceについて教えて")

サーバー不要のPython組み込みモード

pip install hindsight-all -U

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ

AIエージェントの構築・連携・実行をまるごとカバー!Python&.NET対応のマルチエージェント基盤 — agent-framework

microsoft/agent-frameworkPython8.8k

Microsoft Agent Frameworkは、AIエージェント(自律的に考えて行動するAIプログラム)を作り、複数のエージェントを連携させて複雑な仕事をこなすワークフローを構築するためのフレー

コード変更ほぼゼロでAIエージェントを強化学習で鍛える!どのフレームワークでもOK — agent-lightning

microsoft/agent-lightningPython16.4k

Agent Lightningは、AIエージェント(自律的にタスクをこなすAIプログラム)を強化学習(試行錯誤から学ぶ手法)で訓練するためのMicrosoft製ツールです。最大の特徴は、既存のAIエー

AIエージェントの「脳」を丸ごと管理!ファイルシステム発想のコンテキストDB — OpenViking

volcengine/OpenVikingPython14.7k

OpenVikingは、AIエージェント(自律的にタスクをこなすAIプログラム)が必要とする「記憶」「資料」「スキル」をまとめて管理できるオープンソースのコンテキストデータベースです。パソコンのフォル

Stripe・Ramp・Coinbaseが社内で作ったAIコーディングエージェントをオープンソースで再現 — open-swe

langchain-ai/open-swePython7.8k

Open SWEは、組織内部で使えるAIコーディングエージェント(プログラムを自動で書いてくれるAIアシスタント)を構築するためのオープンソースフレームワークです。SlackやLinear(タスク管理

AIコーディングアシスタントを170種の専門家に変身させるスキルパック — claude-skills

alirezarezvani/claude-skillsPython3.7k

claude-skillsは、Claude Code・OpenAI Codex・Gemini CLIなどのAIコーディングエージェントに「専門家の知識」を追加できるプラグイン集です。エンジニアリング、