Microsoft Researchは6月29日(現地時間)、AIエージェント向けの新たなスケーラブル記憶システム「メモラ (Memora)」を発表した。メモラは、長期にわたるタスクにおいてAIエージェントの生産性を大幅に向上させるもので、記憶内容の保存方法と検索方法を分離することで、抽象性と具体性のバランスを実現する。既存システムと比較し、最大98%のコンテキストトークン削減を達成したと報告されている。

現在のAIエージェントは過去のインタラクションを記憶せず、関連情報を繰り返し供給するか、外部ソースから取得する必要があるため、タスクが長く複雑になるにつれて非効率性が増す。メモラ (Memora) は、長期にわたるタスクでエージェントの能力を拡張するため、情報保持とアクセスを効率化するスケーラブルな記憶システムとして開発された。

メモラは、豊富な記憶コンテンツと軽量な抽象化・キューアンカーといった検索方法を分離するという中心的な思想に基づいている。これにより、具体的な詳細を保持しながらも、効率的に記憶を整理・検索することが可能になる。各記憶エントリは、その本質を捉える短いフレーズであるプライマリー・アブストラクション (primary abstraction)と、豊富なコンテンツを保持するメモリー・バリュー (memory value)の2つのコンポーネントで構成される。類似性検索にはプライマリー・アブストラクションのみが使用され、メモリー・バリューは直接検索されない。

さらにメモラは、記憶値から抽出されるコンテキストアウェアなタグであるキュー・アンカーズ (cue anchors)を通じて、同じ記憶への代替アクセスパスを提供する。これにより、エージェントは事前に定義されたオントロジーに縛られることなく、関連する記憶を柔軟にたどることが可能となる。

メモラは、LoCoMoおよびLongMemEvalの二つの長文コンテキストベンチマークにおいて、新たな最高性能を確立した。Mem0、RAG、フルコンテキスト推論などを上回る性能を発揮している。また、フルコンテキスト推論と比較して最大98%のコンテキストトークンを削減すると報告されている。メモラに関する論文は「ICML 2026」で発表され、関連コードはGitHubにて公開されている。

メモラの記憶内容と検索パスの分離設計は、AIエージェントアーキテクチャにおける長期記憶の効率性と柔軟性を高める。従来のRAGが外部知識の検索・参照に主眼を置くのに対し、メモラはエージェント自身の「長期記憶」の管理を最適化する。これにより、マルチモーダルや複雑なタスクチェーンを持つエージェントシステムにおいて、コンテキストウィンドウの制約を緩和し、一貫した意思決定と行動を可能にする技術基盤となり得る。


参考: Microsoft Research Blog (アーカイブ) — 2026年6月30日 06:14 (JST)

原文ハイライト

"A Harmonic Memory Representation Balancing Abstraction and Specificity"

この記事をシェア
X はてブ LinkedIn