AutoMem、大規模言語モデルのメモリ管理を自動学習

arXiv cs.AIが2026年7月1日(現地時間)に公開した論文によると、シェングアン・ウー (Shengguang Wu) 氏らは、大規模言語モデル (LLMs) のメモリ管理を自動で学習するフレームワーク「AutoMem」を発表した。これは、認知科学におけるメタメモリ (metamemory) の概念をLLMsに適用し、メモリ管理を訓練可能なスキルとして扱うもので、長期間にわたるタスクにおけるLLMsのパフォーマンスを大幅に向上させるという。

メモリ管理は学習可能なスキルであり、AutoMemはこの視点をLLMsに導入する。本フレームワークでは、ファイルシステム操作をタスクアクションと同等の第一級メモリ管理アクションとして扱い、モデル自身がメモリを管理する方法を決定する。

メモリ管理スキルの向上には、プロンプト、ファイルスキーマ、アクション語彙などの「構造」と、モデルがスキルを実行する「熟練度」の二つの軸がある。しかし、数千ステップに及ぶ長期間タスクのエピソードにおいて、一つのメモリミスが表面化するまでに長い時間がかかるため、これらの軸の手動最適化は非現実的だった。

AutoMemはこれら二つの軸の自動最適化を実現する。第一のループでは、強力なLLMがエージェントの完全な軌跡をレビューし、エージェントがメモリファイルと相互作用する方式を形成するメモリ構造を反復的に改訂する。第二のループでは、多数のエピソードからエージェントの優れたメモリ決定を特定し、これを訓練シグナルとして利用し、モデルのメモリ熟練度を直接高める。

Crafter、MiniHack、NetHackの三つの手続き的に生成された長期間ゲームにおいて実験が行われた。その結果、モデルのタスクアクションの振る舞いを変更せずにメモリ管理のみを最適化することで、ベースエージェントのパフォーマンスが約2倍から4倍向上した。この性能改善により、32Bのオープンウェイトモデルが、Claude Opus 4.5やGemini 3.1 Proといった最先端システムと競争可能なレベルに達することが示された。

参考: arXiv cs.AI (アーカイブ) — 2026年7月2日 02:57 (JST)