長期探索エージェント効率化へ、文脈管理「コンテキスト・リアクト」発表

Yijun Lu氏らの研究チームは2026年5月6日(現地時間)、長期にわたる探索エージェント向けに、新しい文脈オーケストレーション手法「コンテキスト・リアクト（Context-ReAct）」と、それに基づくエージェント「ロングシーカー（LongSeeker）」を発表した。この手法は、エージェントが推論、ツール使用、情報観察を行う際に、急速に増加する作業文脈を適応的に管理することを目的としている。計算コストの増加や誤情報生成のリスクを低減し、探索エージェントの効率と信頼性向上を目指す。

長期探索エージェントが効率的に機能するには、推論過程で生成される中間コンテンツの管理が重要とされている。研究チームは、文脈の関連性に応じて情報の詳細度を調整する、適応型文脈管理の必要性を提唱した。

この原則に基づき、推論、文脈管理、ツール利用を統一ループに統合するエージェントパラダイムとして「コンテキスト・リアクト」を導入した。コンテキスト・リアクトは、Skip、Compress、Rollback、Snippet、Deleteの5つの原子操作を提供し、これによりエージェントは作業文脈を動的に再構築できる。これらの操作により、重要な証拠の保持、解決済み情報の要約、不要な分岐の破棄、文脈サイズの制御が可能となる。Compress（圧縮）演算子は表現的に完全であり、他の特殊化された演算子は効率性と忠実性を保証し、生成コストとハルシネーション（誤情報生成）のリスクを低減する。

このパラダイムを基に「ロングシーカー」が開発された。ロングシーカーは、Qwen3-30B-A3Bをベースに1万の合成軌跡でファインチューニングされた長期探索エージェントである。4つの代表的な探索ベンチマークにおいて、ロングシーカーはBrowseCompで61.5%、BrowseComp-ZHで62.5%の性能を達成した。これは、Tongyi DeepResearch（BrowseCompで43.2%、BrowseComp-ZHで46.7%）やAgentFold（BrowseCompで36.2%、BrowseComp-ZHで47.3%）を大幅に上回る結果となった。これらの成果は、エージェントが能動的に作業記憶を形成することで、より信頼性が高く効率的な長期推論を達成できる可能性を示すものとされている。

参考: arXiv cs.AI — 2026年5月7日 02:54 (JST)