ContextRAGを発表、LLM不要なグラフ構築でRAGの効率化とコストを大幅削減

Roman Prosvirnin氏、Sergei Kuznetsov氏、Seungmin Jin氏らは2026年5月19日(現地時間)、学術論文リポジトリarXivに掲載された論文で、Retrieval-Augmented Generation（RAG）システム「ContextRAG」を発表した。このシステムは、大規模言語モデル（LLM）を用いてエンティティや関係を抽出するプロセスを不要とし、グラフ構造を直接構築することで、インデックス作成時に発生するトークンコストおよび実時間コストの大幅な削減を実現する。

多くのグラフ構造RAGシステムは、インデックス作成の過程でLLMを用いてエンティティ、関係、要約を抽出しており、この手法がコーパスサイズに比例してコストを増大させるという課題を抱えている。

ContextRAGは、この課題に対し、residual-quantization k-meansとLukasiewicz residuated logicを伴うFormal Concept Analysisを用いることで、チャンク埋め込み上にファジーな概念グラフを導出する。これにより、ブリッジライクおよびミート派生コンテキストノードは、LLMが作成するグラフエッジに依存せず、ソフトファジー結合およびミート操作によって誘導される仕組みとなっている。

性能評価では、130タスクのUltraDomainサブセットにおいて、ContextRAGはわずか30回のLLM呼び出しと22,073トークンでインデックスを構築した。これに対して、HiRAGの再現ストレステストでは、20タスクサブセットでグラフ構築中に失敗するまでに870回のインデックス作成呼び出しと3.54Mトークンを要したことが示された。この結果を130タスクに線形外挿すると、HiRAGでは23Mトークン以上のインデックス作成が必要になると推測される。ContextRAGは、全体で33.6%のF1スコアを達成し、特にmulti-hopタスクでは36.8%のF1スコアを記録した。さらに、アクティベーション分析から、上位5つで少なくとも1つの格子派生ノードを検索するクエリが、そうでないクエリと比較してF1スコアを3.9パーセンテージポイント向上させることが示された。この関連性は診断的なものであり、因果的なものではない。

参考: arXiv cs.CL (アーカイブ) — 2026年5月19日 21:08 (JST)