arXiv、エージェント型サーチ向け新手法「DivInit」発表—初期クエリの多様化で性能改善

arXivは2026年6月16日(現地時間)、エージェント型サーチ (Agentic Search) における標準的な並列サンプリング手法が抱える課題を解決する新手法「DivInit」に関する論文を公開した。本研究は、大規模言語モデル (LLMs) の推論時スケーリングを拡大するAgentic Searchの有効性を高めることに焦点を当てている。DivInitは、初期クエリの冗長性による収益逓減を、最初のターンで多様なシードクエリを選択することで解消し、探索効率を改善する。

エージェント型サーチ (Agentic Search) は、大規模言語モデル (LLMs) が与えられたタスクに対してクエリを反復的に改善し、関連情報を検索することで性能を向上させるアプローチである。これは、特に複雑な推論や事実検証が必要な場面でLLMsの能力を拡張するために注目されている。しかし、これまでAgentic Searchの性能と堅牢性を高めるために広く用いられてきた標準的な並列サンプリング手法には、効率面での限界が指摘されていた。

標準的な並列サンプリングでは、複数のロールアウト（試行経路）でLLMsが生成する最初のクエリが互いに類似してしまう傾向がある。この初期クエリの冗長性は、結果として重複する証拠が検索される原因となり、後続のターンでLLMsがこの共有された限定的な情報に強く影響されてしまう。これにより、多様な探索経路が阻害され、効率の低下や最適解への到達が困難になるという課題があった。

「DivInit」は、この問題を解決するために設計された、最初のターンにおける訓練不要の介入手法である。標準的な並列サンプリングがk個の独立した最初のクエリを無作為にサンプリングするのに対し、DivInitは異なるアプローチを採用する。具体的には、単一のモデル呼び出しからn個の多様な初期クエリ候補を引き出す。その後、これらのn個の候補の中から、情報量が多く互いに異なるk個のシードクエリを選び出す。これらの選ばれたk個の多様なシードが、それぞれの並列トラジェクトリ（探索経路）の出発点として機能する。この手法により、各ロールアウトの初期段階から多様な視点と情報を導入することが可能となり、クエリの冗長性が大幅に低減される。

この研究では、DivInitの有効性を検証するため、5つのオープンウェイトモデルと8つの異なるベンチマークにおいて広範な実験を実施した。評価の結果、DivInitは標準的な並列サンプリングと比較して一貫した性能改善を示した。特に、同等の計算リソースを用いる条件下で、マルチホップ質問応答 (multi-hop QA) のスコアを平均で5〜7ポイント向上させることに成功している。この改善は、Agentic Searchの効率と精度向上に重要な意義を持つ結果と評価されている。研究のコードは、学術コミュニティが手法を再現し、さらに発展させる目的でオンラインにて公開されている。

DivInitが訓練不要な介入手法である点は、実用化の観点から特に注目に値する。これは、既存のAgentic Searchフレームワークに容易に組み込める利点を持つと見られる。システム設計者がLLMsの能力をより手軽に、かつ効率的に引き出すことを可能にし、より堅牢で多様な探索が求められる複雑な意思決定システムや情報抽出システムへの応用可能性を広げると期待される。本手法は、エージェント研究分野における推論時性能向上の競争において、低コストかつ高効果なアプローチとして重要な位置を占める可能性がある。

参考: arXiv cs.AI — 2026年6月17日 13:00 (JST)