Zongsheng Cao氏らは2026年6月11日(現地時間)、大規模言語モデル (LLM) ベースの研究エージェント向けに、科学的知識のオーケストレーションを改善する新たなパイプライン「Agents-K1」を発表した。生文書からエージェントネイティブな科学的知識グラフを構築するエンドツーエンドのシステムとして開発され、既存手法が抱える課題の解決を目指している。このパイプラインは、科学的発見の効率化に資する試みである。
Zongsheng Cao氏らがarXiv cs.AIで公開した論文 Agents-K1: Towards Agent-native Knowledge Orchestration によると、近年の大規模言語モデル (LLM) の進化は、科学研究の自動化に応用できるとされている。しかし、これらのモデルが活用する既存の知識グラフは、しばしば汎用的なドメインに特化しており、科学分野における複雑な情報構造や推論要求には十分に適合していないという課題が指摘されてきた。特に、研究エージェントが自律的に科学的知識を効率的に収集、整理、利用するための「エージェントネイティブ」な知識オーケストレーション手法は未開拓な領域とされてきた。
「Agents-K1」は、この課題を解決するために設計された包括的なパイプラインである。その核心をなすのは、三つの主要なコンポーネントだ。一つ目は、マルチモーダルパーサー。これは論文などの科学文書から、エンティティ、それらを裏付ける証拠、引用関係、さらにはエンティティ間の複雑な関係性を効率的に捕捉する役割を担う。単なるテキスト情報だけでなく、図表や画像といったマルチモーダルな情報源からも知識を抽出することを目指している。
二つ目は、ルールベースの報酬によって学習された4B情報抽出バックボーンである。これは、抽出された情報を整理し、構造化された知識へと変換する中核的なエンジンだ。高度な機械学習技術とドメイン固有のルールを組み合わせることで、精度の高い情報抽出を実現し、知識グラフの品質を向上させる。このバックボーンは、科学論文特有の専門用語や表現を理解し、その文脈から正確な情報を引き出す能力を持つ。
三つ目は、graphanything CLI。これは、構築された知識グラフを最大限に活用するためのインターフェースであり、ウェブ検索、マルチモーダルグラフ検索、そして文書間の横断的な検索機能を統合している。研究エージェントは、このCLIを通じて、必要とする科学的情報を効率的に探索し、複雑な推論タスクを実行することが可能となる。
このパイプラインを用いて、著者らは広範な科学論文を処理し、大規模な科学知識グラフ「Scholar-KG」を生成した。具体的には、6つの主要な主題にわたる246万件もの科学論文が処理対象となり、そこから「Scholar-KG」が構築された。このうち、100万論文のサブセットがすでに一般に公開されており、研究コミュニティがこの豊富な知識資源を利用できるようになっている。フルバージョンの「Scholar-KG」へのアクセスは、SCPリンクを通じて提供されるとされている。実験による検証では、「Agents-K1」が、科学情報抽出、知識グラフ構築、さらには複数の情報を繋ぎ合わせるマルチホップ科学的推論において、既存手法と比較して優れた性能を示すことが実証された。
開発チームは、「Agents-K1」の応用範囲が科学分野にとどまらない可能性も示唆している。汎用ドメインのコーパスや特定のスキーマに準拠したデータ合成にもこのパイプラインを応用できるとしており、幅広い分野での知識管理と自動化に活用できる可能性があるとしている。
参考: arXiv cs.AI — 2026年6月12日 02:58 (JST)