arXiv cs.MAは2026年6月17日(現地時間)、データ統合における課題解決を目的としたシステム「Data Intelligence Agents (DIA)」を発表した。DIAは、データオーナー、エンジニア、アナリスト間の繰り返される非効率なデータ引き渡しによってボトルネックとなっていた、本番環境の企業データ統合プロセスを効率化する。
データインテリジェンスエージェント (DIA) は、Data Interpreter「Schema Creator」「Query Generator」の3つのエージェントで構成される。このシステムは、自律コーディングエージェント (Autonomous Coding Agents、ACAs) を第一級の抽象化として扱い、テキスト出力にとどまらず、具体的な成果物を生成、実行、検証、修復する機能を備える。また、経験を再利用するために共有メモリを活用し、生成された成果物はドメインエキスパートによるレビューを受ける。
DIAはエンタープライズ顧客向けに本番環境で展開されている。今回の研究では、特にクエリジェネレーター (Query Generator) を深く掘り下げて評価した。クエリジェネレーターは、4つのタスクカテゴリと4つのSQL方言にわたる7つのSQLベンチマークにおいて、完全自律モードで検証された。その結果、これまでに公開された最高水準の結果に匹敵するか、それを上回る性能を示した。
本論文の著者には、Anoushka Vyas、Aarushi Dhanuka、Sina Khoshfetrat Pakazad、Henrik Ohlssonの各氏が名を連ねる。彼らは、実行に基づき、ACAsと共有メモリ上に構築されたアーキテクチャが、自然言語の指示に限定された適応でデータインテリジェンスワークロード全体に一般化することを示している。
参考: arXiv cs.MA — 2026年6月18日 02:45 (JST)
原文ハイライト"Interpreting, Modeling, and Querying Enterprise Data via Autonomous Coding Agents"