OpenAIは2026年5月14日(現地時間)、DatabricksがGPT-5.5をエンタープライズエージェントワークフローに導入したことを発表した。このモデルは、Databricksが複雑な企業エージェントタスク向けに開発したベンチマークであるOfficeQA Proで、新たな最高水準の性能を確立した。Databricksは、この成果を受け、顧客向けのエージェントワークフローでGPT-5.5の提供を開始する。
OfficeQA Proは、スキャンされたPDF、レガシーファイル、長文コンテキスト文書などを含むワークフローにおける解析、検索、および根拠に基づく推論といったモデルの処理能力を評価する。これらのタスクは、従来の生産エージェントシステムではしばしば問題を引き起こしていた。
エージェントハーネス設定における評価では、GPT-5.5は以前のモデルであるGPT-5.4と比較してエラーを46%削減した。また、OfficeQA Proで精度50%を超える最初のモデルとなった。研究エンジニアのArnav Singhvi氏は、CodexとGPT-5.5の組み合わせが、全てのエージェントおよびモデルの中で最高水準の性能を示すようになったと述べた。
Databricksは、GPT-5.5が特に解析を多く含むワークフローにおいて大きな性能向上を見せたと報告している。Singhvi氏は、以前のモデルであるGPT-5.4が全ての数字を正確に解析できなかったのに対し、GPT-5.5は古い文書やスキャンされたPDFの解析において飛躍的な進歩を示したと説明した。また、マルチステップタスクにおけるオーケストレーション能力も向上し、GPT-5.5は以前のモデルと比較して、関連コンテキストの検索や複雑なワークフローの完了において、追加の監視なしでより高い信頼性を示した。
Databricksは現在、AI Unity Gatewayを通じてGPT-5.5を提供している。顧客はAgentBricksとAgent Supervisor APIで構築されたワークフロー内でこのモデルを利用できる。これらのシステムにおいて、GPT-5.5は専門化されたエージェント全体で解析、検索、実行をオーケストレーションする役割を担う。
参考: OpenAI Blog — 2026年5月15日 00:00 (JST)
原文ハイライト"GPT‑5.5 set a new state of the art on OfficeQA Pro"