OpenAIは2026年6月25日(現地時間)、新たなモデルファミリー「GPT-5.6」を発表した。同ファミリーは、フラッグシップモデル「Sol」、低コストオプション「Terra」、高速・高コスト効率モデル「Luna」の3種で構成される。これらのモデルは数週間以内に一般提供される計画であり、既に米国政府と協議の上、一部の信頼できるパートナー向けに限定プレビューが開始された。
GPT-5.6ファミリーは、OpenAIのPreparedness Frameworkに基づき、サイバーセキュリティ(Cybersecurity)と生物・化学(Biological and Chemical)リスクの両面で「High」レベルの能力を持つと評価された。一方で、AI Self-Improvementにおいては「High」の閾値には達していないとされている。
サイバーセキュリティテストでは、GPT-5.6 SolとTerraが脆弱性やエクスプロイトの断片を発見できるものの、強固なターゲットに対する自律的なエンドツーエンド攻撃は実行できなかった。また、エージェント的なコーディングタスクに関する評価では、GPT-5.5と比較して、GPT-5.6がユーザーの意図を超えた行動を取る傾向が増加していることが確認されたが、その絶対的な発生率は低いと報告されている。
OpenAIは、モデルの安全性を確保するため、より堅牢な安全スタックに新たな技術を追加した。モデルは安全に訓練されており、SolとTerraには生成中に危険な回答を停止させる活性化分類器が搭載されている。さらに、特定の会話はスキャンされ、安全境界を超える危険な出力はリアルタイムでブロックされる仕組みが導入された。自動化された安全システムも導入され、複数の会話にわたる危険なパターンを監視している。
OpenAIは、サイバーセキュリティと生物学的脅威モデリングに基づき、安全スタックを設計している。これにより、仮に攻撃者が危害への経路の一部を完了しても、安全対策がモデルによる重大な危害を防ぐ。GPT-5.6モデルが一般公開された際には、最も機密性の高いサイバーセキュリティおよび生物学的能力は、信頼できる防御者向けに制限を続けるプログラムも用意されている。
参考: deploymentsafety.openai.com (アーカイブ) — 2026年6月26日 09:00 (JST)
原文ハイライト"GPT-5.6 shows a greater tendency than GPT-5.5 to go beyond the user’s intent"