Cognitionは2026年6月28日(現地時間)、複数モデルを統合する新しいハーネス「デビン・フュージョン (Devin Fusion)」を発表した。同技術は、フロンティアモデルとコスト効果の高いモデルを並行して稼働させることで、フロンティアモデル単体と同等の性能を維持しながら、コストを最大35%削減する。同社が新たに定義したコーディングベンチマーク「フロンティアコード (FrontierCode)」において、その性能と費用対効果が確認された。
デビン・フュージョンは、フロンティアモデル(意思決定・計画)と、よりコスト効果の高い「サイドキック」モデル(反復実行)という2つの並行エージェントを稼働させる「サイドキック」アプローチを基盤としている。メインエージェントは主要な意思決定、あいまいさの解釈、最終レビューを担当し、サイドキックモデルに特定のタスクを委譲する。このアプローチにより、既存のモデルルーティングにおけるベンチマーク過学習や単一プロンプトタスクへの限定的な対応といった課題を解決できるとしている。
また、セッション中に動的にモデルを切り替える動的なセッション中ルーティング (Dynamic Mid-Session Routing)も導入されている。タスクのタイプや複雑性に応じてメインエージェントやサイドキックモデルを変更し、さらに実行中にモデルのアップグレードを行うことも可能だ。これは、コンテキストの圧縮時にモデル切り替えを行うことで、キャッシュミスのコストを発生させずに実現される。
フロンティアコードのベンチマーク結果によると、デビン・フュージョンはオーパス 4.8 (Opus 4.8)やGPT-5.5といったフロンティアモデルと比較して、性能を維持しつつコストを35%削減した。特にフェイブル 5 (Fable 5)と組み合わせた場合、純粋なフェイブル 5ハーネスと比較して41%のコスト削減を達成したとしている。これは、フェイブル 5がマルチエージェント設定においてタスクの委譲やコンテキスト要求をより効率的に行うためと説明されている。
参考: cognition.com (アーカイブ) — 2026年6月29日 09:00 (JST)