OpenAIは2026年6月22日(現地時間)、セキュリティ企業Doppel (ドッペル) がGPT-5を活用したAI防御システムにより、フィッシング詐欺やブランドなりすましといった攻撃を拡散前に阻止している事例を公開した。Doppelのシステムは、アナリストのワークロードを80%削減し、脅威対応時間を数時間から数分に短縮したと報告されている。
Doppelのシステムは、OpenAIのGPT-5とo4-miniモデルを基盤とし、社会工学的な脅威を検出、分類し、自律的に排除する。これにより、脅威対応能力は3倍に向上した。同社共同創設者兼CTOのラフル・マドゥルリ (Rahul Madduluri) 氏は、生成ツールにより攻撃者が無限のバリアントを生成できるようになった状況において、迅速な対応が不可欠であると指摘している。
Doppelは、強化型ファインチューニング (RFT) を使用してモデルの一貫性を向上させた。RFTは人間のフィードバックを採点済みの事例として利用し、モデルがより一貫性のある、説明可能な意思決定を行うように学習させる。これにより、脅威の分類においてアナリストの判断に依存することなく、高い一貫性を実現した。
同社のパイプラインは、数百万のドメイン、URL、アカウントを毎日処理する。ヒューリスティクスとo4-miniモデルでノイズを除去し、GPT-5プロンプトで脅威の確認を行う。その後、RFTバージョンのo4-miniが脅威を「悪意ある」「良性」「曖昧」に分類し、GPT-5が決定を検証し自然言語での正当化を生成する。信頼度が高い場合、システムは自動で排除措置を開始し、信頼度が低い場合は人間のアナリストに回送される。
自動で排除された脅威に対しては、AIが生成した理由が提供され、顧客はアクションの背景を即座に把握できる。これにより、組織は迅速に対応し、社内外のステークホルダーに決定を説明することが可能となり、信頼性が向上する。
Doppelはフィッシングやなりすましドメインでのほぼ完全な自動化を達成しており、今後ソーシャルメディアや有料広告など他のチャネルにもこのモデル駆動型フレームワークを適用する計画である。
参考: openai.com (アーカイブ) — 2026年6月23日 13:00 (JST)
原文ハイライト"Doppel’s AI defense system stops attacks before they spread"