Google DeepMindは2026年6月24日(現地時間)、生成AIモデル「Gemini 3.5 Flash」に、エージェントが複数のプラットフォームを横断して操作できる「computer use」機能をネイティブに統合したと発表した。この機能は、これまでスタンドアロンモデル「Gemini 2.5」で提供されていたものが、今回のアップデートでメインの「Gemini Flash」モデルに直接組み込まれた。
今回の統合により、開発者はGemini 3.5 Flashを活用して、ブラウザ、モバイル、デスクトップ環境で認識、推論、アクションを実行するカスタムエージェントの構築が可能になる。これにより、長期間にわたるエンタープライズ自動化タスク、例えば継続的なソフトウェアテストや、専門アプリケーションでの知識作業のパフォーマンス向上に寄与することが期待される。開発者や企業は、「Gemini API」およびGemini Enterprise Agent Platformを通じて、Gemini 3.5 Flashでの「computer use」の利用を開始できる。
安全対策として、「Google DeepMind」は、ライブ環境で動作するエージェントに対するプロンプトインジェクションのリスクを軽減するため、Gemini 3.5 Flashの「computer use」機能にターゲットを絞った敵対的訓練を導入している。さらに、企業向けには2つのオプションのセーフガードシステムを提供。これらは、機密性の高いアクションや元に戻せないアクションに対して明示的なユーザー確認を要求する機能と、間接的なプロンプトインジェクションが特定された場合にタスクを自動的に停止する機能である。「Google DeepMind」は、これらの機能と安全なサンドボックス化、human-in-the-loop検証、厳格なアクセス制御を組み合わせて使用することを推奨している。
参考: DeepMind Blog — 2026年6月24日 09:00 (JST)
原文ハイライト"Introducing computer use in Gemini 3.5 Flash"