Googleは5月20日(現地時間)、「Google I/O 2026」で生成AIモデル「Gemini」ファミリーの主要な強化を発表した。新モデル「Gemini 3.5 Flash」は高速応答とマルチモーダル理解を強化し、推論・コーディング性能を維持する。また「Gemini Omni」はテキスト、画像、音声、既存ビデオから編集可能なビデオを生成する。同社はさらに、Geminiアプリのインターフェース刷新も明らかにした。
Googleは、新モデルであるGemini 3.5 Flash (ジェミニ3.5フラッシュ)について、複数のコーディングおよびエージェント関連のベンチマークにおいてGemini 3.1 Pro (ジェミニ3.1プロ)の性能を上回り、マルチモーダル理解を強化したと説明している。このモデルは、長時間のワークフロー、サブエージェントの展開、対話型UIの生成に対応可能とされる。Gemini 3.5 Flashは既にGeminiアプリ (ジェミニアプリ)およびGoogle検索のAI Mode (AIモード)で展開が開始されている。また、Gemini 3.5 Pro (ジェミニ3.5プロ)も現在開発中で、来月のローンチが予定されている。
Gemini Omni (ジェミニオムニ)は、テキストからビデオを生成するVeo (ベオ)とは異なり、テキストプロンプトを用いてシーン、キャラクター、視覚要素の修正に対応する。モデルは動き、重力、流体挙動といった現実世界の物理法則の理解を向上させ、より現実的な出力を目指す。Googleは、悪用懸念への対策として、Gemini Omniが出力するコンテンツにSynthID (シンセID)デジタル透かしを付与すると発表した。最初のバージョンであるGemini Omni Flash (ジェミニオムニフラッシュ)は本日よりGeminiアプリ、Google Flow (グーグルフロー)、YouTube Shorts (ユーチューブショーツ)を通じて展開が開始されている。YouTube Shortsユーザーは無料でアクセスできる一方、GeminiアプリとFlowのサポートはGoogle AI Plus (グーグルAIプラス)、Pro (プロ)、Ultra (ウルトラ)の加入者に限定される。
新モデルに加え、GoogleはGeminiアプリのインターフェースをNeural Expressive (ニューラルエクスプレッシブ)と呼ぶ新しいデザインに刷新した。このアップデートでは、Android (アンドロイド)、iOS (アイオーエス)、ウェブ版アプリ全体で新しいアニメーション、タイポグラフィ、カラー処理、触覚フィードバックが導入される。さらに、Gemini Live (ジェミニライブ)が拡張され、ユーザーは会話中に音声入力とテキスト入力をシームレスに切り替えることが可能となる。応答もより視覚的になり、Geminiはタイムライン、対話型グラフィックス、ナレーション付き説明、リッチなメディアベースの出力を生成できるようになった。
参考: digit.in — 2026年5月20日 02:45 (JST)