nokiapoweruser.comは2026年5月17日(現地時間)、Googleが5月19日開始のGoogle I/O 2026でAI関連の新機能を複数発表する可能性を報じた。リーク情報によると、同社のAIモデルGeminiは、従来のチャットボットから、アプリ、ブラウザ、Androidデバイス、ノートPC向けのAIオペレーティングレイヤーへと進化するという。主要な発表候補として、ビデオ生成・編集を統合する「Gemini Omni (ジェミニ オムニ)」や、常時稼働のAIエージェント「Gemini Spark (ジェミニ スパーク)」などが挙げられている。
Google I/O 2026での発表が噂される機能の一つがGemini Omni (ジェミニ オムニ)である。これはGemini内にビデオ生成と編集機能を直接導入する可能性があり、AIビデオ生成、シーンリミキシング、AIアシスト編集、プロンプトベースのシネマティック作成、マルチモーダル編集ワークフローといった機能が含まれると見られる。また、Googleの高度なAIビデオ生成モデル「Veo (ヴェオ)」のメジャーアップグレードも予想されており、モーションのリアリズム、シーンの一貫性、プロンプト理解、オーディオ同期、長尺クリップ生成が向上するとされる。これらの機能はGemini Omni、YouTubeツール、Googleのクリエイターエコシステムと深く統合される可能性がある。
もう一つの主要な噂はGemini Spark (ジェミニ スパーク)で、一部のリークでは「Remy (レミー)」とも呼ばれている。これは、アプリ、メール受信トレイ、チャット、ブラウザ、ドキュメント、ウェブタスクにわたって機能する常時稼働のAIエージェントとして期待されている。伝統的なアシスタントとは異なり、Gemini Sparkはプロアクティブにワークフローを処理し、反復的なアクションを自動化する可能性があるという。具体的には、メールの要約と返信、タブやブラウジングセッションの管理、アプリ間の会話追跡、複数ステップのウェブタスクの実行、AndroidとChrome間の情報連携などが挙げられている。
Googleはまた、「Flash (フラッシュ)」モデルファミリーの拡張も進めていると見られ、Gemini 3.2 Flash (ジェミニ 3.2 フラッシュ)やGemini 3.5 Flash (ジェミニ 3.5 フラッシュ)といったモデルが噂されている。これらのバージョンは、応答速度の高速化、推論コストの低減、遅延の削減、効率的なモバイル展開、リアルタイムインタラクションを優先すると予想される。並行して、より高性能なGemini 3.5 Pro (ジェミニ 3.5 プロ)モデルも噂されており、高度な推論とコーディングタスクに焦点を当て、ソフトウェアエンジニアリング能力の向上、マルチステップ推論の強化、コンテキスト処理の改善、より正確な長文出力、ツール使用の高速化が期待される。
さらにSpark Robin (スパーク ロビン)という機能では、Gemini内でのよりリッチな視覚的インタラクションに焦点が当てられる可能性がある。ダイナミックな視覚的回答、インタラクティブな応答カード、リッチなUIレイアウト、画像強化の説明、コンテキスト認識型の視覚的要約などが含まれるとされている。内部参照されるTeamfood (チームフード)は、Geminiのメモリシステムの改善を示唆しており、持続的なユーザーコンテキスト、長期的な会話メモリ、クロスデバイス認識、パーソナライズされたタスクの継続性が期待される。Nano Banana 3 (ナノ バナナ スリー)に関する噂もあるが、完全にデバイス上での機能には不確実性も残る。
GoogleはI/Oに先立ち、主要なAIイニシアチブを複数明らかにしている。その一つであるGemini Intelligence (ジェミニ インテリジェンス)を搭載したノートPCプラットフォームGooglebook (グーグルブック)は、2026年秋に発売が期待されている。また、Google Chrome (グーグル クローム)へのGeminiの深い統合も進められている。これにはクロスアプリアクション、自動化されたブラウジング、AIタスク実行、ウェブ理解の強化が含まれる。Googleの戦略は、AIが単に質問に答えるだけでなく、アプリの操作、ウェブのナビゲート、メディア生成、長期的なコンテキスト理解、複数ステップタスクの完了、バックグラウンドでの継続的な作業を行う方向に集中していると見られる。
参考: nokiapoweruser.com — 2026年5月17日 13:40 (JST)