Google (グーグル) は2026年5月19日(現地時間)、年次開発者会議Google I/Oにおいて大規模言語モデル「Gemini (ジェミニ) 3.5 Flash」を発表した。同モデルはプレビュー版なしで一般提供が開始され、Geminiアプリ、Google SearchのAI Mode、開発者向けGoogle Antigravityなど、主要製品群に幅広く統合される見通しだ。一方で、従来のFlashファミリーモデルと比較して価格が大幅に上昇している点が注目される。
Gemini 3.5 FlashのモデルIDはgemini-3.5-flashであり、知識カットオフは2025年1月とされている。このモデルは1,048,576入力トークンと65,536最大出力トークンをサポートする。
Google (グーグル) は現在ベータ版としてInteractions APIの提供も推進している。このAPIは、OpenAI (オープンエーアイ) のResponsesによって導入されたパターン、特にサーバーサイドの履歴管理と類似していると、情報源の筆者は指摘している。
価格設定に関して、Gemini 3.5 Flashは従来のモデルと比較して大幅に高額になった。Gemini 3 Flash Previewの3倍、Gemini 3.1 Flash-Liteの6倍の価格で提供される。具体的には、100万入力トークンあたり1.50ドル、100万出力トークンあたり9ドルに設定されており、これはGoogleのGemini 3.1 Proの価格(2ドル、12ドル)に近づいている。Geminiチームは「来月」Gemini 3.5 Proを展開する予定で、その価格はさらに高くなると予想されている。
これは業界全体のトレンドに合致しており、GPT-5.5はGPT-5.4の2倍、Claude Opus (クロード・オーパス) 4.7は4.6の約1.46倍の価格設定となっている。Artificial Analysis (アーティフィシャル・アナリシス) が公開しているベンチマーク実行コストによると、Gemini 3.5 Flash(高設定)は1,551.60ドルであり、Gemini 3.1 Pro Previewの892.28ドルを大幅に上回る。他のベンダーのモデルでは、Claude Opus 4.7 (Adaptive Reasoning, Max Effort) が5,117.14ドル、GPT-5.5 (xhigh) が3,357.00ドルと報告されている。
Googleが多くの無料の消費者向け製品にこの高価格モデルを展開していることは注目に値する。主要な3つのAIラボ全てが、API顧客の価格許容度を試す段階に入っていると、情報源の筆者は見ている。
参考: Simon Willison’s Weblog — 2026年5月20日 07:40 (JST)
原文ハイライト"Gemini 3.5 Flash: more expensive, but Google plan to use it for everything"