株式会社オブライト
AI2026-05-21

Gemini 3.5 Flash と Gemini Omni 徹底解説 — Google I/O 2026 が示した「単一マルチモーダル」と「Pro 超え Flash」の戦略転換

Google I/O 2026(2026年5月19日 PT)で発表された Gemini 3.5 Flash と Gemini Omni を徹底解説。Pro クラスを超えるベンチマーク・4倍の速度・100万トークン超のコンテキストを実現した Flash と、Veo・Imagen・Lyria を単一モデルに統合した Omni の戦略的意義、料金体系、日本企業の採用判断ポイントをまとめます。


TL;DR — 5つの要点

・Gemini 3.5 Flash は Gemini 3.1 Pro を複数ベンチマークで上回りながら、他フロンティアモデル比で出力速度が約 4 倍、価格は入力 $1.50 / 出力 $9.00(100万トークンあたり)と競争力がある ・入力コンテキスト 1,048,576 トークン(約 100 万)という業界最大級のウィンドウを持ち、長文書・大規模コードベース・長時間動画の一括解析が可能 ・Gemini Omni はテキスト・画像・音声・動画をひとつのモデルで横断処理し、Veo(動画生成)・Imagen(画像生成)・Lyria(音楽生成)・Nano Banana(リアルタイム音声)を単一アーキテクチャに統合 ・Omni Flash は 2026年5月19日から AI Plus / Pro / Ultra ユーザーへ展開、YouTube Shorts と YouTube Create では無料 ・Gemini 3.5 Pro は 2026年6月に AI Ultra から順次提供予定で、さらに高い推論能力が期待される

Gemini 3.5 Flash — 何が新しいか

Gemini 3.5 Flash は Google I/O 2026(2026年5月19日 PT)で発表された Gemini 3.5 ファミリーの第一弾です。従来は Pro クラスのモデルが達成していたベンチマークスコアを Flash サイズで実現した点が最大の特徴です。 主要ベンチマーク(Google Developers Blog より): ・Terminal-Bench 2.1:76.2% ・MCP Atlas:83.6% ・CharXiv Reasoning:84.2% これらはいずれも前世代の Gemini 3.1 Pro を上回る数値です。さらに他フロンティアモデルと比較した際の出力トークン速度は約 4 倍で、レイテンシが重要なリアルタイムアプリケーションや大量バッチ処理において圧倒的な優位性を持ちます。 コンテキストウィンドウは入力 1,048,576 トークン / 出力 65,536 トークンで、100万トークン超の入力は長大なコードベースや数時間の動画・数千ページの文書を一括で渡せることを意味します。 価格は100万トークンあたり入力 $1.50 / 出力 $9.00 で、キャッシュ入力は $0.15 と低コストです。展開先は Gemini アプリ・AI Studio・Antigravity・Gemini API・Google 検索 AI モードで、いずれも 2026年5月19日から利用可能です(9to5Googleppc.land)。 また同日発表された Google Antigravity 2.0 エージェントプラットフォームとの組み合わせにより、Gemini 3.5 Flash をバックエンドにした高速エージェントワークフローも即日構築できる環境が整いました。

Gemini Omni — 『単一マルチモーダル』の意味

Gemini Omni は blog.google の公式発表 において『Veo、Imagen、Lyria、Nano Banana を統合した単一マルチモーダルモデル』と説明されています。 これまでの Google AI は生成用途ごとにモデルが分散していました。動画生成なら Veo、静止画なら Imagen、音楽なら Lyria、リアルタイム音声なら Nano Banana というように、複数モデルを組み合わせてパイプラインを組む必要がありました。Gemini Omni はこの分断を解消し、ひとつのプロンプト空間でテキスト・画像・音声・動画を横断推論できます。 戦略的意義は大きく3点あります。 1. 一貫した意味理解:各モダリティを個別モデルが処理すると、モデル間でコンテキストが途切れます。単一モデルでは『動く映像のこのシーンに合った音楽を生成し、字幕テキストも付ける』という複合命令を意味的に統一した状態で実行できます。 2. 連続編集での物理整合とキャラクター一貫性:複数ターンにわたる編集でも同一モデルが全スレッドを保持するため、人物の顔・衣服・物理的な光源が異なるフレームで矛盾しません。これは動画広告・バーチャルアバター制作において実用上の大きな差別化要因です。 3. コスト・レイテンシの削減:複数の専用モデルを逐次呼び出すアーキテクチャに比べて、単一モデルへの単一リクエストで済むため、API コール数・転送コスト・レイテンシを削減できます。 Omni Flash は 2026年5月19日から AI Plus / Pro / Ultra ユーザー向けに Gemini アプリと Flow で展開が開始されており、YouTube Shorts と YouTube Create では無料で利用できます。

ユースケース — どの業務に使えるか

Gemini 3.5 Flash と Gemini Omni の組み合わせは、以下のような業務領域で即戦力になります。 【広告・マーケティング】 Omni を使えば、テキストブリーフから静止画バナー・30秒動画・BGM・ナレーション原稿を一括生成できます。ブランドガイドラインの画像を渡しながら『このトーンで夏向け動画を3本』という指示が通るのは、単一モデルがビジュアルトーンを記憶しているからです。 【動画制作・コンテンツ制作】 YouTube Creators は Omni Flash を無料で利用でき、ショート動画の台本→サムネイル→エンドカード→BGM までワンフローで制作できます。 【チャットボット・カスタマーサポート】 Gemini 3.5 Flash の高速処理(他フロンティア比 4 倍)は、リアルタイム応答が求められるチャットボットに適しています。100万トークンのコンテキストにより、製品マニュアル全体・過去の問い合わせ履歴・社内 FAQ を丸ごと渡すことができます。AI コンサルティング の観点では、導入後の運用コストを抑えつつ高品質な回答精度を維持できる点が評価ポイントです。 【社内アシスタント・ナレッジ管理】 大量の社内文書(稟議書・会議録・設計書など)を一括でコンテキストに投入し、横断的な質問に答えさせるナレッジ管理基盤として活用できます。Flash の安価なキャッシュ入力($0.15 / 100万トークン)により、頻出のコンテキスト部分を再利用してコストを抑えることができます。 さらに Google AI Optimization Guide で紹介されているプロンプト最適化の手法と組み合わせることで、社内ユースケースでの精度と費用対効果をさらに高めることができます。

競合との比較 — GPT-5 / Claude Opus 系との位置づけ

2026年5月時点のフロンティアモデル競争において、Gemini 3.5 Flash は『コスパ最大化』のポジションを明確にしています。 出力速度の観点では、同クラスの競合(OpenAI GPT-5 系の中間モデルや Anthropic Claude Sonnet 系)と比較して約 4 倍のトークン出力速度を示しており、大量生成・リアルタイム応答が要件のプロジェクトでは差別化要因になります(ppc.land)。 コンテキストウィンドウは 1,048,576 トークンで業界最大級です。GPT-5 や Claude Opus 系も大きなコンテキストを持ちますが、Gemini 3.5 Flash はこのスペックを Flash 価格(入力 $1.50)で提供している点が特徴的です。 マルチモーダル統合の面では、Gemini Omni は単一モデルで動画・音声・画像・テキストを扱える唯一のモデルとして、現時点で競合他社に先行しています。GPT-5 や Claude Opus 系は高度な推論では優れていますが、生成系モダリティの統合度という観点では Gemini Omni との直接比較は難しい段階です。 なお、推論精度の絶対値では Gemini 3.5 Pro(2026年6月予定)や GPT-5 フルモデル・Claude Opus 系が上位に位置することが想定されます。用途に応じてモデルを使い分ける判断が重要です。

料金とサブスクリプション体系

Gemini 3.5 Flash の API 料金(Gemini API / AI Studio): ・入力:$1.50 / 100万トークン ・出力:$9.00 / 100万トークン ・キャッシュ入力:$0.15 / 100万トークン Gemini Omni Flash のコンシューマー向け展開: ・AI Plus(旧 Gemini Advanced)/ Pro / Ultra:2026年5月19日から Gemini アプリ・Flow で利用可能 ・YouTube Shorts / YouTube Create:無料 企業向け(Workspace / Vertex AI)の具体的な Omni 料金は本稿執筆時点(2026年5月17日)では公式から未発表です。Vertex AI 経由の従量課金については Google Cloud の公式ドキュメントを参照してください。 キャッシュ機能($0.15)は、同じシステムプロンプト・社内文書を繰り返し参照するユースケースで効果が大きく、大量の社内アシスタント呼び出しを想定する場合には導入前にキャッシュ戦略を設計しておくと良いでしょう。

日本企業から見た採用判断

日本企業が Gemini 3.5 Flash / Omni を採用する際の主な選択肢は2つです。 【Gemini API 直接利用(AI Studio 経由)】 ・メリット:最速で使い始められる。AI Studio の無料枠で PoC が可能。月次コストを従量で管理しやすい ・デメリット:データの保管リージョンや利用規約について、エンタープライズ向けの契約条件を別途確認が必要 【Vertex AI 経由(Google Cloud)】 ・メリット:データの日本リージョン(asia-northeast1)処理が可能。IAM による詳細なアクセス制御。Google Cloud 既存契約との統合請求。SLA の適用 ・デメリット:初期設定・GCP プロジェクト管理のオーバーヘッド、API フォーマットが Vertex AI 仕様になる 【Google Workspace 統合の魅力】 Gmail・Docs・Sheets・Meet に直接統合される Gemini 機能は、社員が追加のシステム学習なしに AI を使い始められる点で日本企業に受け入れられやすいです。Gemini 3.5 Flash のバックエンド採用が Workspace への展開とどのように連動するかは、今後の Google のロードマップに注目です。 【セキュリティ・コンプライアンス観点】 金融・医療・製造など規制業種では、学習への利用停止設定(Data Usage Settings)の確認、および個人情報・機密情報を含むプロンプトを送信しないための社内ガイドライン整備が前提条件です。 まずは社内の非機密情報を使った PoC からスタートし、精度と速度を確認した上でスコープを広げていくアプローチを AI コンサルティング では推奨しています。

注意点 / 公式未確認事項

本コラムは 2026年5月17日時点の公開情報をもとにしています。以下の点は本稿執筆時点で公式確認が取れていないため注意が必要です。 ・Gemini Omni の API 価格:Gemini アプリ向けには展開済みですが、Vertex AI / Gemini API での従量課金レートは未発表 ・Gemini 3.5 Pro の正確な性能・料金:2026年6月リリース予定と発表されているが、詳細スペックは未公開 ・Terminal-Bench 2.1・MCP Atlas・CharXiv Reasoning の詳細な評価条件:Google の公式論文・技術レポートを参照のこと ・YouTube Shorts での Omni Flash 無料利用の地域・機能制限:日本向けのロールアウトタイムラインは別途確認が必要 ・Nano Banana の独立した利用可否:Omni の一部として統合されているが、単独 API として公開されているかは不明 最新情報は Google AI BlogGoogle Developers Blog を定期的に確認することを推奨します。

FAQ

Q1. Gemini 3.5 Flash と Gemini 3.1 Pro はどちらを選ぶべきですか? A1. 速度とコストが重要なリアルタイム応答・大量バッチ処理なら Gemini 3.5 Flash が有利です。ベンチマーク上は 3.5 Flash が 3.1 Pro を上回っており、Pro を選ぶ理由は今後 3.5 Pro が登場するまでは限定的になります。 Q2. 100万トークンのコンテキストは実際にどのくらいのデータ量ですか? A2. 日本語テキストで概算すると、A4 文書 1,000~1,500 枚分、または 2 時間前後の動画(字幕・音声起こし換算)に相当します。 Q3. Gemini Omni と Veo 3 は別物ですか? A3. Gemini Omni は Veo の動画生成機能を内包した統合モデルです。Veo 3 が個別プロダクトとして引き続き提供されるかどうかは、本稿時点で公式から明確にされていません。 Q4. 日本語の精度はどうですか? A4. Google は多言語対応の改善を継続しており、Gemini 3.5 Flash の日本語精度は Gemini 3.1 Pro と同等以上と想定されますが、本稿時点で日本語特化ベンチマーク(JSQuAD 等)の公式スコアは公開されていません。実際のユースケースでの PoC を推奨します。 Q5. キャッシュ機能($0.15)はどのように活用できますか? A5. システムプロンプトや大型のナレッジドキュメントをキャッシュとして保存しておくと、毎回の入力コストが通常の $1.50 から $0.15 に削減されます。同じコンテキストを 1 日 100 回呼び出すユースケースでは、10 分の 1 のコストになる計算です。 Q6. Gemini Omni は日本語の動画ナレーションや音声生成に対応していますか? A6. Lyria(音楽)・Nano Banana(リアルタイム音声)の日本語対応状況は本稿時点では公式に明記されていません。日本語音声生成の要件がある場合は、Google Cloud Text-to-Speech との組み合わせも検討してください。

まとめ

Google I/O 2026 は、AI モデル戦略における2つの大きな転換点を示しました。ひとつは『Flash が Pro を超える』という従来の性能ヒエラルキーの崩壊、もうひとつは『生成系モダリティを単一モデルに統合する』という Gemini Omni が示した方向性です。 Gemini 3.5 Flash は速度・コスト・ベンチマークの三拍子が揃ったモデルとして、エンタープライズ API 利用の第一選択肢になりえます。一方 Gemini Omni は、広告・コンテンツ制作・SNS 運用など複数モダリティを扱う業務において、専用ツール群を束ねるコスト・連携の手間を大幅に削減する可能性を持っています。 日本企業としては、まず Gemini 3.5 Flash を AI Studio で試用し、社内ユースケースでの精度と速度を検証することが現実的な第一歩です。Omni については YouTube や Gemini アプリを通じた無料・低コストの体験が先行するため、実業務への応用可能性を評価しながら展開タイムラインを見極めてください。 オブライトでは Gemini API・Vertex AI を活用した業務 AI の導入・内製化支援を行っています。採用判断のご相談は AI コンサルティング からお気軽にどうぞ。

References

お気軽にご相談ください

お問い合わせ