Google I/O 2026:Gemini は「答えるAI」から「行動するAI」へ

Google I/O 2026 では、Gemini 3.5 Flash、Gemini Omni、Google Antigravity 2.0、AI Mode、Gemini Spark などが発表されました。単なる新モデル発表ではなく、Gemini を検索・開発・動画制作・日常タスクの実行基盤へ広げる「行動するAI」への転換として読み解きます。

著者
岡崎 太
公開日
読了時間
10分で読めます
Share

Google I/O 2026 は、米国時間では 2026 年 5 月 19 日、日本時間では 5 月 20 日にかけて発表がまとまったイベントです。今回の主役は、単体のチャットモデルとしての Gemini ではなく、検索、アプリ、開発環境、動画制作、Android、Workspace、Cloud を横断して動く 行動のための AI 基盤 としての Gemini でした。

Google Japan Blog の Google I/O 2026 まとめ では、2 つの最新モデルとして Gemini 3.5Gemini Omni が整理されています。Gemini 3.5 Flash は「最先端の知能と実行力」を組み合わせたモデルシリーズの第一弾。Gemini Omni は、動画をはじめとするあらゆる入力からコンテンツを作るモデルファミリーです。

今回の発表を一言でまとめるなら、Google は Gemini を「質問に答える AI」から、プロダクトの中でタスクを進め、制作し、開発し、検索から行動までつなぐ AI へ押し出した、ということになります。


まず押さえるべき 3 つの発表

今回の Gemini 関連発表は広範囲ですが、実務目線では次の 3 つに分けると理解しやすくなります。

  1. Gemini 3.5 Flash:エージェント実行とコーディングを前提にした高速モデル
  2. Gemini Omni:動画を含むマルチモーダル生成・編集のモデルファミリー
  3. Google Antigravity / AI Mode / Gemini Spark:モデルを実際の行動へつなぐプロダクト統合

ポイントは、モデル性能そのものよりも、どこで使われるか です。Gemini 3.5 Flash は Gemini アプリや検索の AI Mode、Google AI Studio、Android Studio、Gemini Enterprise Agent Platform などに展開されます。つまり API 利用者だけでなく、一般ユーザーや企業ユーザーが日常的に触る面にも同じ系統のモデルが入っていきます。

モデルが「アプリの外側にある賢い相談相手」ではなく、検索ボックス、開発ツール、動画編集、企業ワークフローの内側に入っていく。この変化が、今回の I/O で最も重要な構造です。

Gemini 3.5 Flash:エージェントを動かすための Flash

Gemini 3.5 の発表記事 では、Google は Gemini 3.5 を「最先端の知能と自律的な行動性を融合させた最新のモデルファミリー」と位置づけています。第一弾として公開されたのが Gemini 3.5 Flash です。

Flash という名前からは軽量・高速モデルを想像しますが、今回の 3.5 Flash は単に速いだけのモデルではありません。Google は、Terminal-Bench 2.1、GDPval-AA、MCP Atlas などのコーディング・エージェント系ベンチマークで Gemini 3.1 Pro を上回る結果を示し、エージェントタスクやコーディングに強いモデルとして訴求しています。

実務上の意味は明確です。AI エージェントは、1 回の応答が賢いだけでは足りません。計画を立て、ツールを呼び出し、結果を読み、必要ならやり直し、複数ステップを維持する必要があります。そのためには、モデルの推論力だけでなく、速度、コスト、長い作業を回す安定性が効いてきます。

Gemini 3.5 Flash は、まさにこの領域を狙っています。問い合わせ対応、コード生成、既存システムの調査、ドキュメント生成、業務レポート作成、データ整理のように、何度もツールを呼び、途中結果を読みながら進める仕事 で使いやすいモデルとして設計されていると見てよさそうです。

Antigravity 2.0:プロンプトからアクションへ

開発者向け発表では、Google Antigravity 2.0 と新しい Gemini のエージェントツール が重要です。Google は、今回の I/O で「プロンプトからアクションへの移行」を強調し、Antigravity 2.0、Gemini API の Managed Agents、Google AI Studio の Android 対応などを発表しました。

ここで見えているのは、AI 開発ツールの競争軸が「チャットでコードを書く」から、エージェントを管理し、複数ステップの仕事を任せ、開発環境と接続する 方向へ移っていることです。

これは、私たちが日々の AI 駆動開発で見ている変化とも重なります。AI コーディングの価値は、コード片の生成だけではありません。リポジトリを読み、仕様を確認し、テストを動かし、差分を説明し、レビューを受けて直す。この一連の作業をどれだけ自然に回せるかで、実際の生産性が決まります。

Antigravity 2.0 や Managed Agents は、この「実務のループ」を Google 側の開発基盤に組み込む動きとして捉えると理解しやすいです。

AI Mode と検索:検索ボックスがタスクの入口になる

検索まわりでは、AI 検索の新時代 が象徴的です。Google は、AI Mode のデフォルトモデルを Gemini 3.5 Flash にアップグレードし、検索ボックス自体を AI により再構築したと説明しています。

これまでの検索は、ユーザーがキーワードを入れ、結果ページから自分で情報を選び、次の行動を決めるものでした。AI Mode が進むと、検索は「情報を探す場所」から、複雑な意図を入力し、比較し、整理し、必要に応じてエージェントを使う入口 へ変わります。

特に重要なのは、検索エージェント機能、エージェント型コーディング機能、パーソナルインテリジェンスが同じ文脈で語られている点です。検索は、もはや Web ページへのリンク集だけではありません。ユーザーの問いを起点に、Google のアプリ、データ、モデル、エージェントがつながる操作面になりつつあります。

SEO やコンテンツマーケティングの観点でも、この変化は大きいです。従来のように検索結果の上位表示だけを狙うのではなく、AI が要約・比較・推薦・行動支援を行う文脈で、どの情報が信頼され、引用され、次の行動に接続されるのかを考える必要があります。

Gemini Spark:パーソナル AI エージェントの入口

Gemini アプリの発表 では、Gemini Spark が紹介されています。Gemini Spark は、Gemini 3.5 Flash を使い、24 時間体制でユーザーのタスク遂行を支援するパーソナル AI エージェントとして位置づけられています。

ここで注目したいのは、「常時起動しているエージェント」が一般ユーザー向けの体験として語られ始めたことです。これまでも AI アシスタントはありましたが、多くはユーザーが毎回話しかけて、単発の応答を得るものでした。

Gemini Spark のような方向性では、ユーザーの指示のもとで、予定、情報整理、調査、連絡、日々のタスクを継続的に支援する体験へ近づきます。これは BtoC の話に見えますが、企業向けにも同じ流れが来ます。社内の問い合わせ対応、営業準備、定例レポート、経理処理、採用候補者の整理など、毎日発生する小さな反復業務 がエージェント化の対象になります。

Gemini Omni:動画制作が「生成」から「編集と派生」へ広がる

もうひとつ大きいのが Gemini Omni です。Google は Gemini Omni を、動画をはじめとして、あらゆる入力からさまざまなものを作り出す新しいモデルファミリーとして発表しました。第一弾として Gemini Omni Flash が、Gemini アプリ、Google Flow、YouTube Shorts で順次提供されます。

動画生成 AI は、これまで「テキストから新しい動画を作る」方向で語られることが多くありました。しかし実務の制作現場で本当に効くのは、完全な新規生成だけではありません。むしろ、既存素材の一部を差し替える、別パターンを作る、短尺に展開する、言語や市場に合わせてローカライズする、広告向けに複数案を出す、といった 編集と派生 です。

Gemini Omni が Google Flow や YouTube Shorts と接続されるなら、動画制作のワークフローは大きく変わります。撮影・編集・書き出し・投稿の各工程が、外部ツールをまたいだ作業ではなく、Gemini を中心に会話的に進む可能性があります。

マーケティングでは、プロダクト紹介動画、広告クリエイティブ、SNS ショート動画、採用コンテンツ、社内教育動画の改善サイクルが短くなります。ひとつの素材から複数の角度を作り、反応を見ながら改善する流れが、より日常的になるはずです。

Android と XR:AI が OS の表面に入る

Google I/O 本体に先立つ The Android Show: I/O Edition 2026 でも、Gemini は OS レベルの知能として扱われています。Android は、ユーザーの意図を汲み取り、実際のアクションへつなげるインテリジェンスシステムへ進化する、と説明されています。

スマートフォン、PC、ブラウザ、検索、XR デバイスは、それぞれ別々の入口に見えます。しかし、同じ Gemini 系モデルが裏側に入り、画面の文脈、ユーザーの目的、アプリ間の操作をつなぐようになると、体験の中心は「アプリを開く」ことから「やりたいことを伝える」ことへ移ります。

この変化は、アプリ設計にも影響します。将来的には、人間が画面上の UI を直接操作するだけでなく、AI エージェントが API、画面、ファイル、通知、検索結果を横断して操作する前提で、サービスを設計する必要が出てきます。

企業が見るべき論点

今回の Google I/O 2026 は、発表数が多いので、表面的には「新機能がたくさん出た」ように見えます。しかし企業が見るべき論点は、もう少し絞れます。

ひとつ目は、エージェント化する業務を選ぶこと です。Gemini 3.5 Flash のようなモデルが広がると、AI に任せられる範囲は増えます。しかし、すべてを一気に自動化するのではなく、手順が明確で、入力と出力が確認でき、失敗時に人間がレビューできる業務から始めるのが現実的です。

ふたつ目は、AI が読む情報を整えること です。エージェントは、社内ドキュメント、CRM、問い合わせ履歴、コードベース、商品情報、契約書、FAQ などを読んで動きます。情報が散らかっていると、モデルが進化しても成果は出ません。社内データの棚卸し、権限設計、参照元の明確化が、これまで以上に重要になります。

三つ目は、制作の反復速度を変えること です。Gemini Omni のような動画モデルが普及すると、コンテンツ制作は「一度作って終わり」ではなく、複数案を出し、配信結果を見て、再編集し、また出す流れになります。AI 導入は制作費を下げるだけでなく、改善サイクルを短くするために使うべきです。

フィールフロウからの視点

私たちが今回の I/O で特に重要だと見ているのは、Google が Gemini を「モデル」ではなく 行動基盤 として扱い始めていることです。

Gemini 3.5 Flash は、エージェントを速く、安く、長く動かすためのエンジンです。Gemini Omni は、動画やビジュアル制作を会話的な編集ワークフローへ広げる入口です。AI Mode や Gemini Spark は、検索や日常タスクの操作面を、AI が実行する前提へ変えていきます。

この流れの中で企業に必要なのは、「どのモデルが一番賢いか」を追い続けることだけではありません。自社の業務、開発、制作、顧客接点のどこに AI の行動力を入れると、実際に時間が短くなり、品質が上がり、意思決定が速くなるのかを設計することです。

Google I/O 2026 は、その方向性をかなり明確に示したイベントでした。Gemini は、質問に答えるだけの存在から、検索し、作り、開発し、日々の仕事を進める存在へ移っています。次に問われるのは、企業側がその前提で業務とプロダクトを設計し直せるかどうかです。


参照元