AI NEWS

AIニュース

2026.05.20

黒山結音

【速報】Google I/O 2026 最新発表まとめ：Gemini 3.5がすごい？AIは「チャット」から「自律型エージェント」へ歴史的転換

「次々と新しいAIが出てきて、もう追いつけない…」
「すごいのは分かったけど、結局うちの現場でどう使えるの？」

そんな風に焦りや疑問を感じていませんか？

断言します。今回のGoogle I/O 2026は、ここ数年で最も「現場の仕事」を変える発表でした。

AIが「指示された文章を返すだけのチャットボット」から、「自律的に考え、複数のツールを使いこなし、あなたの代わりに業務を遂行する優秀なパートナー（エージェント）」へと進化する——これは大げさな表現ではなく、2026年5月19日に発表された事実です。

「現場で使えなきゃ意味がない」——この視点を持つあなたにこそ、今回の発表内容を正しく理解してほしい。この記事では、Gemini 3.5 Flash、Gemini Omni、Gemini Sparkなど、多岐にわたる発表内容をAI初心者の方にもこれ以上ないくらい分かりやすく、かつ具体的に解説します。公式情報や実際の画面も交えながら、明日からの業務改善にどう活かせるのか、徹底的に紐解いていきましょう。

1. Google I/O 2026の全体像：「エージェントの時代」の幕開け

今回のGoogle I/O 2026を一言で表すなら、「Agentic Gemini Era（エージェント型Geminiの時代）」の到来です。

これまで私たちが使ってきたAIは、プロンプト（指示）を入力して、その答えを待つ「一問一答」の形式が主流でした。「〇〇について教えて」と聞けば答えてくれるけれど、実際に作業を代行してくれるわけではない——そんな限界がありました。

しかし、今回発表された新しいAIたちは根本的に違います。GoogleのCEOであるSundar Pichai氏は、公式ブログで次のように述べています。

「TPU 8iの背後にあるインフラストラクチャから、Gemini 3.5やAntigravityの最先端の機能に至るまで、イノベーションのフルスタックを見渡すと、私たちがしっかりと『エージェント型Geminiの時代（Agentic Gemini Era）』にいることは明らかです。」[1]

「エージェント」とは何か？——AI初心者のための解説

「エージェント」とは、単に質問に答えるだけでなく、あなたの目標を理解し、必要な情報を自分で集め、複数のステップを自律的に考えて実行してくれるAIのことです。

従来のAI（チャットボット型）	新しいAI（エージェント型）
質問されたことに答える	目標を理解し、自ら計画を立てる
一度に1つの作業しかできない	複数のツールを連携させて作業する
指示がないと動かない	バックグラウンドで自律的に動き続ける
結果を返して終わり	途中経過を報告し、確認を取りながら進める

つまり、「指示待ちの新人」から「自ら考えて動く優秀な右腕」へと進化したと言えます。

今回の主要発表一覧

発表名	カテゴリ	一言で説明
Gemini 3.5 Flash	AIモデル	最速×最賢のエージェント特化モデル
Gemini 3.5 Pro	AIモデル	来月リリース予定のさらに高性能版
Gemini Omni Flash	AIモデル（動画生成）	テキスト→高品質動画を生成・編集
Gemini Spark	パーソナルエージェント	24時間稼働の個人秘書AI
Daily Brief	エージェント機能	毎朝のパーソナライズ要約
Neural Expressive	デザイン言語	Geminiアプリの完全リニューアル
Google Antigravity 2.0	開発プラットフォーム	エージェント開発の最強基盤
Google Pics	画像生成・編集	Nano Bananaベースの新画像ツール
Google Flow	クリエイティブツール	AIエージェントによる創作支援
TPU 8i	インフラ	推論特化の新チップ

2. Gemini 3.5 Flash：圧倒的スピードと賢さを両立した「現場の即戦力」

今回の最大の目玉が、新しいAIモデル「Gemini 3.5 Flash」です。

Gemini 3.5 Flash タイトル画面
Gemini 3.5 公式ブログのタイトル画面（出典：Google Blog [2]）

これまで、AIモデルには「賢いけれど遅くて高い（ProやUltra）」か、「速くて安いけれど少し賢さが劣る（Flash）」というトレードオフ（二律背反）がありました。しかし、Gemini 3.5 Flashはこの常識を完全に覆しました。

基本スペック

項目	Gemini 3.5 Flash
コンテキストウィンドウ	100万トークン（約75万語相当）
最大出力トークン	65,000トークン
処理速度	他の最先端モデルの4倍
思考レベル（Thinking）	minimal / low / medium（デフォルト）/ high
利用可能場所	Geminiアプリ、AI Mode（検索）、Google AI Studio、Antigravity、API
料金	無料（Geminiアプリ経由）、API利用は有料

圧倒的なベンチマーク性能

Gemini 3.5 Flashは、前世代の最上位モデルであるGemini 3.1 Proを多くの指標で上回る性能を叩き出しています。

Gemini 3.5 Benchmark Table
Gemini 3.5 Flashのベンチマーク比較表（出典：Google Blog [2]）

特に注目すべきポイントを整理します。

カテゴリ	ベンチマーク	Gemini 3.5 Flash	競合最高値	意味
コーディング	Terminal-bench 2.1	76.2%	GPT-5.5: 78.2%	ほぼ最高水準のコード生成能力
エージェント	MCP Atlas	83.6%	Claude Opus 4.7: 79.1%	複数ツール連携タスクで圧倒的1位
UI操作	OSWorld-Verified	78.4%	GPT-5.5: 78.7%	PCの画面操作を自動化する能力
マルチモーダル	MMMU-Pro	83.6%	GPT-5.5: 81.2%	画像・図表を理解する能力で1位
推論	ARC-AGI-2	72.1%	GPT-5.5: 84.6%	抽象的な推論パズル

さらに、処理速度（出力トークン/秒）と知能の両方で最先端に位置していることが、第三者機関「Artificial Analysis」の分析でも確認されています。

Artificial Analysis Intelligence Index
知能指数と出力速度の比較グラフ。右上に位置するほど「速くて賢い」（出典：Google Blog [2]）

なぜ「現場の即戦力」なのか？

Google DeepMindのCTOであるKoray Kavukcuoglu氏は、次のように説明しています。

「スピードとパフォーマンスのバランスにより、3.5 Flashは長期的なエージェントタスクに最適です。これまで開発者が数日、監査人が数週間かけていた作業を、3.5 Flashは他の最先端モデルの半額以下のコストで、ほんのわずかな時間で完了させることができます。」[2]

【現場での具体的な活用例】

営業・マーケティング領域：
Shopifyは、Gemini 3.5 Flashのサブエージェントを並列で稼働させ、複雑なデータを長時間にわたって分析し、グローバル規模でより正確な加盟店の成長予測を行っています。

金融・コンプライアンス領域：
Macquarie Bankは、100ページ以上の複雑な書類を推論し、関連情報を取得して信頼性の高い推奨事項を低レイテンシで提供することで、顧客のオンボーディングを加速させるパイロットを実施しています。

エンタープライズ自動化：
Salesforceは、Agentforceに3.5 Flashを統合し、コンテキストを保持しながら複雑なマルチターンのツール呼び出しを実行する複数のサブエージェントを展開して、複雑なエンタープライズタスクを確実に自動化しています。

開発者向け：APIの使い方

Gemini 3.5 FlashはAPIとしても即日利用可能です。Pythonでの最小コードは以下の通りです。

from google import genai
client = genai.Client()
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)

思考レベル（Thinking Level）を調整することで、速度と精度のバランスを制御できます。

思考レベル	用途	特徴
minimal	チャット、簡単な事実確認	最速レスポンス
low	少ないステップのコード・分析	速度と品質のバランス
medium（デフォルト）	ほとんどのタスクに最適	推奨設定
high	複雑な推論、難しい数学	最高品質、時間がかかる

3. Gemini Omni：テキストから動画まで「何でも作れる」魔法の杖

クリエイティブな業務に革命を起こすのが、新しいマルチモーダル生成モデル「Gemini Omni」です。

Gemini Omniのイメージ（出典：Google Blog [3]）

Gemini Omniは、テキスト、画像、音声、動画など、あらゆる入力を組み合わせて、高品質な動画を生成・編集できるモデルです。昨年の「Nano Banana」が画像生成・編集にGeminiの知能をもたらしたのに続き、今度は動画の領域にまでその能力が拡張されました。

Gemini Omniの3つの革命的機能

1. 対話形式での動画編集

Gemini Omniの最大の特徴は、「自然な会話（チャット）で動画を編集できる」点です。

「Gemini Omniは、自然言語を使って動画を編集する簡単な方法を提供します。すべての指示は前の指示の上に構築されます。キャラクターは一貫性を保ち、物理法則は維持され、シーンは前に起こったことを記憶しています。」[3]

例えば、撮影した動画に対して以下のような指示が可能です。

指示の例	結果
「彫刻を泡でできたものに変えて」	動画内の彫刻が泡のテクスチャに変換される
「背景をレトロフューチャー風に変えて」	世界観全体がレトロSF風に変化
「スケートボードからモーションエフェクトを出して」	アニメーション効果が追加される

2. 物理法則を理解した映像生成

Gemini Omniは単に「見た目がリアル」な映像を作るだけではありません。重力、運動エネルギー、流体力学といった物理法則を直感的に理解し、それに基づいた自然な動きを生成します。

公式ブログでは「チェーンリアクション式のトラックを高速で転がるビー玉」のプロンプトが紹介されており、物理的に正確な動きが再現されています。

3. あらゆる入力を組み合わせた動画生成

画像、テキスト、動画、音声（当初は音声参照のみ）を自由に組み合わせて、一つのまとまった動画を生成できます。手描きのスケッチから動画を作ったり、既存の写真のスタイルを動画に適用したりすることが可能です。

Gemini Omni Screenshot
Gemini Omniの公式ブログ画面（出典：Google Blog [3]）

利用可能範囲と安全対策

項目	内容
初回リリースモデル	Gemini Omni Flash
利用可能プラットフォーム	Geminiアプリ、Google Flow、YouTube Shorts、YouTube Create App
対象ユーザー	Google AI Plus / Pro / Ultra サブスクライバー（グローバル）
YouTube Shorts	無料で利用可能（今週より順次展開）
安全対策	SynthID電子透かし（不可視）を全動画に埋め込み
アバター機能	自分自身のデジタルアバターを作成し、動画に登場させることが可能

4. Gemini Spark：24時間365日働く「あなた専用の優秀な秘書」

個人の生産性を劇的に引き上げるのが、新しいパーソナルAIエージェント「Gemini Spark」です。

Gemini App Features
Geminiアプリの新機能一覧。Daily Brief、Neural Expressive、Gemini 3.5 Flash、Gemini Omni、Gemini Sparkなどが確認できる（出典：Google Blog [4]）

Gemini Sparkは、Gemini 3.5 FlashとAntigravityハーネスをベースにしており、あなたのデジタルライフを24時間体制でサポートします。

従来のAIアシスタントとの決定的な違い

「Gemini Sparkは、あなたの新しい24時間365日のパーソナルAIエージェントです。タスクを与えれば、たとえスマホやノートパソコンの電源が切れていても、バックグラウンドで自律的に作業を続けます。」[5]

従来のAIアシスタント	Gemini Spark
アプリを開いている時だけ動く	スマホを閉じても動き続ける
1つのタスクを1回実行	定期的・継続的にタスクを実行
単一のアプリ内で完結	Gmail、Docs、Slides等を横断
結果を返して終わり	途中経過を報告し、確認を取る

Daily Brief：毎朝のパーソナライズ要約

Gemini Sparkの機能の一つが「Daily Brief」です。朝一番に確認すべき情報を、AIが自動で整理してくれます。

具体的には、Gmailの受信トレイから緊急の連絡を拾い上げ、カレンダーの予定と照らし合わせ、「今日やるべきこと」を優先順位付きで提案してくれます。単なる要約ではなく、次のアクションまで提示してくれるのがポイントです。

Gemini Sparkの実践的な活用例

定期的な監視と報告：
「毎月のクレジットカード明細をチェックして、新しいサブスクリプション料金や隠れた手数料があれば報告して」と一度指示しておけば、毎月自動で監視し、異常があれば通知してくれます。

情報の収集と整理：
「子供の学校からのメールを監視して、重要な締め切りを抽出し、パートナーと自分に毎日まとめて送って」という指示で、家庭の情報管理を自動化できます。

複雑なワークフローの自動化：
「メールとチャットに散らばっている会議のメモを統合し、Googleドキュメントに清書して、プロジェクト開始の案内メールを下書きしておいて」といった、複数のツールをまたぐ複雑な作業もこなします。

安全性への配慮

「Sparkはあなたの指示の下で動作します。オンにするかどうか、どのアプリに接続するかはあなたが選択し、お金を使ったりメールを送信したりするような重要なアクションを実行する前には、必ずあなたに確認するように設計されています。」[4]

連携パートナーと今後の展開

現時点でCanva、OpenTable、InstacartとのMCP（Model Context Protocol）接続が発表されており、今後数週間でSparkがこれらの外部サービスを使ってタスクを実行できるようになります。さらに、テキストやメールでSparkに指示を送る機能、カスタムサブエージェントの作成、ローカルブラウザの操作なども予定されています。

5. Neural Expressive：Geminiアプリの完全リニューアル

Geminiアプリのデザインが「Neural Expressive」という新しいデザイン言語で完全に刷新されました。

これは単なる見た目の変更ではなく、AIとの対話体験そのものを根本から再設計したものです。流れるようなアニメーション、鮮やかな色彩、新しいタイポグラフィ、触覚フィードバックが特徴です。

また、Gemini Liveの会話体験がGeminiアプリに直接統合され、テキスト入力と音声会話をシームレスに切り替えられるようになりました。さらに、Geminiのモデルの力を使って、テキストの壁ではなく、リッチな画像、インタラクティブなタイムライン、ナレーション付き動画、ダイナミックなグラフィックスを含むテーラーメイドのレスポンスをリアルタイムで生成します。

Neural Expressiveは本日より、Web、Android、iOSで全ユーザーにグローバル展開されています。

6. Google Antigravity 2.0：自社専用エージェントを構築する最強基盤

開発者や企業向けに発表されたのが、エージェント開発プラットフォーム「Google Antigravity 2.0」です。

𝕏では「AIがOSになる日が来た」[6] と評されるほどのインパクトで、Google検索にもAntigravityのエージェントコーディング機能が統合されています。

「Gemini 3.5 FlashとGoogle Antigravityの力で、検索はあなたの個別の質問に合わせたカスタム体験を構築します。ダイナミックなレイアウトやインタラクティブなビジュアルなど、これらの生成UIの機能は今夏、検索で無料で利用可能になります。」[1]

Antigravity 2.0のエコシステム

コンポーネント	対象	説明
Antigravity 2.0（デスクトップアプリ）	開発者	複数エージェントの並列実行、スケジュールタスク、エコシステム統合
Antigravity CLI	ターミナル派の開発者	GUIなしで即座にエージェントを作成・実行
Antigravity SDK	プログラマー	カスタムエージェントの定義と自社インフラへのデプロイ
Antigravity for Enterprise	企業	Google Cloudプロジェクトとの直接接続

実際のユースケース

Antigravityと3.5 Flashを組み合わせることで、以下のような複雑なタスクが実現されています。

AlphaZeroの論文を読み込み、完全にプレイ可能なゲームをコーディング（2つのエージェントが6時間で完了）
レガシーコードベースをNext.jsに変換
非構造化データの自動分類・リネーム（動的な基準に基づく）
都市景観の新規生成（サブエージェントを使用）

7. その他の注目発表（Google Pics / Google Flow / TPU 8i）

Google Pics：AI画像生成・編集の新ツール

最新の「Nano Banana」モデルをベースにした新しいAI画像作成・編集ツールです。最大の特徴は、画像内のすべての要素を個別のオブジェクトとして扱う点です。従来のように画像全体を一枚の平面として処理するのではなく、特定の要素だけを作成・交換・修正できます。

Google Flow：AIエージェントによる創作支援

Google Flowに新しいエージェントが追加され、複雑なタスクの計画と推論が可能になりました。Geminiモデルで構築されており、初期のブレインストーミングから作成・編集まで支援します。さらに、Flow内でビデオエフェクト、手描きアニメーション、テキストレイヤリングなどのクリエイティブツールをバイブコーディング（自然言語でのプログラミング）で作成することもできます。

TPU 8i：推論特化の新チップ

AIモデルの推論（実際にユーザーのリクエストに応答する処理）に特化した新しいカスタムチップ「TPU 8i」が発表されました。これにより、Gemini 3.5 Flashのような高速モデルをさらに効率的に稼働させるインフラが整備されます。

インテリジェントアイウェア（スマートグラス）

Geminiを搭載したスマートグラスも発表されました。「オーディオグラス」（耳元で音声ヘルプを提供）と「ディスプレイグラス」（必要な情報を視界に表示）の2種類があり、ハンズフリーでAIの支援を受けられます。オーディオグラスは今年秋に発売予定です。

8. まとめ：明日からどう現場に実装するか？

Google I/O 2026の発表は、AIが「便利なツール」から「自律的に働くチームメンバー」へと進化したことを示しています。

「現場で使えなきゃ意味がない」

この視点に立つなら、まずは以下のステップから始めることをお勧めします。

ステップ1：Geminiアプリを最新版にアップデートし、Daily Briefを設定する
まずは自分自身の業務効率化から始め、AIエージェントの「自律的な動き」を体感してください。Neural Expressiveの新UIも体験できます。

ステップ2：業務フローの棚卸し
「時間がかかっている単純作業」や「複数のツールをまたぐ面倒な作業」をリストアップします。特に「毎日・毎週・毎月繰り返している作業」は、Gemini Sparkとの相性が抜群です。

ステップ3：エージェントへの委譲テスト
Gemini 3.5 FlashやGemini Sparkを使って、リストアップした作業をどう自動化できるかテストしてみましょう。最初は小さなタスクから始め、徐々に範囲を広げていくのがコツです。

ステップ4：動画コンテンツの内製化を検討する
Gemini Omniを使えば、これまで外注していたプロモーション動画やマニュアル動画を、社内で迅速かつ低コストに制作できる可能性があります。

AIの進化は待ってくれません。しかし、正しく理解し、現場の課題解決に直結する形で実装できれば、これほど強力な武器はありません。ぜひ、今日から「エージェント」との新しい働き方を模索してみてください。

References

[1] Google Blog: “I/O 2026: Welcome to the agentic Gemini era” by Sundar Pichai (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/)

[2] Google Blog: “Gemini 3.5: frontier intelligence with action” by Koray Kavukcuoglu, Jeff Dean, Oriol Vinyals & Noam Shazeer (https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/)

[3] Google Blog: “Introducing Gemini Omni” by Koray Kavukcuoglu (https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/)

[4] Google Blog: “The Gemini app becomes more agentic, delivering proactive, 24/7 help” by Josh Woodward (https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/)

[5] @ctgptlb on 𝕏: Google Gemini公式引用 “Gemini Spark is your new 24/7 personal AI agent.” (https://x.com/ctgptlb/status/2056793586474324044)

[6] @tetumemo on 𝕏: “Google I/Oが激アツすぎて圧倒。AIがOSになる日が来た” (https://x.com/tetumemo/status/2056813994229518777)

[7] Google Blog: “Building the agentic future: Developer highlights from I/O 2026” (https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights/)

[8] Google AI for Developers: “What’s new in Gemini 3.5 Flash” (https://ai.google.dev/gemini-api/docs/whats-new-gemini-3.5)

WRITERライター紹介

黒山結音

NEXT INNOVAITION　代表取締役

「AIは現場で使えなきゃ意味がない」を掲げ、30社以上にAI顧問として導入から定着までサポート。OpenClaw・Claude・ChatGPTなどAIツールを実務でフル活用し、AI駆動経営を実践。本メディアでは、実際の現場で効果が出た事例や、AI初心者がつまずく「最初の一歩」を、専門用語を極力使わずに解説します。

OpenClaw / Claude Code / Codex / Cursor / Manus