Google、AIエージェントに特化したGemini 3.5モデルを発表
Googleは5月19日、年次開発者会議I/Oにて、新世代AIモデル「Gemini 3.5」シリーズを発表した。これはコンシューマーおよびエンタープライズ市場でOpenAIやAnthropicに対抗するものである。このシリーズは「エージェントタスク」の実行に特化して最適化されており、最初のモデル「3.5 Flash」は同日より全世界のユーザーに提供が開始され、高速性とコスト効率を提供する。同時に、Googleは動画生成・編集用のマルチモーダルモデル「Gemini Omni」も発表し、デジタルウォーターマーク技術によるコンテンツの透明性確保を強調した。
📋 記事の処理履歴
- 📰 発表: 2026年5月20日 02:53
- 🔍 収集: 2026年5月20日 03:01(発表から8分後)
- 🤖 AI分析完了: 2026年5月20日 03:05(収集から3分後)
Googleの年次開発者会議I/Oが本日開催され、新世代AIモデル「Gemini 3.5」シリーズが発表された。これにより、一般ユーザーと企業向けアプリケーションの二大市場でOpenAIやAnthropicに対抗する。Googleは、このシリーズが「エージェントタスク」の実行に特化して最適化されていることを強調している。最初のモデルである「3.5 Flash」は本日より全世界のユーザーに公開された。これは、一般ユーザーがGeminiアプリやGoogle検索のAIモードを使用する際に、3.5 Flashが背後のデフォルトモデルとして機能することを意味する。
Googleはまた、動画版の「Nano Banana」とも言えるマルチモーダル動画生成・編集モデル「Gemini Omni」も発表した。
● 3.5 Flashは本日より提供開始、3.5 Proは6月リリース予定
今年のI/Oの核心的な方向性について、GoogleのCEO、サンダー・ピチャイ氏は、人工知能(AI)の発展が急速な進展段階に入っており、技術のデモンストレーションよりも、ユーザーが製品内でAIの実用的な価値を重視するようになったと強調した。
新世代の「3.5 Flash」モデルは、「最先端の知能」と「行動能力」を兼ね備えている。後者は「AIエージェント」の核心的な要素である。
一般ユーザーに加え、開発者はGoogleの開発プラットフォーム「Antigravity」や、Google AI Studio、Android StudioのGemini APIを通じて利用できる。また、「3.5 Pro」はすでにGoogle社内で使用されており、6月には外部への提供が予定されている。
「3.5 Flash」は速度とコスト面で優位性を持つ。Googleによると、毎秒出力されるトークン数で計算した場合、他の最先端モデルより約4倍高速であり、コストは最先端モデルの半分以下で、場合によっては約3分の1にまで抑えられるという。
また、ほぼすべてのタイプの評価において、「3.5 Flash」のパフォーマンスは前世代のフラッグシップモデル「Gemini 3.1 Pro」を上回っている。
● Omniマルチモーダル生成モデル、アイデアを映画のような動画に
主力モデルに加え、Googleは今年のI/Oで「Gemini Omni」マルチモーダル生成モデルも発表した。これは画像モデル「Nano Banana」の動画版と考えることができるが、主に動画制作に使用されるものだと指摘している。
現段階では、Googleはまず動画の生成・編集に注力しているが、最終的にはOmniを、画像、音声、動画、テキストを受け取り、理解力と推論能力を駆使して、動画を含む多様な出力形式を生成できる「ワールドモデル」に育て上げることを目指している。
「Gemini Omni」シリーズの最初のモデル「Omni Flash」は、本日よりGeminiアプリとGoogle Flowを通じて、全世界のGoogle AI Plus、Pro、Ultraのサブスクリプションユーザーに提供される。また、今週からYouTube ShortsとYouTube Createアプリのユーザーにも無料で提供される。次期上級バージョン「Omni Pro」は近いうちにリリースされる予定だ。
Googleはまた、Omniで生成または編集されたコンテンツには、自動的に「SynthID」デジタルウォーターマークが付加され、ユーザーがAIによって生成された、またはAIツールで編集されたコンテンツであることを明確に識別できるようにし、コンテンツ全体の透明性と安全性を強化すると強調した。
Googleはまた、動画版の「Nano Banana」とも言えるマルチモーダル動画生成・編集モデル「Gemini Omni」も発表した。
● 3.5 Flashは本日より提供開始、3.5 Proは6月リリース予定
今年のI/Oの核心的な方向性について、GoogleのCEO、サンダー・ピチャイ氏は、人工知能(AI)の発展が急速な進展段階に入っており、技術のデモンストレーションよりも、ユーザーが製品内でAIの実用的な価値を重視するようになったと強調した。
新世代の「3.5 Flash」モデルは、「最先端の知能」と「行動能力」を兼ね備えている。後者は「AIエージェント」の核心的な要素である。
一般ユーザーに加え、開発者はGoogleの開発プラットフォーム「Antigravity」や、Google AI Studio、Android StudioのGemini APIを通じて利用できる。また、「3.5 Pro」はすでにGoogle社内で使用されており、6月には外部への提供が予定されている。
「3.5 Flash」は速度とコスト面で優位性を持つ。Googleによると、毎秒出力されるトークン数で計算した場合、他の最先端モデルより約4倍高速であり、コストは最先端モデルの半分以下で、場合によっては約3分の1にまで抑えられるという。
また、ほぼすべてのタイプの評価において、「3.5 Flash」のパフォーマンスは前世代のフラッグシップモデル「Gemini 3.1 Pro」を上回っている。
● Omniマルチモーダル生成モデル、アイデアを映画のような動画に
主力モデルに加え、Googleは今年のI/Oで「Gemini Omni」マルチモーダル生成モデルも発表した。これは画像モデル「Nano Banana」の動画版と考えることができるが、主に動画制作に使用されるものだと指摘している。
現段階では、Googleはまず動画の生成・編集に注力しているが、最終的にはOmniを、画像、音声、動画、テキストを受け取り、理解力と推論能力を駆使して、動画を含む多様な出力形式を生成できる「ワールドモデル」に育て上げることを目指している。
「Gemini Omni」シリーズの最初のモデル「Omni Flash」は、本日よりGeminiアプリとGoogle Flowを通じて、全世界のGoogle AI Plus、Pro、Ultraのサブスクリプションユーザーに提供される。また、今週からYouTube ShortsとYouTube Createアプリのユーザーにも無料で提供される。次期上級バージョン「Omni Pro」は近いうちにリリースされる予定だ。
Googleはまた、Omniで生成または編集されたコンテンツには、自動的に「SynthID」デジタルウォーターマークが付加され、ユーザーがAIによって生成された、またはAIツールで編集されたコンテンツであることを明確に識別できるようにし、コンテンツ全体の透明性と安全性を強化すると強調した。