ai-garage
← News一覧に戻る
News

Google の『Gemini 3.5 Flash』が登場!Flash なのに Pro 超え、エージェント時代の主力モデルへ

Google が 2026年5月19日、I/O 2026 で Gemini 3.5 Flash を発表。Terminal-Bench 76.2%・MCP Atlas 83.6% で Pro 越えのエージェント性能、Pro の25%安。一方で前世代 3 Flash の3倍値上げに『API 料金、もう試されてる』の声も。

Google の『Gemini 3.5 Flash』が登場!Flash なのに Pro 超え、エージェント時代の主力モデルへ

やっほー、ぼくてんびん丸! 朝枠だよ。

きのう開催された Google I/O 2026 で、ついに Gemini 3.5 Flash が登場したよ。これがね、ちょっと事件レベルでバズってる。

なんで事件かというと、「Flash」なのに、上位の『3.1 Pro』を主要ベンチで超えてきたから。コーディングもエージェントも、Flash 一発で済むようになる流れが来てるよ。

ただ料金は微妙な議論があって、開発者界隈はざわついてる。後半でその空気感も整理するね。

① 何が出たの?

Gemini 3.5 Flash は、Google が 2026年5月19日に Stable(一般提供)として リリースした新しい AI モデル。Google I/O 2026 のキーノートで発表され、その日のうちに以下の場所で使えるようになったよ:

  • Gemini アプリ(一般ユーザー向け)
  • Google AI Studio(開発者向け)
  • Gemini API(プロダクト組み込み)
  • Antigravity(Google の新しいエージェントプラットフォーム)
  • Google 検索の AI Mode

このラインナップ、要するに 「Google のすべての AI 機能の中核」 に Gemini 3.5 Flash が一気に組み込まれたってこと。Google が「これ、本気で全部に使うつもり」のシグナル。

② 数字で見る凄さ

ベンチマークが派手だよ:

  • Terminal-Bench 2.1: 76.2%(コマンドライン作業の自走力)
  • MCP Atlas: 83.6%(MCP 経由の多ステップツール連携)
  • CharXiv Reasoning: 84.2%(複雑な図表・グラフ理解)
  • 入力 1,048,576 トークン(1M) / 出力 65,536 トークン(64k)
  • Dynamic Thinking がデフォルト ON(必要に応じて推論を深める)

これ、前世代の Gemini 3.1 Pro を多くのベンチで超えてる。「Flash(軽量・高速)枠が、Pro(高性能・高価格)枠を超えた」ってのが、シリコンバレーの開発者界隈で「ちょっと前代未聞」とザワついてる。

しかも速度は GPT-5.5 や Claude Opus と比べて 4 倍速。エージェントが何回も AI を呼び出す場面でこの速度差はデカい。

③ ただし料金は値上げ — みんなの反応

ここがね、X / 開発者界隈で議論になってる部分。

モデルinputoutput
Gemini 3 Flash(前世代 Preview)$0.50$3.00
Gemini 3.5 Flash(今回)$1.50$9.00
参考: Gemini 3.1 Pro$2$12

前世代 3 Flash 比で 約 3 倍の値上げ。3.1 Pro 比だと 約 25% 安い だけど、「Flash 枠なのに高くない?」という声多数。

X / 開発者コミュニティの反応(要約)

Simon Willison(個人開発者・有名ブロガー)系の声:

「3.5 Flash は 3 Flash Preview の 3 倍、3.1 Flash-Lite の 6 倍の料金。3 つの主要 AI ラボが全部、API 顧客の価格許容度を試しに来てるよね。」

Hacker News コミュニティ:

「性能はマジ凄い、Flash でこれは反則。ただ価格は『これがフロンティアモデルの新標準コストか…』って受け入れムード半分、抵抗半分。」

エージェント開発者層:

「Antigravity(Google の新エージェント基盤)の中核モデルがこれ。マルチエージェント自走させるなら最有力。料金上がっても結局これを使うことになりそう。」

懸念派:

「ベンチ凄いけど、ARC-AGI-2 で GPT-5.5 から 12.5pt 下HLE(Humanity's Last Exam)も退行。エージェント特化はいいけど『純粋な推論』では Pro より後退してる場面もある。」

編集部のひとこと整理

X / Reddit / Hacker News を見るかぎり、「性能には脱帽、価格には警戒、用途次第で大化け」 ってのが大方の温度感だよ。

④ ぼくらが押さえとくべきポイント

ぼくが整理するとこんな感じ:

  1. エージェント実装の本命:Antigravity / マルチステップ自走 / MCP 連携を本気で使うなら、Gemini 3.5 Flash が現時点の最有力候補。Terminal-Bench と MCP Atlas で Pro 超えしてるのが何より雄弁
  2. コスパは『Pro 比で 25% 安』が正解:3 Flash 比で見ると割高に感じるけど、得られる性能を考えれば「Pro を諦めて Flash に降りる選択肢が初めて成立した」と捉えるべき
  3. 業務エージェントの設計を1段引き上げるチャンス:これまで「Pro じゃないとエージェントの精度が出ない」と Pro を選んでた業務、Flash に切り替えてコスト 25% 削減できる可能性
  4. 純粋推論ベンチでは Pro が上:科学リサーチ・専門知識深掘りなど『答えの正確性』が命の業務は、引き続き 3.1 Pro / Claude Opus / GPT-5.5 系を使うのが安全
  5. 3.1 Flash-Lite は別ポジで残ってる:$0.25 / $1.5 の更に安価な軽量枠。チャット用途・高頻度タスクなら Flash-Lite で OK

つまり、Gemini 3.5 Flash は『これまでのフラッシュ枠』じゃなく、『エージェント用の新ミッドレンジ』 と捉え直すのが正解。

⑤ ai-garage の対応

  • ✅ AI モデル比較表(/compare/)に Gemini 3.5 Flash を反映済み
  • ✅ コスパマトリクス(/matrix/)の散布図にもプロット済み
  • ✅ Gemini モデルページ(/models#gemini)の latestVersion 更新済み
  • ✅ 既存 Gemini 3 Flash / Gemini 3.1 Flash-Lite も比較対象に追加
  • ⏳ Google の公式ベンチ詳細値が公開され次第、独自スコアも更新予定

エージェント実装を検討してる人は、まず Google AI Studio でちょっと触ってみるのオススメ。Pro より圧倒的に速いから、開発の試行錯誤サイクルが体感で変わるよ。


それじゃ、また次のニュースで会おうね〜!

参考・一次ソース

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →