Gemini 3.1 Flash
Google 製。Workspace 連携と長文処理(1M tokens)で頭ひとつ抜けてる。
◎ 強み
- ◎ Gmail / Docs / Sheets / Slides と連携
- ◎ 画像・動画・音声・PDFの理解が強い
- ◎ 1M tokens の長いコンテキスト
- ◎ Deep Research Max など独自機能
△ 注意点
- △ 回答の口調がやや堅め
VS COMPARISON
編集部の総合判定
純粋なベンチマーク性能では明確に Grok 4.20 Beta 2 優位
SPECS
| 項目 | Gemini 3.1 Flash | Grok 4.20 Beta 2 |
|---|---|---|
| バージョン | 3.1 Flash | Grok 4.20 Beta 2 |
| 公開日 | 2026-04 | 2026-03-03 |
| コンテキスト長 | 1049K 勝ち | 256K |
| 入力料金 $/1M | $0.3 安い | $3 |
| 出力料金 $/1M | $2.5 安い | $15 |
| 推論モデル | ✓ あり | ✓ あり |
| マルチモーダル | ✓ あり | ✓ あり |
BENCHMARKS
バーの長さは100%スケール。長い方が勝ち。
SWE-Bench
MMLU
GPQA
AIME
※ SWE-Bench Verified(実OSSバグ修正)/ MMLU(総合学力)/ GPQA Diamond(博士レベル理系)/ AIME(数学オリンピック予選)
PROS & CONS
Google 製。Workspace 連携と長文処理(1M tokens)で頭ひとつ抜けてる。
◎ 強み
△ 注意点
X 統合のノリ軽め AI。Grok 4.20 系で実用性が大幅アップ、音声 API も投入。
◎ 強み
△ 注意点
USE CASES
Gemini 3.1 Flash か Grok 4.20 Beta 2 を取り上げてるタスク 8件
PRIMARY SOURCES
Gemini 3.1 Flash
Grok 4.20 Beta 2
📬 STAY UPDATED
毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。