VS COMPARISON

Google

Gemini 3.1 Flash

3.1 Flash ／ 2026-04

xAI

Grok 4.20 Beta 2

Grok 4.20 Beta 2 ／ 2026-03-03

編集部の総合判定

純粋なベンチマーク性能では明確に Grok 4.20 Beta 2 優位

ベンチ勝ち：Gemini 3.1 Flash 0 / Grok 4.20 Beta 2 4 料金で安い項目：Gemini 3.1 Flash 2 / Grok 4.20 Beta 2 0

SPECS

仕様の比較

項目	Gemini 3.1 Flash	Grok 4.20 Beta 2
バージョン	3.1 Flash	Grok 4.20 Beta 2
公開日	2026-04	2026-03-03
コンテキスト長	1049K 勝ち	256K
入力料金 $/1M	$0.3 安い	$3
出力料金 $/1M	$2.5 安い	$15
推論モデル	✓ あり	✓ あり
マルチモーダル	✓ あり	✓ あり

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

SWE-Bench

Gemini 3.1 Flash

65%

Grok 4.20 Beta 2

72% 勝ち

MMLU

Gemini 3.1 Flash

84%

Grok 4.20 Beta 2

86.5% 勝ち

GPQA

Gemini 3.1 Flash

78%

Grok 4.20 Beta 2

87.5% 勝ち

AIME

Gemini 3.1 Flash

80%

Grok 4.20 Beta 2

95% 勝ち

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

PROS & CONS

強み・弱み

Gemini 3.1 Flash

Google 製。Workspace 連携と長文処理（1M tokens）で頭ひとつ抜けてる。

◎ 強み

◎ Gmail / Docs / Sheets / Slides と連携
◎ 画像・動画・音声・PDFの理解が強い
◎ 1M tokens の長いコンテキスト
◎ Deep Research Max など独自機能

△ 注意点

△ 回答の口調がやや堅め

公式サイト →

Grok 4.20 Beta 2

X 統合のノリ軽め AI。Grok 4.20 系で実用性が大幅アップ、音声 API も投入。

◎ 強み

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始

△ 注意点

△ 過激寄りの応答もあるので場面を選ぶ
△ Grok 5（6T params MoE）は2026 Q2 予定で未リリース

公式サイト →

USE CASES

用途別のおすすめ

Gemini 3.1 Flash か Grok 4.20 Beta 2 を取り上げてるタスク 8件

PRIMARY SOURCES

一次ソース

Gemini 3.1 Flash

Grok 4.20 Beta 2

OTHER COMPARISONS

他のペアも見る

GPT-5.5 vs Gemini 3.1 Pro GPT-5.5 vs Claude Opus 4.7 GPT-5.5 vs Claude Sonnet 4.6 GPT-5.5 vs Qwen3.6-27B GPT-5.5 vs Llama 5 GPT-5.5 vs DeepSeek-V4 Preview

全ペアを見る →

Gemini 3.1 Flash

Grok 4.20 Beta 2

仕様の比較

ベンチマーク差分

強み・弱み

Gemini 3.1 Flash

Grok 4.20 Beta 2

用途別のおすすめ

メール・チャットの返信を書く

Excel・データを分析する

ウェブを横断して調べる

情報の真偽を確認する

ブログ記事・レポートを書く

プレゼン資料・スライドを作る

翻訳する

AIと音声で会話する

一次ソース

他のペアも見る