VS COMPARISON

xAI

Grok 4.20 Beta 2

Grok 4.20 Beta 2 ／ 2026-03-03

OpenAI

GPT-5.5

GPT-5.5 / 5.5 Pro ／ 2026-04-23

編集部の総合判定

総合性能は拮抗。用途で選ぶのが正解

ベンチ勝ち：Grok 4.20 Beta 2 1 / GPT-5.5 2 料金で安い項目：Grok 4.20 Beta 2 0 / GPT-5.5 2

SPECS

仕様の比較

項目	Grok 4.20 Beta 2	GPT-5.5
バージョン	Grok 4.20 Beta 2	GPT-5.5 / 5.5 Pro
公開日	2026-03-03	2026-04-23
コンテキスト長	256K	400K 勝ち
入力料金 $/1M	$3	$1.25 安い
出力料金 $/1M	$15	$10 安い
推論モデル	✓ あり	✓ あり
マルチモーダル	✓ あり	✓ あり

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

SWE-Bench

Grok 4.20 Beta 2

72%

GPT-5.5

88.7% 勝ち

MMLU

Grok 4.20 Beta 2

86.5%

GPT-5.5

91.2% 勝ち

GPQA

Grok 4.20 Beta 2

87.5% 勝ち

GPT-5.5

85.7%

AIME

Grok 4.20 Beta 2

95%

GPT-5.5

96.7% 勝ち

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

PROS & CONS

強み・弱み

Grok 4.20 Beta 2

X 統合のノリ軽め AI。Grok 4.20 系で実用性が大幅アップ、音声 API も投入。

◎ 強み

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始

△ 注意点

△ 過激寄りの応答もあるので場面を選ぶ
△ Grok 5（6T params MoE）は2026 Q2 予定で未リリース

公式サイト →

GPT-5.5

AIブームの火付け役。GPT-5.5 を内蔵し、画像・音声まで一つで完結。

◎ 強み

◎ 総合力が高くてなんでもこなす
◎ 音声・画像・ファイル対応がスムーズ
◎ アプリ・拡張機能が豊富

△ 注意点

△ 話の事実確認は弱め、要ファクトチェック

公式サイト →

USE CASES

用途別のおすすめ

Grok 4.20 Beta 2 か GPT-5.5 を取り上げてるタスク 9件

PRIMARY SOURCES

一次ソース

Grok 4.20 Beta 2

GPT-5.5

OTHER COMPARISONS

他のペアも見る

Gemini 3.1 Pro vs Claude Opus 4.7 Gemini 3.1 Pro vs Claude Sonnet 4.6 Gemini 3.1 Pro vs Qwen3.6-27B Gemini 3.1 Pro vs Llama 5 Gemini 3.1 Pro vs DeepSeek-V4 Preview Gemini 3.1 Pro vs Gemini 3.1 Flash

全ペアを見る →

Grok 4.20 Beta 2

GPT-5.5

仕様の比較

ベンチマーク差分

強み・弱み

Grok 4.20 Beta 2

GPT-5.5

用途別のおすすめ

メール・チャットの返信を書く

Excel・データを分析する

ウェブを横断して調べる

ブログ記事・レポートを書く

プレゼン資料・スライドを作る

翻訳する

AIと音声で会話する

営業メール・マーケコピーを作る

文章を校正・推敲する

一次ソース

他のペアも見る