VS COMPARISON

xAI

Grok 4.20 Beta 2

Grok 4.20 Beta 2 ／ 2026-03-03

Mistral AI

Mistral Large 3

Large 3 (MoE 675B/41B active) ／ 2025-12

編集部の総合判定

純粋なベンチマーク性能では明確に Grok 4.20 Mistral Large 3eta 2 優位

ベンチ勝ち：Grok 4.20 Beta 2 4 / Mistral Large 3 0 料金で安い項目：Grok 4.20 Beta 2 0 / Mistral Large 3 2

SPECS

仕様の比較

項目	Grok 4.20 Beta 2	Mistral Large 3
バージョン	Grok 4.20 Beta 2	Large 3 (MoE 675B/41B active)
公開日	2026-03-03	2025-12
コンテキスト長	256K	256K
入力料金 $/1M	$3	$2 安い
出力料金 $/1M	$15	$6 安い
推論モデル	✓ あり	✓ あり
マルチモーダル	✓ あり	✓ あり

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

SWE-Bench

Grok 4.20 Beta 2

72% 勝ち

Mistral Large 3

60%

MMLU

Grok 4.20 Beta 2

86.5% 勝ち

Mistral Large 3

81%

GPQA

Grok 4.20 Beta 2

87.5% 勝ち

Mistral Large 3

73%

AIME

Grok 4.20 Beta 2

95% 勝ち

Mistral Large 3

75%

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

PROS & CONS

強み・弱み

Grok 4.20 Beta 2

X 統合のノリ軽め AI。Grok 4.20 系で実用性が大幅アップ、音声 API も投入。

◎ 強み

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始

△ 注意点

△ 過激寄りの応答もあるので場面を選ぶ
△ Grok 5（6T params MoE）は2026 Q2 予定で未リリース

公式サイト →

Mistral Large 3

ヨーロッパ発、軽量で速いオープンモデル。Mistral Large 3 で MoE 675B へ大型化。

◎ 強み

◎ Mistral Large 3 が 675B 総 / 41B アクティブの MoE
◎ オープンウェイトの選択肢が広い
◎ API も提供（Le Chat）
◎ Voxtral TTS（2026-03）で音声も拡充

公式サイト →

USE CASES

用途別のおすすめ

Grok 4.20 Beta 2 か Mistral Large 3 を取り上げてるタスク 1件

AIと音声で会話する

Grok 4.20 Beta 2

PRIMARY SOURCES

一次ソース

Grok 4.20 Beta 2

Mistral Large 3

OTHER COMPARISONS

他のペアも見る

GPT-5.5 vs Gemini 3.1 Pro GPT-5.5 vs Claude Opus 4.7 GPT-5.5 vs Claude Sonnet 4.6 GPT-5.5 vs Qwen3.6-27B GPT-5.5 vs Llama 5 GPT-5.5 vs DeepSeek-V4 Preview

全ペアを見る →