VS COMPARISON

xAI

Grok 4.20 Beta 2

Grok 4.20 Beta 2 ／ 2026-03-03

Alibaba

Qwen3.6-27B

Qwen3.6-27B (dense) ／ 2026-04-22

編集部の総合判定

純粋なベンチマーク性能では明確に Grok 4.20 Qwen3.6-27Beta 2 優位

ベンチ勝ち：Grok 4.20 Beta 2 4 / Qwen3.6-27B 0 料金で安い項目：Grok 4.20 Beta 2 0 / Qwen3.6-27B 2

SPECS

仕様の比較

項目	Grok 4.20 Beta 2	Qwen3.6-27B
バージョン	Grok 4.20 Beta 2	Qwen3.6-27B (dense)
公開日	2026-03-03	2026-04-22
コンテキスト長	256K	256K
入力料金 $/1M	$3	$0.4 安い
出力料金 $/1M	$15	$2 安い
推論モデル	✓ あり	✓ あり
マルチモーダル	✓ あり	✓ あり

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

SWE-Bench

Grok 4.20 Beta 2

72% 勝ち

Qwen3.6-27B

—

MMLU

Grok 4.20 Beta 2

86.5% 勝ち

Qwen3.6-27B

85%

GPQA

Grok 4.20 Beta 2

87.5% 勝ち

Qwen3.6-27B

82%

AIME

Grok 4.20 Beta 2

95% 勝ち

Qwen3.6-27B

88%

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

PROS & CONS

強み・弱み

Grok 4.20 Beta 2

X 統合のノリ軽め AI。Grok 4.20 系で実用性が大幅アップ、音声 API も投入。

◎ 強み

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始

△ 注意点

△ 過激寄りの応答もあるので場面を選ぶ
△ Grok 5（6T params MoE）は2026 Q2 予定で未リリース

公式サイト →

Qwen3.6-27B

Alibaba 製の高性能オープンモデル群。Qwen3.6 で 397B MoE を超える dense モデルへ。

◎ 強み

◎ 日本語含む多言語が得意
◎ サイズのバリエーションが豊富（dense 27B / MoE 36B-A3B 等）
◎ ベンチで上位常連、agentic coding で 397B MoE を超える
◎ Apache 2.0 ライセンスで完全オープン

公式サイト →

USE CASES

用途別のおすすめ

Grok 4.20 Beta 2 か Qwen3.6-27B を取り上げてるタスク 1件

AIと音声で会話する

Grok 4.20 Beta 2

PRIMARY SOURCES

一次ソース

Grok 4.20 Beta 2

Qwen3.6-27B

OTHER COMPARISONS

他のペアも見る

GPT-5.5 vs Gemini 3.1 Pro GPT-5.5 vs Claude Opus 4.7 GPT-5.5 vs Claude Sonnet 4.6 GPT-5.5 vs Llama 5 GPT-5.5 vs DeepSeek-V4 Preview GPT-5.5 vs Gemini 3.1 Flash

全ペアを見る →