VS COMPARISON

Qwen3.7 Max vs Grok 4.5

Alibaba

Qwen3.7 Max

Qwen3.7 Max（旗艦・クローズド）／ 2026-05-19

「安いのにコーディング強者。中国旗艦の実力派だよ」

SpaceXAI（旧xAI）

Grok 4.5

Grok 4.5 ／ 2026-07-08

「安くて速い新人エース。実績づくりはこれから」

編集部の総合判定

共通の公表ベンチマークがなく、数値では直接比較できない。料金と用途で選ぶのが正解

ベンチ勝ち：Qwen3.7 Max 0 / Grok 4.5 0 料金で安い項目：Qwen3.7 Max 2 / Grok 4.5 0

WHICH ONE

こんな人はどっち？

こんな人は Qwen3.7 Max

✓ API 料金を抑えたい人（入力$1.25/出力$3.75）
✓ 長い資料を読ませたい人（100万トークン）

こんな人は Grok 4.5

✓ AI をはじめて使う人
✓ 画像も読ませたい人

SPECS

仕様の比較

項目	Qwen3.7 Max	Grok 4.5
バージョン	Qwen3.7 Max（旗艦・クローズド）	Grok 4.5
公開日	2026-05-19	2026-07-08
コンテキスト長	1000K 勝ち	500K
入力料金 $/1M	$1.25 安い	$2
出力料金 $/1M	$3.75 安い	$6
推論モデル	✓ あり	✓ あり
マルチモーダル	—	✓ あり
AIコスパ指数独自指標	73	75

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

コード修正力（SWE-Bench）

Qwen3.7 Max

80.4%

Grok 4.5

—

専門知識（GPQA）

Qwen3.7 Max

92.4%

Grok 4.5

—

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

※「—」は未公表（実測0ではありません）。未公表の項目は勝敗のカウント対象外です。

PROS & CONS

強み・弱み

Qwen3.7 Max

Alibaba 製の高性能モデル群。旗艦 Qwen3.7 Max は安くて強く、次期 Qwen3.8-Max も始動。

◎ 強み

◎ 日本語含む多言語が得意
◎ 旗艦 Qwen3.7 Max は $1.25/$3.75 と frontier 級で破格の安さ
◎ コーディング／エージェント特化（SWE-Bench Verified 80.4）
◎ オープンウェイト版（Qwen3.6 系）と安価マルチモーダル版（3.7 Plus）も揃う

公式サイト →

Grok 4.5

X 統合のノリ軽め AI が Grok 4.5 で大変身。"Opus級・半額以下"を掲げるコーディング特化フラグシップに。

◎ 強み

◎ Xのリアルタイム投稿を検索できる
◎ ユーモアと毒舌のあるキャラ設定
◎ X Premium に同梱でコスパ良
◎ Grok Speech / TTS API も2026-05 から提供開始
◎ 4.5 で $2/$6 per MTok。フロンティア級を謳うモデルとして突出して安い
◎ Grok Build・Cursor・Office アドインなど開発/実務ツールへ即統合

△ 注意点

△ 過激寄りの応答もあるので場面を選ぶ
△ コンテキストは 500k と前世代 Grok 4.3 の 1M から縮小
△ 日本語性能の第三者検証はまだ少ない

公式サイト →

USE CASES

用途別のおすすめ

Qwen3.7 Max か Grok 4.5 を取り上げてるタスク 1件

AIと音声で会話する

Grok 4.5

PRIMARY SOURCES

一次ソース

Qwen3.7 Max

Grok 4.5

FAQ

よくある質問

Q. Qwen3.7 Max と Grok 4.5、結局どっちがいい？

A. 両モデルに共通する公表ベンチマークがないため、数値での優劣は付けられません（未公表は実測0ではありません）。料金と、下の強み・注意点の欄で用途に合うほうを選ぶのがおすすめです。

Q. Qwen3.7 Max と Grok 4.5、料金が安いのはどっち？

A. 入力料金は Qwen3.7 Max が $1.25／1M、Grok 4.5 が $2／1M。出力料金は Qwen3.7 Max が $3.75／1M、Grok 4.5 が $6／1M です。入力・出力とも Qwen3.7 Max の方が安く、コスト重視なら Qwen3.7 Max が有利です。

Q. Qwen3.7 Max と Grok 4.5、ベンチマークで強いのはどっち？

A. 共通の公表ベンチマークがないため、数値での直接比較はできません。各モデルが公表しているベンチマークは系統が異なるため、それぞれの一次ソースを参照してください。

Q. Qwen3.7 Max と Grok 4.5、初心者にはどっちがおすすめ？

A. 初心者へのおすすめ度は Grok 4.5 の方が高め（3／5 対 2／5）。まず触ってみるなら Grok 4.5 から始めると迷いにくいです。

OTHER COMPARISONS

他のペアも見る

Claude Fable 5 vs GPT-5.6 Sol Claude Fable 5 vs Kimi K3 Claude Fable 5 vs Claude Opus 4.8 Claude Fable 5 vs Gemini 3.1 Pro Claude Fable 5 vs Claude Sonnet 5 Claude Fable 5 vs DeepSeek V4-Pro

全ペアを見る →