VS COMPARISON

Google

Gemini 3.1 Flash

3.1 Flash ／ 2026-04

Llama 5

Llama 5 ／ 2026-04-08

編集部の総合判定

純粋なベンチマーク性能では明確に Llama 5 優位

ベンチ勝ち：Gemini 3.1 Flash 0 / Llama 5 4 料金で安い項目：Gemini 3.1 Flash 2 / Llama 5 0

SPECS

仕様の比較

項目	Gemini 3.1 Flash	Llama 5
バージョン	3.1 Flash	Llama 5
公開日	2026-04	2026-04-08
コンテキスト長	1049K	5000K 勝ち
入力料金 $/1M	$0.3 安い	—
出力料金 $/1M	$2.5 安い	—
推論モデル	✓ あり	✓ あり
マルチモーダル	✓ あり	✓ あり

BENCHMARKS

ベンチマーク差分

バーの長さは100%スケール。長い方が勝ち。

SWE-Bench

Gemini 3.1 Flash

65%

Llama 5

75% 勝ち

MMLU

Gemini 3.1 Flash

84%

Llama 5

87% 勝ち

GPQA

Gemini 3.1 Flash

78%

Llama 5

80% 勝ち

AIME

Gemini 3.1 Flash

80%

Llama 5

82% 勝ち

※ SWE-Bench Verified（実OSSバグ修正）/ MMLU（総合学力）/ GPQA Diamond（博士レベル理系）/ AIME（数学オリンピック予選）

PROS & CONS

強み・弱み

Gemini 3.1 Flash

Google 製。Workspace 連携と長文処理（1M tokens）で頭ひとつ抜けてる。

◎ 強み

◎ Gmail / Docs / Sheets / Slides と連携
◎ 画像・動画・音声・PDFの理解が強い
◎ 1M tokens の長いコンテキスト
◎ Deep Research Max など独自機能

△ 注意点

△ 回答の口調がやや堅め

公式サイト →

Llama 5

Meta 製のオープンウェイト LLM。Llama 5 で 600B+ params / 5M context へ進化。

◎ 強み

◎ 中身（重み）が公開されている
◎ 自分の PC・サーバーで動かせる
◎ 派生モデル・改造モデルが豊富
◎ Llama Guard 4 同梱で安全制御も標準装備

公式サイト →

USE CASES

用途別のおすすめ

Gemini 3.1 Flash か Llama 5 を取り上げてるタスク 8件

PRIMARY SOURCES

一次ソース

Gemini 3.1 Flash

Llama 5

OTHER COMPARISONS

他のペアも見る

GPT-5.5 vs Gemini 3.1 Pro GPT-5.5 vs Claude Opus 4.7 GPT-5.5 vs Claude Sonnet 4.6 GPT-5.5 vs Grok 4.20 Beta 2 GPT-5.5 vs Qwen3.6-27B GPT-5.5 vs DeepSeek-V4 Preview

全ペアを見る →

Gemini 3.1 Flash

Llama 5

仕様の比較

ベンチマーク差分

強み・弱み

Gemini 3.1 Flash

Llama 5

用途別のおすすめ

メール・チャットの返信を書く

Excel・データを分析する

ウェブを横断して調べる

情報の真偽を確認する

ブログ記事・レポートを書く

プレゼン資料・スライドを作る

翻訳する

AIと音声で会話する

一次ソース

他のペアも見る