ai-garage
ベンチマーク

ベンチマークとは?

別名: Benchmark

AIの性能を測るための共通テスト。

⚡ 30秒でわかる

ベンチマーク の主なポイント

  • 1 AIモデルの性能を比較するために使われる、共通のテスト問題のことです。
  • 2 MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。

📖 詳しく

ベンチマーク とは

AIモデルの性能を比較するために使われる、共通のテスト問題のことです。 MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。

❓ FAQ

よくある質問

Q. ベンチマーク とは何ですか?
A. AIの性能を測るための共通テスト。 AIモデルの性能を比較するために使われる、共通のテスト問題のことです。
Q. ベンチマーク の主な特徴は?
A. AIモデルの性能を比較するために使われる、共通のテスト問題のことです。 MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。
Q. ベンチマーク に関連する用語は?
A. 「MMLU」、「SWE-Bench」などが関連しています。
Q. ベンチマーク の別名は?
A. Benchmark とも呼ばれます。

🔗 関連

あわせて読みたい

関連用語

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →