ベンチマーク
ベンチマークとは?
別名: Benchmark
AIの性能を測るための共通テスト。
⚡ 30秒でわかる
ベンチマーク の主なポイント
- 1 AIモデルの性能を比較するために使われる、共通のテスト問題のことです。
- 2 MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。
📖 詳しく
ベンチマーク とは
AIモデルの性能を比較するために使われる、共通のテスト問題のことです。
MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。
❓ FAQ
よくある質問
- Q. ベンチマーク とは何ですか?
- A. AIの性能を測るための共通テスト。 AIモデルの性能を比較するために使われる、共通のテスト問題のことです。
- Q. ベンチマーク の主な特徴は?
- A. AIモデルの性能を比較するために使われる、共通のテスト問題のことです。 MMLU・SWE-Bench・HumanEval などが有名で、各社の新モデル発表時に必ず引き合いに出されます。
- Q. ベンチマーク に関連する用語は?
- A. 「MMLU」、「SWE-Bench」などが関連しています。
- Q. ベンチマーク の別名は?
- A. Benchmark とも呼ばれます。