ベンチマーク
ロングコンテキスト評価とは?
別名: Needle in a Haystack / MRCR
長文の中の情報を正しく拾えるかのテスト。
⚡ 30秒でわかる
ロングコンテキスト評価 の主なポイント
- 1 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
- 2 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。
📖 詳しく
ロングコンテキスト評価 とは
「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。
❓ FAQ
よくある質問
- Q. ロングコンテキスト評価 とは何ですか?
- A. 長文の中の情報を正しく拾えるかのテスト。 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
- Q. ロングコンテキスト評価 の主な特徴は?
- A. 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。
- Q. ロングコンテキスト評価 に関連する用語は?
- A. 「コンテキストウィンドウ」、「ベンチマーク」などが関連しています。
- Q. ロングコンテキスト評価 の別名は?
- A. Needle in a Haystack、MRCR とも呼ばれます。