ロングコンテキスト評価とは何ですか？

長文の中の情報を正しく拾えるかのテスト。「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。

ロングコンテキスト評価に関連する用語は？

「コンテキストウィンドウ」、「ベンチマーク」などが関連しています。

Needle in a Haystack、MRCR とも呼ばれます。

ベンチマーク

長文の中の情報を正しく拾えるかのテスト。 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。

「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。

別名: Needle in a Haystack / MRCR

長文の中の情報を正しく拾えるかのテスト。

⚡ 30秒でわかる

📖 詳しく

「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。

❓ FAQ

Q. ロングコンテキスト評価とは何ですか？: A. 長文の中の情報を正しく拾えるかのテスト。「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
Q. ロングコンテキスト評価の主な特徴は？: A. 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。
Q. ロングコンテキスト評価に関連する用語は？: A. 「コンテキストウィンドウ」、「ベンチマーク」などが関連しています。
Q. ロングコンテキスト評価の別名は？: A. Needle in a Haystack、MRCR とも呼ばれます。

🔗 関連