ai-garage
ベンチマーク

ロングコンテキスト評価とは?

別名: Needle in a Haystack / MRCR

長文の中の情報を正しく拾えるかのテスト。

⚡ 30秒でわかる

ロングコンテキスト評価 の主なポイント

  • 1 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
  • 2 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。

📖 詳しく

ロングコンテキスト評価 とは

「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。

❓ FAQ

よくある質問

Q. ロングコンテキスト評価 とは何ですか?
A. 長文の中の情報を正しく拾えるかのテスト。 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。
Q. ロングコンテキスト評価 の主な特徴は?
A. 「100万トークンの中に隠した1行をAIが拾えるか」というタイプの評価です。 コンテキストウィンドウが伸びた今、見かけのトークン数より「本当に使えるか」を測る指標として重要になっています。
Q. ロングコンテキスト評価 に関連する用語は?
A. 「コンテキストウィンドウ」、「ベンチマーク」などが関連しています。
Q. ロングコンテキスト評価 の別名は?
A. Needle in a Haystack、MRCR とも呼ばれます。

🔗 関連

あわせて読みたい

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →