NEWS (2)
ニュース
2026/5/14
AIの『長時間タスク能力』、業界予想を吹き飛ばす伸び!MythosとGPT-5.5が『16時間タスク』ラインに突入したよ
ITmediaが2026年5月14日に伝えた話題。米METRと英AISIの最新評価で、Anthropic『Claude Mythos Preview』とOpenAI『GPT-5.5』が長時間タスク遂行能力で従来予想を大幅超過。50%タイムホライズン16時間以上、80%タイムホライズンも4.7カ月ごとの倍増ペースを超えた事実を、てんびん丸が整理するよ。
2026/5/6
Hugging Face、ASRリーダーボードに『ベンチマクサー忌避剤』を投入。ズル対策が一段階えぐくなったよ
音声認識ベンチマーク Open ASR Leaderboard が、Appen と DataoceanAI の非公開データセット11本(約30時間)を導入。ベンチマーク特化のチューニングを締め出して、本物の精度勝負に持ち込む新方式を解説。