大規模推論モデル向け新ベンチマーク「PolitNuggets」発表
研究論文リポジトリのarXiv cs.AIは2026年5月13日(現地時間)、Yifei Zhu氏が大規模推論モデル(LRMs: Large Reasoning Models)向けの情報合成ベンチマーク「PolitNuggets」を発表したと報じた。これは、エージェントフレームワークに組み込まれたLRMsが、分散した情報源から「ロングテール」な政治的事実を発見し、合成する能力を評価するために設計された多言語ベンチマークである。
Tag
1 件の関連記事