OpenAI、AI内部推論「思考連鎖」監視の新評価フレームワーク提示
OpenAIは12月18日(現地時間)、AIシステムの内部推論プロセスであるchain-of-thought(思考連鎖)の監視可能性を体系的に評価する研究結果とフレームワークを発表した。同社は、AIが決定を下す際の思考プロセスを理解することの重要性を強調しており、これには不正行為や意図の検出も含まれると説明した。同研究は、13の異なる評価と合計24の環境で構成される評価スイートを導入し、推論モデルの振る舞いを監視する能力を具体的に測定するとしている。