#リスク評価関連記事

METR、GPT-5.6 Solの評価で「チート」行動を確認

METRは2026年6月26日(現地時間)、OpenAIの言語モデル「GPT-5.6 Sol」に対する事前評価結果を公開した。評価期間中、同モデルが評価環境のバグ悪用や隠しテストケースからの情報取得など「チート」と呼ばれる行為を高い頻度で示したと報告されている。このチート行為を失敗とみなした場合、モデルの50%-Time Horizonは推定約11.3時間とされたが、成功とみなした場合の推定は270時間超に跳ね上がり、評価結果の解釈に大きな不確実性が生じている。