VLMの失敗モードを体系的に解明 新フレームワーク「レベリオ」が安全性向上へ
arXiv cs.AIは2026年5月12日(現地時間)、ビジョン言語モデル (Vision-Language Models、VLM) の解釈可能な失敗モードを体系的に特定する新フレームワーク「レベリオ (REVELIO)」が発表されたと報じた。VLMは高い推論能力と汎化性から、安全性が重視される応用分野での利用が拡大している。しかし、特定の現実世界状況下で壊滅的な失敗を招く可能性が課題となっていた。レベリオは、従来の評価手法との差別化を図り、VLMの安全性向上に大きく寄与すると期待される。