MCBench発表、Omni LLM向け多角的安全性評価ベンチマーク
arXiv cs.CLが2026年4月17日(現地時間)付けで報じた。Manh Luong氏らが論文「MCBench: A Multicontext Safety Assessment Benchmark for Omni Large Language Models」を発表し、視覚、音声、テキストを統合処理するOmni Large Language Models (LLMs) の安全性評価に特化した新たなベンチマーク「MCBench」を導入した。従来のマルチモーダル安全性ベンチマークが視覚入力に限定されていたのに対し、MCBenchは複数のモダリティの統合を必要とする1196の多様なシナリオと4つの安全カテゴリを網羅する。