Vision-Language Models、曖昧な入力で女性表現を抑制する傾向

arXiv cs.CVが2026年5月29日(現地時間)付けで報じたところによると、Vision-Language Models (VLM) は、性別が曖昧な入力に対して女性の表現を抑制する傾向があることが、Arnau Marin-Llobet氏らの新たな研究で示された。この研究では、全身装備の作業員や後ろ姿の人物といった曖昧な入力画像に対し、VLMが特定の職業と性別のデフォルト設定を露呈し、強く女性的な職業であっても男性を出力する事例が確認された。

Vision-Language Models (VLM) のアライメントは、デモグラフィックバイアスを避けるよう設計されているが、性別が明確に表示されている場合にはその目的を達成しているとされる。しかし、実践で頻繁に発生しながらも研究が手薄であった曖昧な入力（例：全身装備の作業員、後ろ姿の人物）に関する知見は不足していた。

研究チームは、LALS (Latent Association Leaning Score) と呼ばれるゼロショットメトリックを導入した。これは、視覚トークンのアクティベーションをモデルのテキスト埋め込み空間に投影し、トークンおよびレイヤーごとの概念関連性を測定する。15の職業、800以上の性別が曖昧な画像、および4つのVLMを対象に実験を行った結果、モデルの内部表現と出力が体系的に分離していることが明らかになった。VLMは多くの場合、内部的に女性の関連付けをエンコードしているにもかかわらず、男性を出力する。

レイヤーごとの分析では、非対称なフィルターの存在が示された。男性シグナルはエンドツーエンドで増幅される一方、女性シグナルはネットワークの中間でピークに達した後、生成前に抑制されることが判明した。さらに、色彩除去実験からは、衣服の色など文化的な要素を帯びた視覚的合図が、これらの内部関連付けをさらに変調させることが示されている。

参考: arXiv cs.CV — 2026年5月30日 02:20 (JST)