arXiv、機械学習モデル解釈性向上へ新指標「テンソル類似性」導入
ML Nissen Gonzalez氏らの研究者グループは5月14日(現地時間)、機械学習モデルの機械的解釈性 (mechanistic interpretability) を高める新たな評価指標「テンソル類似性 (tensor similarity)」に関する研究論文をarXiv cs.LGで発表した。この指標は、モデルを意味のある部分に分解し、それらが同一の計算を実装しているかを検証する目的で開発された。従来の類似性測定が抱える、分布外メカニズムへの対応不足や重み空間対称性の無視といった課題の解決を目指すものとされている。