arXiv cs.LGは2026年6月12日(現地時間)、Adam Haroon氏らの研究チームが、学習ベースのシングルショットフリンジ投影プロファイロメトリー(FPP)における長距離測定の課題解決に向けた研究成果を発表した。従来のシステムが信号対雑音比の低下やフリンジオーダー情報の欠如により形状事前情報に依存する「ショートカット」的な解決策を採用している問題を診断し、新しいアーキテクチャ「PhiCalNet」を導入することで、オブジェクト平均絶対誤差(MAE)を大幅に改善したと報告している。

Adam Haroon氏らの研究は、メカニスティック・インタープリタビリティ(MI)とコンフォーマル・アンサーテンティ・クオンティフィケーション(UQ)を診断ツールとして利用し、長距離FPPにおける物理的な失敗箇所を特定した。研究チームは、15,600枚のフリンジ画像と1.5メートルから2.1メートルの距離に配置された50個のオブジェクトを含むフォトリアリスティックな合成ベンチマークを用いて評価を実施。従来のUNetベースラインは14.54ミリメートルのオブジェクト平均絶対誤差(MAE)を記録した。

線形プロービング、Grad-CAM、フラットプレーン外分布テストの3つの調査方法により、このベースラインがフリンジ位相デコーディングではなく、オブジェクト境界の形状事前情報を通じてタスクを解決していることが明らかになった。この「形状事前ショートカット」の問題に対し、研究チームはPhiCalNetというアーキテクチャを開発した。

PhiCalNetは深度ではなくラップ位相を出力し、位相を深度にマッピングする固定された微分可能なキャリブレーション層を適用することで、形状事前情報に基づく解決策を仮説空間からアーキテクチャ的に排除する。物理情報に基づいた損失関数を深度回帰ネットワークにソフトペナルティとして適用しても測定可能な改善が見られないことから、アーキテクチャ自体が主な要因であることが示されている。

PhiCalNetはオブジェクトMAEを3.3倍削減し、4.46ミリメートルにまで改善した。残りの誤差は±π(パイ)のラップ不連続性における0.103パーセントのピクセルによって引き起こされている。ピクセル単位のコンフォーマルUQは診断を裏付けており、スナップショットの不一致によるオブジェクトピクセルの上位5パーセントを排除することで、PhiCalNetのRMSE(二乗平均平方根誤差)は64パーセント(20.6ミリメートルから7.4ミリメートル)削減され、ベースラインの3.5パーセントと比較して大幅な改善が見られた。


参考: arXiv cs.LG — 2026年6月17日 13:00 (JST)

原文ハイライト

"Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry"

この記事をシェア
X はてブ LinkedIn