Back to list
CVPR2026 NTIRE チャレンジの勝者:並列精製の経路上なセマンティックおよび幾何学的ガイダンスによる画像の陰影除去
Winner of CVPR2026 NTIRE Challenge on Image Shadow Removal: Semantic and Geometric Guidance for Shadow Removal via Cascaded Refinement
Translated: 2026/4/20 10:45:48
Japanese Translation
arXiv:2604.16177v1 Announce Type: new
要旨: 我々は CVPR2026 NTIRE WSRD+ チャレンジのための 3 段階的な逐次的陰影除去パイプラインを発表する。OmniSR を基にした我々の手法は、陰影除去を逐直接的な改善として取り扱うもので、後段は前段の予測で残された残像アーティファクトを修正する。モデルは RGB 外観と凍結された DINOv2 セマンティックガイダンスに加え、単眼深度と表面ノルマルからの幾何学的情報が組み合わさっている。これらはいかなる段階でも再利用される。複数段階の最適化を安定させるため、カスケード全体で再構成誤差が減少傾向になるように促す制約付き最適化目標を導入した。段階的なトレーニングパイプラインでは、早期の WSRD 事前訓練から WSRD+ 監督、そして最終的な WSRD+ 2026 適応(余弦アンリーチによるチェックポイントアンサンブル)へと移行した。公式 WSRD+ 2026 ヒットンテストセットにおいて、我々の最終アンサンブルは 26.680 PSNR, 0.8740 SSIM, 0.0578 LPIPS, および 26.135 FID を達成し、総合的に 1 位を記録し、NTIRE 2026 画像陰影除去チャレンジを優勝した。提案されたモデルの強力な性能は、さらに ISTD+ および UAV-SC+ データセットで検証された。
Original Content
arXiv:2604.16177v1 Announce Type: new
Abstract: We present a three-stage progressive shadow-removal pipeline for the CVPR2026 NTIRE WSRD+ challenge. Built on OmniSR, our method treats deshadowing as iterative direct refinement, where later stages correct residual artefacts left by earlier predictions. The model combines RGB appearance with frozen DINOv2 semantic guidance and geometric cues from monocular depth and surface normals, reused across all stages. To stabilise multi-stage optimisation, we introduce a contraction-constrained objective that encourages non-increasing reconstruction error across the cascade. A staged training pipeline transfers from earlier WSRD pretraining to WSRD+ supervision and final WSRD+ 2026 adaptation with cosine-annealed checkpoint ensembling. On the official WSRD+ 2026 hidden test set, our final ensemble achieved 26.680 PSNR, 0.8740 SSIM, 0.0578 LPIPS, and 26.135 FID, ranked first overall, and won the NTIRE 2026 Image Shadow Removal Challenge. The strong performance of the proposed model is further validated on the ISTD+ and UAV-SC+ datasets.