Back to list
arxiv_cs_cv 2026年4月20日

Hero-Mamba: 深海水素像Enhancementのためのママンベースの双領域学習

Hero-Mamba: Mamba-based Dual Domain Learning for Underwater Image Enhancement

Translated: 2026/4/20 10:46:43
hero-mambaunderwater-image-enhancementmamba-architecturedeep-learningimage-restoration

Japanese Translation

arXiv:2604.16266v1 Announce Type: new Abstract: 水中画像は、光の吸収と散乱により色歪み、低コントラスト、そしてぼやけたディテールの著しい劣化を被ることがあります。CNN や Transformer などの学習ベースの手法は有望ですが、重要な限界に直面しています: CNN は不均一な劣化に必要な長距離依存関係をモデル化するのが苦手であり、Transformer は二次的な計算計算複雑性を持っており、高解像度画像に対して非効率的です。これらの課題に対処するため、Hero-Mamba という画期的なママンベースのネットワークを提案します。これは、水中画像エンハンスメントのための効率的な双領域学習を実現します。当社のアプローチは、空間領域 (RGB 画像) とスペクトル領域 (FFT 成分) の両方の情報を並列処理するユニークな特徴を持ちます。この双領域入力により、ネットワークは劣化因子を切り離せ、色/明るさ情報からテクスチャ/ノイズ情報を分けます。当社のネットワークの核心は、ママンベースの SS2D ブロックを利用し、線形複雑性を持つことで、グローバル受容領域と長距離依存関係をキャッチアップし、CNN と Transformer の両方の限界を克服します。さらに、背景光の優先事項に導かれる ColorFusion ブロックを導入し、色情報を高い忠実度で復元します。LSUI と UIEB ベンチマークデータセットでの広範な実験により、Hero-Mamba が最先进の手法を上回ることが示されました。特に、当社のモデルは LSUI で PSNR 25.802 と SSIM 0.913 を達成し、その上流への優越性と汎化能力を検証されました。

Original Content

arXiv:2604.16266v1 Announce Type: new Abstract: Underwater images often suffer from severe degradation, such as color distortion, low contrast, and blurred details, due to light absorption and scattering in water. While learning-based methods like CNNs and Transformers have shown promise, they face critical limitations: CNNs struggle to model the long-range dependencies needed for non-uniform degradation, and Transformers incur quadratic computational complexity, making them inefficient for high-resolution images. To address these challenges, we propose Hero-Mamba, a novel Mamba-based network that achieves efficient dual-domain learning for underwater image enhancement. Our approach uniquely processes information from both the spatial domain (RGB image) and the spectral domain (FFT components) in parallel. This dual-domain input allows the network to decouple degradation factors, separating color/brightness information from texture/noise. The core of our network utilizes Mamba-based SS2D blocks to capture global receptive fields and long-range dependencies with linear complexity, overcoming the limitations of both CNNs and Transformers. Furthermore, we introduce a ColorFusion block, guided by a background light prior, to restore color information with high fidelity. Extensive experiments on the LSUI and UIEB benchmark datasets demonstrate that Hero-Mamba outperforms state-of-the-art methods. Notably, our model achieves a PSNR of 25.802 and an SSIM of 0.913 on LSUI, validating its superior performance and generalization capabilities.