Back to list
霧気のある野生動物画像の向上:AnimalHaze3k と IncepDehazeGan
Enhancing Hazy Wildlife Imagery: AnimalHaze3k and IncepDehazeGan
Translated: 2026/4/20 10:46:53
Japanese Translation
arXiv:2604.16284v1 Announce Type: new
要約:大気による霧気は、保護のための重要なコンピュータビジョンアプリケーション(動物検出、トラッキング、行動分析など)を妨げ、野生動物画像を著しく劣化させます。この課題に対処するため、我々は、物理ベースのパイプラインを用いて 1,159 枚のクリアな野生動物写真から生成された 3,477 枚の霧気画像を含む合成データセット「AnimalHaze3k」を発表しました。我々の新しい「IncepDehazeGan」アーキテクチャは、GAN フレームワーク内でインセプションブロックとリダクションスキップ結合を組み合わせており、最先端のパフォーマンス(SSIM: 0.8914, PSNR: 20.54, LPIPS: 0.1104)を実現し、競合手法に比べて SSIM が 6.27% 高く、PSNR が 10.2% 改善されています。これらの画像を応用した下流の検出タスクにおいて、霧気を除いた画像は YOLOv11 の検出 mAP を 112% 向上させ、IoU を 67% 向上させました。これらの進歩は、困難な環境条件下における個体数モニタリングと監視のための信頼性の高いツールを提供でき、強力なビジュアルアナリティクスを通じて野生動物保護の取り組みを強化する可能性を大いに示しています。
Original Content
arXiv:2604.16284v1 Announce Type: new
Abstract: Atmospheric haze significantly degrades wildlife imagery, impeding computer vision applications critical for conservation, such as animal detection, tracking, and behavior analysis. To address this challenge, we introduce AnimalHaze3k a synthetic dataset comprising of 3,477 hazy images generated from 1,159 clear wildlife photographs through a physics-based pipeline. Our novel IncepDehazeGan architecture combines inception blocks with residual skip connections in a GAN framework, achieving state-of-the-art performance (SSIM: 0.8914, PSNR: 20.54, and LPIPS: 0.1104), delivering 6.27% higher SSIM and 10.2% better PSNR than competing approaches. When applied to downstream detection tasks, dehazed images improved YOLOv11 detection mAP by 112% and IoU by 67%. These advances can provide ecologists with reliable tools for population monitoring and surveillance in challenging environmental conditions, demonstrating significant potential for enhancing wildlife conservation efforts through robust visual analytics.