Back to list
DAS-SK: 農業のセマンティックセグメンテーションに適応する二重アトロス可分離および選択核 CNN を統合した軽量モデル
DAS-SK: An Adaptive Model Integrating Dual Atrous Separable and Selective Kernel CNN for Agriculture Semantic Segmentation
Translated: 2026/3/15 19:05:00
Japanese Translation
arXiv:2602.08168v1 発表タイプ:新
抽出:
高解像度の農業画像におけるセマンティックセグメンテーションは、実用システムへの展開を可能にするためには、精度と計算効率のバランスを慎重に調整する必要がある。本研究では、多スケール特徴量の学習を強化するために選択核畳み込み(SK-Conv)を二重アトロス可分離畳み込み(DAS-Conv)モジュールに統合した、新しい軽量アーキテクチャである DAS-SK を提案する。さらに、モデルは細粒度な局所的構造と広域的文脈情報の両方を捕捉できるように、アトロス空間ピラミッドプーリング(ASPP)モジュールを強化している。DAS-SK モデルは、二つの補完的なバックボーン(MobileNetV3-Large と EfficientNet-B3)を持つ変更された DeepLabV3 フレームワークに基づいており、大規模データセット要件の制限、スペクトル一般化の制限、および UAV または他のエッジデバイスへの展開を通常制限する高い計算コストを緩和する。LandCover.ai、VDD、および PhenoBench の 3 つのベンチマークにおける包括的な実験は、DAS-SK が一貫して最上位の実績(state-of-the-art)を達成しており、CNN、トランスフォーマー、およびハイブリッドに基づく競合他社よりも効率的であることを示している。特に、DAS-SK は最上位のパフォーマンスを記録しているトランスフォーマーモデルと比較して、パラメータ数が最大 21 倍減、GFLOPs が最大 19 倍減である。これらの発見は、DAS-SK をリアルタイム農業ロボティクスと高解像度遠隔センシングのための堅牢で効率的かつスケーラブルなソリューション、および他のビジョンドメインへの広い展開の可能性を示していることを確立した。
Original Content
arXiv:2602.08168v1 Announce Type: new
Abstract: Semantic segmentation in high-resolution agricultural imagery demands models that strike a careful balance between accuracy and computational efficiency to enable deployment in practical systems. In this work, we propose DAS-SK, a novel lightweight architecture that retrofits selective kernel convolution (SK-Conv) into the dual atrous separable convolution (DAS-Conv) module to strengthen multi-scale feature learning. The model further enhances the atrous spatial pyramid pooling (ASPP) module, enabling the capture of fine-grained local structures alongside global contextual information. Built upon a modified DeepLabV3 framework with two complementary backbones - MobileNetV3-Large and EfficientNet-B3, the DAS-SK model mitigates limitations associated with large dataset requirements, limited spectral generalization, and the high computational cost that typically restricts deployment on UAVs and other edge devices. Comprehensive experiments across three benchmarks: LandCover.ai, VDD, and PhenoBench, demonstrate that DAS-SK consistently achieves state-of-the-art performance, while being more efficient than CNN-, transformer-, and hybrid-based competitors. Notably, DAS-SK requires up to 21x fewer parameters and 19x fewer GFLOPs than top-performing transformer models. These findings establish DAS-SK as a robust, efficient, and scalable solution for real-time agricultural robotics and high-resolution remote sensing, with strong potential for broader deployment in other vision domains.