Back to list
HQF-Net: 遠隔センシング画像分割のための混合量子・古典的マルチスケーリング融和网络
HQF-Net: A Hybrid Quantum-Classical Multi-Scale Fusion Network for Remote Sensing Image Segmentation
Translated: 2026/4/20 10:51:43
Japanese Translation
arXiv:2604.06715v2 Announce Type: replace
摘要:遠隔センシングのセマンティック分割では、複雑なシーンにおいて微細な空間詳細と高次セマンティック文脈を同時に捉えることが求められるモデルが必要である。従来のエンコーダー・デコーダー型アーキテクチャ(例:U-Net)は依然として強力なベースラインだが、グローバルなセマンティクスや構造化された特徴の相互作用を十分に活用することは困難である。本稿では、遠隔センシング画像分割のために提案する混合量子・古典的マルチスケーリング融和网络である HQF-Net について述べる。HQF-Net は、凍結された DINOv3 ViT-L/16 バックボーンからのマルチスケーリングセマンティックガイダンスを、DMCAF(変形マルチスケーリングクロスアットンション融和网络)モジュールを通じてカスタマイズされた U-Net アーキテクチャと統合する。特徴の細分化を強化するために、本フレームワークは QSkip(量子強化スリープ接続)および QMoE(ミキスト・オブ・エキスパートの量子ボトルネック)を追加する。QMoE は、適応ルティング機構内で補完的なローカル、グローバル、および方向性量子回路を統合する。3 つの遠隔センシングベンチマークにおける実験は、提案された設計による一貫した改善を示している。HQF-Net は LandCover.ai で mIoU 0.8568、全体精度 96.87%、OpenEarthMap で mIoU 71.82%、SeasoNet で mIoU 55.28%、全体精度 99.37% を達成した。また、アーキテクチャアブレーション研究は、各主要コンポーネントの寄与をさらに確認した。これらの結果は、近代的な量子制約下で遠隔センシングのセマンティック分割を向上させる上で、構造化された混合量子・古典的特徴処理が有望な方向であることを示している。
Original Content
arXiv:2604.06715v2 Announce Type: replace
Abstract: Remote sensing semantic segmentation requires models that can jointly capture fine spatial details and high-level semantic context across complex scenes. While classical encoder-decoder architectures such as U-Net remain strong baselines, they often struggle to fully exploit global semantics and structured feature interactions. In this work, we propose HQF-Net, a hybrid quantum-classical multi-scale fusion network for remote sensing image segmentation. HQF-Net integrates multi-scale semantic guidance from a frozen DINOv3 ViT-L/16 backbone with a customized U-Net architecture through a Deformable Multiscale Cross-Attention Fusion (DMCAF) module. To enhance feature refinement, the framework further introduces quantum-enhanced skip connections (QSkip) and a Quantum bottleneck with Mixture-of-Experts (QMoE), which combines complementary local, global, and directional quantum circuits within an adaptive routing mechanism. Experiments on three remote sensing benchmarks show consistent improvements with the proposed design. HQF-Net achieves 0.8568 mIoU and 96.87% overall accuracy on LandCover.ai, 71.82% mIoU on OpenEarthMap, and 55.28% mIoU with 99.37% overall accuracy on SeasoNet. An architectural ablation study further confirms the contribution of each major component. These results show that structured hybrid quantum-classical feature processing is a promising direction for improving remote sensing semantic segmentation under near-term quantum constraints.