Back to list
実世界における西園橘の検出性能を向上させる多戦略フレームワーク
A Multi-Strategy Framework for Enhancing Shatian Pomelo Detection in Real-World Orchards
Translated: 2026/3/15 14:46:46
Japanese Translation
arXiv:2510.09948v2 Announce Type: replace
摘要:果園における西園橘の検出は収量推定とリーン製造にとって不可欠ですが、理想的なデータセットに最適化されたモデルは、デバイス依存のトーンシフト、照明の変化、大規模なスケール変化、および頻繁な被写体の覆い隠れにより、実際の現場では性能が低下しがちです。われわれは、実果園画像と厳選されたウェブ画像を組み合わせた多シナリオデータセット「STP-AgriData」を導入し、不安定な照明をシミュレートするためにコントラスト/明るさの拡張を適用しました。スケール変化および被写体の覆い隠れに対してより効果的に取り組むために、グローバルセマンティック指導の下で可視特徴空間を拡張し、効率的な空間集積を保ちながら、同時に対象を分離・局所化を精査する GSV-Conv、C3RFEM、MultiSEAM、および Soft-NMS を特徴とする「REAS-Det」を提案しました。STP-AgriData 上で REAS-Det は 86.5% の適合率、77.2% の再現率、mAP@0.50 で 84.3%、mAP@0.50:0.95 で 53.6% の結果を達成し、最新の検出器を上回ると同時に、実果園環境における頑健性を向上させました。ソースコードは次の网址にアクセス可能です:https://github.com/Genk641/REAS-Det.
Original Content
arXiv:2510.09948v2 Announce Type: replace
Abstract: Shatian pomelo detection in orchards is essential for yield estimation and lean production, but models tuned to ideal datasets often degrade in practice due to device-dependent tone shifts, illumination changes, large scale variation, and frequent occlusion. We introduce STP-AgriData, a multi-scenario dataset combining real-orchard imagery with curated web images, and apply contrast/brightness augmentations to emulate unstable lighting. To better address scale and occlusion, we propose REAS-Det, featuring Global-Selective Visibility Convolution (GSV-Conv) that expands the visible feature space under global semantic guidance while retaining efficient spatial aggregation, plus C3RFEM, MultiSEAM, and Soft-NMS for refined separation and localization. On STP-AgriData, REAS-Det achieves 86.5% precision, 77.2% recall, 84.3% mAP@0.50, and 53.6% mAP@0.50:0.95, outperforming recent detectors and improving robustness in real orchard environments. The source code is available at: https://github.com/Genk641/REAS-Det.