Back to list
arxiv_cs_cv 2026年2月10日

CA-YOLO:生物ミメティックな局部化のためにクロス注意力機能を強化した YOLO

CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization

Translated: 2026/3/15 18:03:41
ca-yolobiomorphic-localizationcross-attentionobject-detectioncomputer-vision

Japanese Translation

arXiv:2602.07523v1 Announce Type: new 要旨:現代の複雑な環境において、正確かつ効率的な対象局部化は多数の分野で不可欠となっています。しかし、既存のシステムでは精度や小さな対象の識別能力に制約が存在します。本研究では、CA-YOLO に基づいた生物学的に安定した局部化システムを提案し、対象局部化精度と小さな対象の識別能力の両方を向上させます。このシステムの「脳」として機能する対象検出アルゴリズムは、動物の視覚的焦点調整メカニズムを模倣するために YOLO 背骨ネットワークに生物学的モジュールを統合しています。これらのモジュールには、小さな対象検出ヘッダーの導入と、特性融合注意力メカニズム(CFAM)の開発が含まれます。さらに、人間の眼頭位反射(VOR)からヒントを得て、中央位置調整、安定性最適化、適応制御係数の調整、および知的な再追跡機能を備えた生物学的なパン・ティルト追従制御戦略が開発されました。実験結果は、CA-YOLO が標準的なデータセット(COCO と VisDrone)で元のモデルを凌駕しており、平均精度がそれぞれ 3.94% と 4.90% 向上したことを示しました。また、時間的制約を受ける対象局部化実験は、この生物学的に安定した局部化システムの有効性と実用性を検証しました。

Original Content

arXiv:2602.07523v1 Announce Type: new Abstract: In modern complex environments, achieving accurate and efficient target localization is essential in numerous fields. However, existing systems often face limitations in both accuracy and the ability to recognize small targets. In this study, we propose a bionic stabilized localization system based on CA-YOLO, designed to enhance both target localization accuracy and small target recognition capabilities. Acting as the "brain" of the system, the target detection algorithm emulates the visual focusing mechanism of animals by integrating bionic modules into the YOLO backbone network. These modules include the introduction of a small target detection head and the development of a Characteristic Fusion Attention Mechanism (CFAM). Furthermore, drawing inspiration from the human Vestibulo-Ocular Reflex (VOR), a bionic pan-tilt tracking control strategy is developed, which incorporates central positioning, stability optimization, adaptive control coefficient adjustment, and an intelligent recapture function. The experimental results show that CA-YOLO outperforms the original model on standard datasets (COCO and VisDrone), with average accuracy metrics improved by 3.94%and 4.90%, respectively.Further time-sensitive target localization experiments validate the effectiveness and practicality of this bionic stabilized localization system.