Back to list
構造化された輸送帯石炭シーンにおける非構造化な异物异常检测与像素级定位のための多分岐融合および意味的偏異アンカー付け
Semantic-Deviation-Anchored Multi-Branch Fusion for Unsupervised Anomaly Detection and Localization in Unstructured Conveyor-Belt Coal Scenes
Translated: 2026/3/15 18:05:46
Japanese Translation
arXiv:2602.07694v1 Announce Type: new
要約: 輸送帯石炭シーンにおける信頼性の高い异物异常検出とピクセルレベルの定位は、安全かつ知的な採鉱運営のために不可欠です。このタスクは、石炭と脈石がランダムに積み上げられている、背景が複雑かつ多様な、そして异物が低コントラスト、変形、および被覆を示すために非常に困難です。これらの特性は异物とその周囲が結合しており、構造化的な産業環境で多くの異常検出手法が依存する安定性と規則性を弱体化させます。この設定での評価と比較をサポートするために、私たちは石炭流シーンにおける异物异常検出にピクセルレベルの定位を含んだ非監督異常検出のベンチマーク、CoalAD を構築しました。私たちはさらに、物体レベルの意味的組成モデリング、意味的帰属に基づく全体的偏差分析、および微細なテクチャマッチングからの 3 つの視点からの補完的異常証拠を抽出し融合させる補完的 Cue 協調的な感知フレームワークを提案しました。融合された出力は、頑健なイメージレベルの異常スコアリングと正確なピクセルレベルの定位を提供します。CoalAD での実験では、我々の手法が評価されたイメージレベルおよびピクセルレベルの指標において広く使用されているベースラインより優れていることを示しており、消融研究は各成分の貢献を検証しました。コードは https://github.com/xjpp2016/USAD に利用可能です。
Original Content
arXiv:2602.07694v1 Announce Type: new
Abstract: Reliable foreign-object anomaly detection and pixel-level localization in conveyor-belt coal scenes are essential for safe and intelligent mining operations. This task is particularly challenging due to the highly unstructured environment: coal and gangue are randomly piled, backgrounds are complex and variable, and foreign objects often exhibit low contrast, deformation, occlusion, resulting in coupling with their surroundings. These characteristics weaken the stability and regularity assumptions that many anomaly detection methods rely on in structured industrial settings, leading to notable performance degradation. To support evaluation and comparison in this setting, we construct \textbf{CoalAD}, a benchmark for unsupervised foreign-object anomaly detection with pixel-level localization in coal-stream scenes. We further propose a complementary-cue collaborative perception framework that extracts and fuses complementary anomaly evidence from three perspectives: object-level semantic composition modeling, semantic-attribution-based global deviation analysis, and fine-grained texture matching. The fused outputs provide robust image-level anomaly scoring and accurate pixel-level localization. Experiments on CoalAD demonstrate that our method outperforms widely used baselines across the evaluated image-level and pixel-level metrics, and ablation studies validate the contribution of each component. The code is available at https://github.com/xjpp2016/USAD.