Back to list
arxiv_cs_cv 2026年2月10日

MAU-GPT: Anomaly-aware and Generalist Experts Adaptation によるマルチタイプ産業異常理解の強化

MAU-GPT: Enhancing Multi-type Industrial Anomaly Understanding via Anomaly-aware and Generalist Experts Adaptation

Translated: 2026/2/11 4:21:03

Japanese Translation

arXiv:2602.07011v1 公開タイプ: new 概要: 産業製造が拡大するにつれて、品質管理のための細粒度な製品画像解析の自動化が重要になっている。しかし、既存のアプローチはデータセットのカバレッジ不足と、多様で複雑な異常パターンに対するモデルの一般化性能の低さによって制約されている。これらの課題に対処するため、本研究では Multi-type industrial Anomaly Understanding のための包括的データセット MAU-Set を導入する。MAU-Set は複数の産業ドメインにまたがり、二値分類(binary classification)から高度な推論に至る階層的なタスク構造を備えている。本データセットに加え、公平かつ包括的なモデル評価を促進する厳密な評価プロトコルを確立する。これらを基盤として、産業異常理解向けにドメイン適応させたマルチモーダル大規模モデル MAU-GPT をさらに提案する。MAU-GPT は、異常に配慮した(anomaly-aware)と汎用エキスパート(generalist experts)の適応を統合する新規の AMoE-LoRA 機構を取り入れ、さまざまな欠陥クラスにわたる理解と推論の両面を強化する。広範な実験により、MAU-GPT は全ドメインにおいて従来の state-of-the-art 手法を一貫して上回ることを示し、スケーラブルで自動化された産業検査に対する強い可能性を示した。

Original Content

arXiv:2602.07011v1 Announce Type: new Abstract: As industrial manufacturing scales, automating fine-grained product image analysis has become critical for quality control. However, existing approaches are hindered by limited dataset coverage and poor model generalization across diverse and complex anomaly patterns. To address these challenges, we introduce MAU-Set, a comprehensive dataset for Multi-type industrial Anomaly Understanding. It spans multiple industrial domains and features a hierarchical task structure, ranging from binary classification to complex reasoning. Alongside this dataset, we establish a rigorous evaluation protocol to facilitate fair and comprehensive model assessment. Building upon this foundation, we further present MAU-GPT, a domain-adapted multimodal large model specifically designed for industrial anomaly understanding. It incorporates a novel AMoE-LoRA mechanism that unifies anomaly-aware and generalist experts adaptation, enhancing both understanding and reasoning across diverse defect classes. Extensive experiments show that MAU-GPT consistently outperforms prior state-of-the-art methods across all domains, demonstrating strong potential for scalable and automated industrial inspection.