Back to list
uLEAD-TabPFN: 条件付き依存関係の違反を検出する PFN ベースの不安定性感知型依存関係ベースのアノーマリー検出
uLEAD-TabPFN: Uncertainty-aware Dependency-based Anomaly Detection with TabPFN
Translated: 2026/4/24 19:57:51
Japanese Translation
arXiv:2604.20255v1 Announce Type: new
摘粋: テーブルデータの異常検出は、高次元性、複雑な特徴間の依存関係、および異質なノイズが存在するため挑戦的である。既存の多くの手法は近接性をベースとした手がかりに依存しており、複雑な特徴間の依存関係の違反により引き起こされる異常を検出することを見落としてしまう可能性が高い。依存関係ベースのアノーマリー検出は、異常を特徴間の依存関係の違反として特定するという原理に基づいた代替手法を提供する。しかし、既存の手法はしばしばそのような依存関係を堅牢にモデル化することが困難であり、複雑な依存構造を持つ高次元データに拡張するのが難しい。これらの課題に対処するため、我々は先行データに適合されたネットワーク(Prior-Data Fitted Networks: PFN)をベースにした依存関係ベースのアノーマリー検出フレームワークである uLEAD-TabPFN を提案する。uLEAD-TabPFN は、学習された潜在空間における条件付き依存関係の違反を異常として特定し、凍結された PFN を依存関係推定に活用する。不確実性感知型のスコアリングを組み合わせることで、提案したフレームワークは堅牢かつ拡張性の高いアノーマリー検出を可能にする。ADBench から収集された 57 つのテーブルデータセットを対象とした実験では、uLEAD-TabPFN が中・高次元設定において特に強力なパフォーマンスを発揮し、平均ランクでトップの結果を達成したことが示された。高次元データセットにおいて、uLEAD-TabPFN は平均ベースラインに比べて ROC-AUC をほぼ 20% 向上させ、最も性能が良いベースラインに比べて約 2.8% を改善すると同時に、最先端の手法に対する全体的に優れたパフォーマンスを維持した。さらなる分析では、uLEAD-TabPFN が多くの既存手法が困り果てるデータセットにおいて強力な異常検出能力をもたらすことが、補完的な異常検出機能として示唆された。
Original Content
arXiv:2604.20255v1 Announce Type: new
Abstract: Anomaly detection in tabular data is challenging due to high dimensionality, complex feature dependencies, and heterogeneous noise. Many existing methods rely on proximity-based cues and may miss anomalies caused by violations of complex feature dependencies. Dependency-based anomaly detection provides a principled alternative by identifying anomalies as violations of dependencies among features. However, existing methods often struggle to model such dependencies robustly and to scale to high-dimensional data with complex dependency structures. To address these challenges, we propose uLEAD-TabPFN, a dependency-based anomaly detection framework built on Prior-Data Fitted Networks (PFNs). uLEAD-TabPFN identifies anomalies as violations of conditional dependencies in a learned latent space, leveraging frozen PFNs for dependency estimation. Combined with uncertainty-aware scoring, the proposed framework enables robust and scalable anomaly detection. Experiments on 57 tabular datasets from ADBench show that uLEAD-TabPFN achieves particularly strong performance in medium- and high-dimensional settings, where it attains the top average rank. On high-dimensional datasets, uLEAD-TabPFN improves the average ROC-AUC by nearly 20\% over the average baseline and by approximately 2.8\% over the best-performing baseline, while maintaining overall superior performance compared to state-of-the-art methods. Further analysis shows that uLEAD-TabPFN provides complementary anomaly detection capability, achieving strong performance on datasets where many existing methods struggle.