Back to list
mTSBench:多変量時系列異常検出およびモデル選択のスケールにわたるベンチマーク
mTSBench: Benchmarking Multivariate Time Series Anomaly Detection and Model Selection at Scale
Translated: 2026/3/15 13:03:00
Japanese Translation
arXiv:2506.21550v2 Announce Type: replace
Abstract: 多変量時系列における異常検出は、ヘルスケア、サイバーセキュリティ、産業モニタリングなど多岐にわたる分野において不可欠であり、高次元の依存関係、時系列変数間のクロス相関の存在、ラベル付けされた異常データの希少性という本質的な課題に直面しています。我々は、迄今为止最大規模の多変量時系列異常検出およびモデル選択のベンチマークである mTSBench を提唱し、19 つのデータセットから構成される 344 個のラベル付けされた時系列を含んでいます。我々は、24 個の異常検出器を包括的に評価し、これには多変量時系列のための大規模言語モデル(LLM)ベースの方法が 2 つしかないという点を含んでいます。以前の見解に一致し、我々は単一の検出器がすべてのデータセットにおいて優れているとは認められないことを観察し、効果的なモデル選択の必要性を促しています。我々は最近の 3 つのモデル選択方法をベンチマーク化し、最も強いものであっても最適に遠く離れていることを発見しました。我々の結果は、robustで汎用性のある選択戦略の圧倒的な必要性を強調しています。我々は将来の研究を促進するために、https://plan-lab.github.io/mtsbench をオープンソースとして公開しました。
Original Content
arXiv:2506.21550v2 Announce Type: replace
Abstract: Anomaly detection in multivariate time series is essential across domains such as healthcare, cybersecurity, and industrial monitoring, yet remains fundamentally challenging due to high-dimensional dependencies, the presence of cross-correlations between time-dependent variables, and the scarcity of labeled anomalies. We introduce mTSBench, the largest benchmark to date for multivariate time series anomaly detection and model selection, consisting of 344 labeled time series across 19 datasets from a wide range of application domains. We comprehensively evaluate 24 anomaly detectors, including the only two publicly available large language model-based methods for multivariate time series. Consistent with prior findings, we observe that no single detector dominates across datasets, motivating the need for effective model selection. We benchmark three recent model selection methods and find that even the strongest of them remain far from optimal. Our results highlight the outstanding need for robust, generalizable selection strategies. We open-source the benchmark at https://plan-lab.github.io/mtsbench to encourage future research.