Back to list
arxiv_cs_cv 2026年2月10日

COMBOOD: 画像分類におけるOut-of-distribution(OOD)データ検出のためのSemiparametricアプローチ

COMBOOD: A Semiparametric Approach for Detecting Out-of-distribution Data for Image Classification

Translated: 2026/2/11 13:45:24

Japanese Translation

arXiv:2602.07042v1 発表タイプ: new 概要: 推論時におけるOut-of-distribution(OOD)データの同定は、特に自動化を目的とした多くの機械学習アプリケーションにとって重要である。本稿では、画像認識に関するOOD検出のための新しい教師なしセミパラメトリックフレームワーク COMBOOD を提案する。我々のフレームワークは、nearest-neighbor と Mahalanobis という二つの距離尺度からの信号を組み合わせて、ある推論点がOODである信頼度スコアを導出する。前者は非パラメトリックなアプローチを提供する。一方で後者はパラメトリックでシンプルかつ効果的なOOD検出手法を提供し、特に推論点が埋め込み空間(embedding space)で訓練データセットから大きく離れているいわゆる far-OOD シナリオにおいて有用である。しかし、近接するOOD(near-OOD)シナリオ、すなわち実際の状況で発生するnear-OODではその性能は必ずしも満足のいくものではない。COMBOOD フレームワークは、これら二つの信号をセミパラメトリック設定で統合することで、near-OOD と far-OOD の両方に対して高精度な信頼度スコアを提供する。我々は異なる種類のfeature extraction strategies に対する COMBOOD フレームワークの実験結果を示す。実験により、COMBOOD が OpenOOD(version 1 および最新の version 1.5 の両方)ベンチマークデータセット上で(far-OOD と near-OOD の両方において)および文書(documents)データセットに対して、精度の点で最先端の OOD 検出手法を上回ることを示す。ベンチマークデータセットの大部分において、COMBOOD による精度向上は統計的に有意である。COMBOOD は embedding space のサイズに対して線形にスケールするため、多くの実生活アプリケーションに適している。

Original Content

arXiv:2602.07042v1 Announce Type: new Abstract: Identifying out-of-distribution (OOD) data at inference time is crucial for many machine learning applications, especially for automation. We present a novel unsupervised semi-parametric framework COMBOOD for OOD detection with respect to image recognition. Our framework combines signals from two distance metrics, nearest-neighbor and Mahalanobis, to derive a confidence score for an inference point to be out-of-distribution. The former provides a non-parametric approach to OOD detection. The latter provides a parametric, simple, yet effective method for detecting OOD data points, especially, in the far OOD scenario, where the inference point is far apart from the training data set in the embedding space. However, its performance is not satisfactory in the near OOD scenarios that arise in practical situations. Our COMBOOD framework combines the two signals in a semi-parametric setting to provide a confidence score that is accurate both for the near-OOD and far-OOD scenarios. We show experimental results with the COMBOOD framework for different types of feature extraction strategies. We demonstrate experimentally that COMBOOD outperforms state-of-the-art OOD detection methods on the OpenOOD (both version 1 and most recent version 1.5) benchmark datasets (for both far-OOD and near-OOD) as well as on the documents dataset in terms of accuracy. On a majority of the benchmark datasets, the improvements in accuracy resulting from the COMBOOD framework are statistically significant. COMBOOD scales linearly with the size of the embedding space, making it ideal for many real-life applications.