Back to list
Wasserstein 制約されたデータ摂動を用いたブラックボックス脆弱性の評価
Evaluating Black-Box Vulnerabilities with Wasserstein-Constrained Data Perturbations
Translated: 2026/4/24 20:10:14
Japanese Translation
arXiv:2603.15867v2 Announce Type: replace
要約:機械学習 (ML) ツールの利用拡大は、モデルの説明可能性の限界など重大な課題も伴います。本稿では、最適輸送と分布的に頑健な最適化を組み合わせ、機械学習アルゴリズムが制約されたデータ摂動にどう反応するかを解析するグローバルな説明可能性フレームワークを提案します。当アプローチは特徴レベルの統計量(例:輝度、年齢分布)に制約を課すことで、セマンティック構造を維持したリアルな摂動を生成します。当手法は、テーブルおよび画像ドメインの両方に適用可能なモデル无关診断ベンチマークを提供し、確実な理論的保証に基づきます。本手法を実世界データセットで検証し、標準的な評価および公平性監査ツールを補完する解釈可能な頑健性診断を提供しました。
Original Content
arXiv:2603.15867v2 Announce Type: replace
Abstract: The growing use of Machine Learning (ML) tools comes with critical challenges, such as limited model explainability. We propose a global explainability framework that leverages Optimal Transport and Distributionally Robust Optimization to analyze how ML algorithms respond to constrained data perturbations. Our approach enforces constraints on feature-level statistics (e.g., brightness, age distribution), generating realistic perturbations that preserve semantic structure. We provide a model-agnostic diagnostic bench that applies to both tabular and image domains with solid theoretical guarantees. We validate the approach on real-world datasets providing interpretable robustness diagnostics that complement standard evaluation and fairness auditing tools.