Back to list
arxiv_cs_lg 2026年4月24日

不確実性のある分布外強健性のある確率最適化

Robust Out-of-Distribution Stochastic Optimization

Translated: 2026/4/24 20:03:53
robust-optimizationout-of-distributionstochastic-programmingreproducing-kernel-hilbert-spacemeta-learning

Japanese Translation

arXiv:2604.20147v1 Announce Type: cross 摘要:不確実性のあるデータ驱动的意思決定プロセスでは、通常、未知のターゲット確率分布からの過去のデータ収集が前提とされます。しかし、意思決定を行う前に、ターゲット分布からのデータの何らのアクセスも持たない場合もあるかもしれません。この課題に対処するため、本稿では、見られない分布下における強健な意思決定のために関連するデータ分布を効果的に活用する、新しいデータ驱动的枠組みである強健な分布外確率最適化を提案します。我々の枠組みの主要な特徴は、すべてのデータ分布が分布上のメタ分布からランダムに生成されると仮定されているという点です。分布生成における不確実性を記述するために、我々は関連するデータ分布から、調整可能な保守性を持つ再帰核ヒルベルト空間(RKHS)におけるデータ驱动的不確実性集合を学習することを提案します。その後、この集合を min-max 確率計画に組み込むことで強健な意思決定を導き出します。特に、分布生成のランダム性の下で、不確実性集合および解に対する厳密な分布外一般化保証を確立します。RKHS における問題解決を容易にするため、証明可能な有界な最適性の欠如と行生成戦略を持つ近似的なパラメータ化が提示されています。複数アイテムニュースベンダーとポートフォリオ最適化に関する大規模な数値実験は、我々の意思決定枠組みが、見られないデータ分布の下で、僅かまたは中程度の数の関連ソースしか利用可能な場合でも、優れた分布外パフォーマンスを示すことを示しています。

Original Content

arXiv:2604.20147v1 Announce Type: cross Abstract: Data-driven decision-making under uncertainty typically presumes the collection of historical data from an unknown target probability distribution. However, one may have no access to any data from the target distribution prior to decision-making. To address this challenge, we propose robust out-of-distribution stochastic optimization, a novel data-driven framework that effectively utilizes relevant data distributions for robust decision-making under unseen distributions. A key feature of our framework is that all data distributions are assumed to be randomly generated from a meta-distribution over distributions. To describe uncertainty in distribution generation, we propose to learn a data-driven uncertainty set in a reproducing kernel Hilbert space (RKHS) from relevant data distributions, with adjustable conservatism. We then incorporate this set into a min-max stochastic program to derive robust decisions. Notably, under randomness of distribution generation, we establish rigorous out-of-distribution generalization guarantees for the uncertainty set as well as the solution. To ease problem-solving in RKHS, an approximate parametrization with a provably bounded suboptimality and a row generation strategy are presented. Extensive numerical experiments on multi-item newsvendor and portfolio optimization demonstrate the superior out-of-distribution performance of our decision-making framework under unseen data distribution, even when only a small or moderate number of relevant sources are available.