Back to list
arxiv_cs_lg 2026年4月24日

Cover は Robbins と出会い、有界データへのベットを賭けた時: 最悪ケース regret の $O( rac{ ext{ln} n}$) と、確率 1 regret の $O( ext{ln} ext{ln} n)$

Cover meets Robbins while Betting on Bounded Data: $\ln n$ Regret and Almost Sure $\ln\ln n$ Regret

Translated: 2026/4/24 19:57:05
betting-marketregret-analysisuniversal-predictionmartingale-probability

Japanese Translation

arXiv:2604.20172v1 Announce Type: new 要旨:[0,1] のデータ列に対してベットを行う状況を考慮し、条件付き平均 $m_0 \in (0,1)$ が成り立つ場合、公平なベットであれば何を賭けてもよいとします。Cover のユニバーサルポートフォリオアルゴリズムは、後見における最適な定額ベットとの比較で最悪ケース regret が $O(\text{ln} n)$ に抑えられますが、この bound は敵対的に生成されたデータに対して改善不可能です。本研究では、Robbins と Cover の洞察を組み合わせた新しい混合ベット戦略を提示し、異なる振る舞いを示します:それは、条件付き平均がそれぞれ $m_0$ となり内生的な分散が無限大に増加する場合、測度 1 のパスに対して最終的に regret を $O(\text{ln} \text{ln} n)$ にし、補集合(測度 0 のパス)に対しては $O(\log n)$ の regret を生み出すことになっています。我々の論文は、非常に異なる 2 つの戦略をヘッジすることで、確率的データに対する最も良い両者の適応性と、敵対的データに対する保護を実現する価値に目を向けたと指摘するのが最初であると見なされています。我々の結果を、無界データに対するサブ高斯混合に関する Agrawal らの結果(参考:agrawal2025regret)と比較します:彼らの最悪ケース regret は無界である必要がありましたが、類似のヘッジは最適なベット成長率と、確率的データに対して確率 1 の $O(\text{ln} \text{ln} n)$ regret を達成します。最後に、我々の戦略は Shafer らの(参考:shafer2005probability)に類似的な、ルートの平方根の法則に対する鋭いゲーム理論的な上法則を証明します。

Original Content

arXiv:2604.20172v1 Announce Type: new Abstract: Consider betting against a sequence of data in $[0,1]$, where one is allowed to make any bet that is fair if the data have a conditional mean $m_0 \in (0,1)$. Cover's universal portfolio algorithm delivers a worst-case regret of $O(\ln n)$ compared to the best constant bet in hindsight, and this bound is unimprovable against adversarially generated data. In this work, we present a novel mixture betting strategy that combines insights from Robbins and Cover, and exhibits a different behavior: it eventually produces a regret of $O(\ln \ln n)$ on \emph{almost} all paths (a measure-one set of paths if each conditional mean equals $m_0$ and intrinsic variance increases to $\infty$), but has an $O(\log n)$ regret on the complement (a measure zero set of paths). Our paper appears to be the first to point out the value in hedging two very different strategies to achieve a best-of-both-worlds adaptivity to stochastic data and protection against adversarial data. We contrast our results to those in~\cite{agrawal2025regret} for a sub-Gaussian mixture on unbounded data: their worst-case regret has to be unbounded, but a similar hedging delivers both an optimal betting growth-rate and an almost sure $\ln\ln n$ regret on stochastic data. Finally, our strategy witnesses a sharp game-theoretic upper law of the iterated logarithm, analogous to~\cite{shafer2005probability}.