Back to list
arxiv_cs_lg 2026年2月10日

NormalHedge に対する二階の悔意境界

A second order regret bound for NormalHedge

Translated: 2026/3/15 15:02:32
normalhedgeexpert-adviceregret-boundmachine-learningstochastic-differential-equations

Japanese Translation

arXiv:2602.08151v1 発表タイプ:新規 要約:我々は、"容易"な列の予測における専門家アディバイスの問題を検討する。$V_T > \log N$ の場合において、NormalHedge のバリアントが二階の $\epsilon$-分位悔意境界 $O\big(\sqrt{V_T \log(V_T/\epsilon)}\big)$ を享受することを示す。ここで、$V_T$ はアルゴリズムによって決定される自然な分布に対する瞬間的な各専門家の悔意の累積二乗平均である。このアルゴリズムは、確率微分方程式を用いた連続時間への極限によって動機付けられた。離散時間の解析は、自己一致性(self-concordance)技法を用いて行われる。

Original Content

arXiv:2602.08151v1 Announce Type: new Abstract: We consider the problem of prediction with expert advice for ``easy'' sequences. We show that a variant of NormalHedge enjoys a second-order $\epsilon$-quantile regret bound of $O\big(\sqrt{V_T \log(V_T/\epsilon)}\big) $ when $V_T > \log N$, where $V_T$ is the cumulative second moment of instantaneous per-expert regret averaged with respect to a natural distribution determined by the algorithm. The algorithm is motivated by a continuous time limit using Stochastic Differential Equations. The discrete time analysis uses self-concordance techniques.