Back to list
arxiv_cs_cv 2026年2月10日

スケーリングアンカーリングの打破:低解像度トレーニングからの正確な高分解像度推論のための周波数表現学習

Breaking Scale Anchoring: Frequency Representation Learning for Accurate High-Resolution Inference from Low-Resolution Training

Translated: 2026/3/15 16:06:14
frequency-representation-learningsuper-resolutionspatiotemporal-forecastingnyquist-frequencydeep-learning

Japanese Translation

arXiv:2512.05132v2 発表タイプ:置換 要約:ゼロショット超解像度空間時間予測は、低解像度のデータでトレーニングされた深層学習モデルを使用して、高分解像度での推論を行うことを要求します。既存の研究は、異なる解像度で似ていない誤差を維持することを、多解像度一般化の成功指標と見なしていますが、数値解法からの代替として機能する深層学習モデルは、解像度の上昇に伴い誤差を減らすべきです。基本的な制限は、低解像度データが表現できる物理法則の周波数の上限が、そのニーキスト周波数によって制約されており、高分解像度推論中にモデルが未曾とされた周波数成分を含む信号を処理するのが困難である点にあります。これにより、誤差が低解像度でアンカーリング(固定化)され、誤って成功の一般化として解釈されてしまいます。われわれはこの基本的な現象を、既存の問題とは区別される新たな問題として「スケーリングアンカーリング」と定義します。したがって、我々はアーキテクチャ非依存な周波数表現学習を提案しました。これは、解像度整合性の周波数表現とスペクトル一貫性トレーニングを通じてスケーリングアンカーリングを緩和します。ニーキスト周波数が高いグリッドにおいて、FRL 強化されたバリアントの高频帯の周波数応答はより安定します。これにより、誤差は解像度が増大するにつれて減少し、当社のタスクおよび解像度範囲内でベースラインを大幅に上回る一方で、計算オーバーヘッドは穏やかです。

Original Content

arXiv:2512.05132v2 Announce Type: replace Abstract: Zero-Shot Super-Resolution Spatiotemporal Forecasting requires a deep learning model to be trained on low-resolution data and deployed for inference on high-resolution. Existing studies consider maintaining similar error across different resolutions as indicative of successful multi-resolution generalization. However, deep learning models serving as alternatives to numerical solvers should reduce error as resolution increases. The fundamental limitation is, the upper bound of physical law frequencies that low-resolution data can represent is constrained by its Nyquist frequency, making it difficult for models to process signals containing unseen frequency components during high-resolution inference. This results in errors being anchored at low resolution, incorrectly interpreted as successful generalization. We define this fundamental phenomenon as a new problem distinct from existing issues: Scale Anchoring. Therefore, we propose architecture-agnostic Frequency Representation Learning. It alleviates Scale Anchoring through resolution-aligned frequency representations and spectral consistency training: on grids with higher Nyquist frequencies, the frequency response in high-frequency bands of FRL-enhanced variants is more stable. This allows errors to decrease with resolution and significantly outperform baselines within our task and resolution range, while incurring only modest computational overhead.