Back to list
Diffusion モデルにおける Zero-Shot Posterior Sampling の解析と誘導
Analyzing and Guiding Zero-Shot Posterior Sampling in Diffusion Models
Translated: 2026/3/15 14:47:19
Japanese Translation
arXiv:2602.07715v1 Announce Type: new
摘要:信号を劣化された測定から再生することは、科学と工学において長年にわたる課題でした。最近、ゼロショットに基づく拡散モデル手法が、事前知識を活用した後方サンプリング解を提供するためにそのような逆問題に応用されました。そのようなアルゴリズムは観測を推論を通じて統合しており、しばしば手動調整と直感的な方法に依存します。本研究では、ガウス性の仮定に基づき、此类近似後方サンプリャの厳密な解析を提案しました。この条件下では、理想的な後方サンプリャおよび拡散に基づく再構築アルゴリズムを両方とも閉じた形式で表現でき、スペクトル領域における詳細な解析と比較を可能にしました。これらの表現に基づき、我々はパラメータ設計のための原理的なフレームワークを導入し、過去に使用された直感的な選択戦略を置き換えました。提案された手法はアルゴリズムに依存せず、各アルゴリズムのためにカスタマイズされたパラメータを選択し、事前の特性、劣化された信号、および拡散ダイナミクスを同時に考慮します。我々のスペクトル推奨は、標準的な直感的な手法とは構造的に異なり、拡散ステップサイズの変動に合わせて変化し、知覚的な品質と信号忠実度の間の一貫したバランスをもたらします。
Original Content
arXiv:2602.07715v1 Announce Type: new
Abstract: Recovering a signal from its degraded measurements is a long standing challenge in science and engineering. Recently, zero-shot diffusion based methods have been proposed for such inverse problems, offering a posterior sampling based solution that leverages prior knowledge. Such algorithms incorporate the observations through inference, often leaning on manual tuning and heuristics. In this work we propose a rigorous analysis of such approximate posterior-samplers, relying on a Gaussianity assumption of the prior. Under this regime, we show that both the ideal posterior sampler and diffusion-based reconstruction algorithms can be expressed in closed-form, enabling their thorough analysis and comparisons in the spectral domain. Building on these representations, we also introduce a principled framework for parameter design, replacing heuristic selection strategies used to date. The proposed approach is method-agnostic and yields tailored parameter choices for each algorithm, jointly accounting for the characteristics of the prior, the degraded signal, and the diffusion dynamics. We show that our spectral recommendations differ structurally from standard heuristics and vary with the diffusion step size, resulting in a consistent balance between perceptual quality and signal fidelity.