Back to list
arxiv_cs_lg 2026年2月10日

流動制御とマージの統一された密度演算子視座

A Unified Density Operator View of Flow Control and Merging

Translated: 2026/3/15 14:50:16
flow-controldensity-operatormachine-learningmolecular-designgenerative-models

Japanese Translation

arXiv:2602.08012v1 発表 タイプ:新規 要旨:最近の大規模なフローモデルおよび拡散モデルの進展により、2 つの基本的なアルゴリズム的な課題が発生した:(i) 事前学習されたフローの制御に基づく報酬適応、および (ii) 複数のモデルの統合、すなわちフローマージ。現在の手法がそれぞれ個別に対処しているのに対し、私たちが両者を極限ケースとして含む統一的な確率空間フレームワークを導入し、報酬によるフローマージを可能にしました。これにより、複数の事前学習されたフロー(例:薬物発見の効率を最大化しつつ尤度を統合する)の原則に基づき、タスクに応じた組み合わせが実現できます。我々の式立て方により、生成モデルの密度に関する豊富な演算子ファミリーを表せるようになりました。これには、交集演算子(例:安全性の強制)、合同演算子(例:多様なモデルの構成)、補間演算子(例:発見用)が含まれ、それらの報酬指向対応版も含まれます。さらに、生成回路を通じて複雑な論理表現が可能になります。次に、私たちが導入した報酬指向フローマージ(RFM: Reward-Guided Flow Merging)は、鏡下山法に基づき、報酬指向フローマージを標準的なファインチューニング問題の列に変換するスキームです。次に、RFM を介した報酬指向フローマージおよび純粋なフローマージについて、初めてとなる理論的保証を提供しました。最終的に、私々の提案手法の能力を視覚的に解釈可能な洞察を提供する図示的な設定で示し、高次元の从头設計モレキュラー設計および低エネルギー conformer 生成に我々の手法を適用しました。

Original Content

arXiv:2602.08012v1 Announce Type: new Abstract: Recent progress in large-scale flow and diffusion models raised two fundamental algorithmic challenges: (i) control-based reward adaptation of pre-trained flows, and (ii) integration of multiple models, i.e., flow merging. While current approaches address them separately, we introduce a unifying probability-space framework that subsumes both as limit cases, and enables reward-guided flow merging, allowing principled, task-aware combination of multiple pre-trained flows (e.g., merging priors while maximizing drug-discovery utilities). Our formulation renders possible to express a rich family of operators over generative models densities, including intersection (e.g., to enforce safety), union (e.g., to compose diverse models), interpolation (e.g., for discovery), their reward-guided counterparts, as well as complex logical expressions via generative circuits. Next, we introduce Reward-Guided Flow Merging (RFM), a mirror-descent scheme that reduces reward-guided flow merging to a sequence of standard fine-tuning problems. Then, we provide first-of-their-kind theoretical guarantees for reward-guided and pure flow merging via RFM. Ultimately, we showcase the capabilities of the proposed method on illustrative settings providing visually interpretable insights, and apply our method to high-dimensional de-novo molecular design and low-energy conformer generation.