跳转至

DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models

会议: ICLR 2026
arXiv: 2509.21655
代码: https://github.com/yinuoren/DriftLite
领域: 扩散模型 / 推理时缩放
关键词: 扩散模型推理适配, 粒子方法, 漂移控制, Fokker-Planck方程, 方差缩减

一句话总结

DriftLite 提出在 Fokker-Planck 方程中利用漂移-势函数的自由度,通过轻量级线性系统求解最优控制漂移来主动稳定粒子权重,以最小代价解决 Sequential Monte Carlo 中的权重退化问题,在高斯混合、分子系统和蛋白质-配体共折叠任务上大幅超越 Guidance-SMC 基线。

研究背景与动机

领域现状:扩散/Flow Matching 模型在生成任务上取得巨大成功,但推理时适配(不重新训练适应新目标分布)仍是关键挑战。主要有两类方法:guidance(简单但有偏)和 SMC 粒子重加权(无偏但权重退化严重)。

现有痛点: - Guidance 方法(classifier/classifier-free guidance)简单但本质有偏——忽略了目标分布的归一化常数随时间变化 - SMC 粒子方法理论上无偏(KL 散度 \(\mathcal{O}(N^{-1})\)),但实际中权重会指数级退化,有效样本量 (ESS) 迅速崩塌 - 增加粒子数可缓解但计算成本线性增长;减少粒子数则不稳定 - 基于训练的控制方法(neural network 参数化)需要反向传播,丢失了推理时方法的轻量优势

核心矛盾:无偏性 vs 计算效率——SMC 理论正确但实际不稳定,guidance 高效但有偏

本文目标 - 如何在保持无偏性的前提下稳定粒子权重? - 能否找到一种 training-free 且开销极小的方法?

切入角度:Fokker-Planck 方程中漂移项和势函数之间存在根本性的自由度——任何加到漂移上的控制项都可以被势函数的对应修正精确补偿,而这个自由度可以用来最小化残差势函数的方差。

核心 idea:将 SMC 的被动重加权(passively reweight)改为主动转向(proactively steer)——把导致权重方差的势函数 \(g_t\) 的一部分"卸载"到漂移项中,只需在每步求解一个小线性系统。

方法详解

整体框架

给定预训练扩散模型和目标分布(annealing \(q_T \propto p_0^\gamma\) 或 reward-tilting \(q_T \propto p_0 \exp(r)\)),DriftLite 在推理时的每个时间步:(1) 用当前粒子估计一个小矩阵 \(A_t\) 和向量 \(c_t\) → (2) 求解 \(n \times n\)\(n \leq 3\))线性系统得到控制漂移系数 \(\theta_t\) → (3) 将控制漂移加入粒子 SDE 并更新残差势函数。

关键设计

  1. Fokker-Planck 自由度定理 (Prop 3.1):

    • 功能:证明可以任意修改粒子漂移而不改变目标分布
    • 核心思路:对于任意控制漂移 \(\bm{b}_t\),存在一个补偿势函数 \(h_t(\bm{x}; \bm{b}_t) = \nabla \cdot \bm{b}_t + \bm{b}_t \cdot \nabla \log q_t\),使得 Fokker-Planck 方程仍然描述路径 \((q_t)\)。关键性质:\(\mathbb{E}_{q_t}[h_t(\cdot; \bm{b}_t)] = 0\)
    • 设计动机:这提供了一个将势函数方差"转移"到漂移中的数学工具——理想情况下可以完全消除权重方差。
  2. VCG (Variance-Controlling Guidance):

    • 功能:直接最小化残差势函数的方差
    • 核心思路:将控制漂移限制在有限维子空间 \(\bm{b}_t = \sum_i \theta_t^i \bm{s}_i\),基函数取 \(\{\nabla r_t, \nabla \log \hat{p}_t, \hat{\bm{u}}_t\}\)。最小化 \(\text{Var}_{q_t}[\phi_t]\) 转化为标准最小二乘问题 \(A_t \theta_t = c_t\),其中 \(A_{ij} = \mathbb{E}[h_t^i h_t^j]\)\(c_i = -\mathbb{E}[g_t h_t^i]\)
    • 设计动机:直接针对权重退化的根源(势函数方差)优化,且只需 \(3 \times 3\) 线性系统求解,计算开销极小。
  3. ECG (Energy-Controlling Guidance):

    • 功能:通过变分法逼近最优控制的 Poisson 方程解
    • 核心思路:最优控制设 \(\bm{b}_t^* = \nabla A_t\),其中 \(A_t\) 满足 Poisson 方程 \(\nabla \cdot (q_t \nabla A_t) = q_t g_t\)。用 Ritz 方法在标量基函数 \(\{r_t, \log \hat{p}_t, \hat{U}_t\}\) 上展开 \(A_t\),同样转化为小线性系统。
    • 设计动机:直接逼近理论最优解,不要求可微 Laplacian 计算。

损失函数 / 训练策略

  • 完全 training-free:不需要任何训练或反向传播
  • 每步额外开销:求解 \(n \times n\)\(n=3\))线性系统 + 评估基函数(复用 guidance 已计算的 score 和 reward gradient)
  • 支持迭代细化:前一轮的控制漂移+残差势函数作为下一轮的基础动力学,逐步降低方差
  • 可选 SMC 重采样(ESS < 阈值时)或纯连续权重

实验关键数据

主实验(30维高斯混合模型,退火 \(\gamma=2.0\)

方法 \(\Delta\)NLL↓ MMD↓ SWD↓ ESS 稳定性
Pure Guidance 高偏差 N/A
Guidance-SMC 中等 模式坍塌 中等 迅速退化
VCG-SMC 最低 最佳 最佳 稳定
ECG-SMC 接近VCG 接近VCG 接近VCG 稳定

蛋白质-配体共折叠(AlphaFold3 + DriftLite)

方法 配体 RMSD↓ 口袋 TM-score↑ Clash Score↓
AF3 baseline 中等 中等 较高
AF3 + VCG 显著改善 改善 降低

消融实验

配置 效果
方差缩减幅度 VCG 降低势函数方差数个数量级
粒子数缩放 DriftLite 用 N/4 粒子达到 SMC N 粒子的效果
迭代细化 每轮方差单调递减,样本质量逐步提升
额外运行时间 相比 Pure Guidance 增加约 20-40%

关键发现

  • 方差降低数个数量级:VCG 将势函数方差从 \(10^2\)-\(10^3\) 降至 \(10^{-1}\)-\(10^0\),ESS 在整个推理过程保持稳定
  • 粒子效率提升:DriftLite 用 32 个粒子超过 G-SMC 用 128 个粒子——4 倍效率提升
  • VCG 略优于 ECG:直接最小化方差比变分逼近 Poisson 方程更有效
  • 大规模科学应用可行:在 AlphaFold3 蛋白质-配体共折叠上成功应用,证明方法可扩展到真实大规模场景
  • 迭代细化有效:多轮细化方差单调递减,类似自适应方法但无需训练

亮点与洞察

  • 将 FP 方程的自由度转化为方差控制工具是本文最核心的理论贡献——极为优雅。这个自由度虽然在数学上是已知的(twisted proposals in SMC),但将其形式化为可编程的轻量级控制,且仅需 3×3 线性系统,是工程上的巧妙创新。
  • "主动转向 vs 被动重加权"的范式转换值得关注——SMC 的本质问题不是理论正确性而是实际的权重退化。DriftLite 通过把"信息"从权重转移到漂移中,从根本上解决了这个工程问题。
  • 在 AlphaFold3 上的成功应用证明了该方法在真实科学场景中的价值——这不仅仅是一个理论漂亮的方法,而是可以直接改善蛋白质结构预测的实用工具。

局限与展望

  • 需要 reward function 二阶可微(可用随机估计器近似,但精度下降)
  • 基函数选择仍是手工的(3个基函数),更多/更好的基函数可能进一步提升
  • 高维场景中 Laplacian 估计引入噪声,可能影响控制质量
  • 仅在生成式 scientific 任务验证,未在大规模图像生成(如 SD3)上测试
  • 迭代细化增加推理时间(但不需要训练)

相关工作与启发

  • vs Guidance-SMC (Skreta et al.): 同一框架但 DriftLite 通过漂移控制主动减少权重退化,而 G-SMC 被动重加权→权重坍塌
  • vs Neural Control (Albergo & Vanden-Eijnden): 用 NN 参数化控制需要训练/反向传播;DriftLite 用 3 个基函数的线性系统替代,training-free
  • vs Pure Guidance (Ho & Salimans): Guidance 简单但有偏;DriftLite 保持无偏性的同时计算开销仅增加 20-40%

评分

  • 新颖性: ⭐⭐⭐⭐⭐ FP 自由度→方差控制的理论洞察原创性极高
  • 实验充分度: ⭐⭐⭐⭐⭐ 从合成数据到分子系统到蛋白质折叠的全面验证
  • 写作质量: ⭐⭐⭐⭐⭐ 理论推导严谨优雅,实验设计逻辑清晰
  • 价值: ⭐⭐⭐⭐⭐ 对扩散模型推理时适配的通用贡献,科学应用价值高