Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework¶
会议: CVPR 2026
arXiv: 2603.10281
代码: 补充材料中提供
领域: 逆问题求解 / 计算成像
关键词: ADMM, 即插即用, 扩散模型先验, 收敛保证, 逆问题, AC-DC去噪器
一句话总结¶
提出ADMM-PnP with AC-DC去噪器,通过三阶段修正-去噪流程(自动修正+方向修正+基于分数的去噪)将扩散先验集成到ADMM原始-对偶框架中,解决了ADMM迭代与扩散训练流形的几何不匹配问题,同时在两种条件下建立了收敛保证,在7种逆问题上一致优于DAPS/DPS/DiffPIR等基线。
背景与动机¶
基于分数的扩散模型已成为求解逆问题的强先验。现有PnP(Plug-and-Play)方法用分数函数替代传统正则化项的近端算子,但面临两个核心挑战:(1)流形不匹配——分数函数在高斯扰动的噪声流形\(\mathcal{M}_{\sigma(t)}\)上训练,但优化算法的迭代\(\mathbf{z}^{(k)}\)未必在这些流形上,尤其ADMM的对偶变量\(\mathbf{u}^{(k)}\)进一步扭曲了噪声几何;(2)缺乏收敛理解——将分数去噪器嵌入ADMM后的收敛性未被证明,现有分析主要覆盖原始算法而非原始-对偶方法。
核心问题¶
如何将分数基去噪器有效嵌入ADMM框架——既要解决迭代与训练流形的几何不匹配(特别是对偶变量导致的额外失配),又需为这种组合提供理论收敛保证?
方法详解¶
整体框架¶
标准ADMM-PnP框架:将逆问题\(\min_\mathbf{x} \ell(\mathbf{y}\|\mathcal{A}(\mathbf{x})) + \gamma h(\mathbf{z})\)通过变量分裂为\(\mathbf{x}\)子问题(数据保真)和\(\mathbf{z}\)子问题(去噪/正则化)。\(\mathbf{z}\)子问题由AC-DC去噪器替代近端算子。每次迭代:(7a)求解ML子问题→(7b)AC-DC去噪→(7c)更新对偶变量\(\mathbf{u}\)。
关键设计¶
-
AC-DC三阶段去噪器:
- AC(Auto-Correction): 向ADMM迭代\(\tilde{\mathbf{z}}^{(k)}\)添加高斯噪声→\(\mathbf{z}_{ac}^{(k)} = \tilde{\mathbf{z}}^{(k)} + \sigma^{(k)}\mathbf{n}\),将其拉向噪声训练流形\(\mathcal{M}_{\sigma^{(k)}}\)的邻域。但仅加噪不保证流形对齐。
- DC(Directional Correction): 用条件Langevin动力学(\(J\)步迭代)将\(\mathbf{z}_{ac}^{(k)}\)精炼至\(\mathcal{M}_{\sigma^{(k)}}\)上。条件分布\(p(\mathbf{z}_{\sigma^{(k)}}|\mathbf{z}_{ac}^{(k)})\)的梯度由分数函数和高斯似然的近似结合。
- Denoising: 在对齐流形上应用Tweedie引理进行去噪:\(\mathbf{z}_{tw}^{(k)} = \mathbf{z}_{dc}^{(k)} + (\sigma^{(k)})^2 \mathbf{s}_\theta(\mathbf{z}_{dc}^{(k)}, \sigma^{(k)})\)。也可用ODE采样器替代(Ours-ode)。
-
弱非扩张算子下的收敛保证(Theorem 1+2): 在\(\ell\)为\(\mu\)-强凸、AC-DC去噪器满足弱非扩张假设(\(\|R_\sigma(\tilde{\mathbf{z}}_1) - R_\sigma(\tilde{\mathbf{z}}_2)\|^2 \leq \epsilon^2\|\tilde{\mathbf{z}}_1-\tilde{\mathbf{z}}_2\|^2 + \delta^2\))下,固定步长\(\rho\)保证收敛到固定点的\(\delta\)-球内。进而证明在\(\log p_{data}\)满足\(M\)-光滑性和强制性条件下,AC-DC确实满足该假设。
-
无需凸性的自适应步长收敛(Theorem 3): 放松强凸性假设,采用Chan et al.的\(\rho\)-递增规则。证明AC-DC去噪器在此条件下是有界去噪器(bounded denoiser),在\(\sigma^{(k)} \to 0\)的适当调度下以高概率收敛到固定点。
损失函数 / 训练策略¶
- \(\sigma^{(k)}\)线性衰减调度:[0.1, 10]范围在\(W\)窗口内线性衰减
- DC步\(J=10\),步长\(\eta^{(k)} = 5\times10^{-4}\sigma^{(k)}\)
- ML子问题(7a)用Adam优化器求解,最多1000步+收敛检测
实验关键数据¶
FFHQ 100张图像 (PSNR↑/SSIM↑):
| 任务 | Ours-tweedie | DAPS | DPS | DiffPIR | DPIR |
|---|---|---|---|---|---|
| 超分4× | 30.44/0.857 | 29.53/0.814 | 24.83/0.705 | 26.77/0.749 | 28.85/0.826 |
| 随机修复 | 32.84/0.906 | 31.65/0.847 | 29.08/0.828 | 28.56/0.709 | - |
| 运动去模糊 | 30.00/0.854 | 29.05/0.815 | 23.26/0.663 | - | - |
| 高斯去模糊 | 30.40/0.853 | 29.79/0.813 | 26.11/0.730 | 25.15/0.699 | 28.88/0.833 |
| 相位恢复 | 27.94/0.793 | 26.71/0.749 | 11.63/0.366 | - | - |
| Box修复 | 24.03/0.859 | 23.64/0.815 | 23.49/0.817 | 20.93/0.561 | - |
在几乎所有任务和指标上达到最佳或次佳。
消融实验要点¶
- 去掉AC-DC修正(直接去噪): 所有任务PSNR大幅下降——超分26.92→30.44,相位恢复11.98→27.94,Box修复15.60→24.03。修正步是性能提升的关键
- DC步数\(J\)的影响: \(J=0\)(无DC)时相位恢复仍有严重伪影;\(J\)增加逐步改善图像质量(Fig.5定性展示)
- NFE效率: 大多数任务在10次迭代(110 NFE for Ours-tweedie)即可饱和;仅相位恢复和非线性去模糊等难题需要更多NFE
- 假设的实证验证: 分数函数的Lipschitz比值集中在50-160,支持光滑性假设;能量函数的强制性通过\(\langle\mathbf{x}, -\nabla\log p(\mathbf{x})\rangle\)与\(\|\mathbf{x}\|^2\)的线性关系验证
- 额外正则化灵活性: ADMM框架允许在ML子问题中加入LPIPS感知损失实现风格迁移修复
亮点¶
- 理论贡献扎实:三个定理分别在弱非扩张+强凸、AC-DC特定条件、和无凸性+自适应步长下建立收敛保证——是分数基PnP在原始-对偶框架下的首个系统性理论分析
- AC-DC三阶段设计原理清晰:AC拉入流形邻域→DC精炼对齐→分数去噪生效,每步都有明确作用且理论可解释
- ADMM灵活性:示范了加入LPIPS等额外正则化的可能——这是纯扩散采样方法无法做到的
- 7种逆问题(含非线性去模糊、相位恢复等高难度任务)的一致优势
局限与展望¶
- 收敛结果均为固定点收敛(非稳定点收敛),理论强度受限——作者自己承认这是PnP方向的公开难题
- 噪声调度\(\sigma^{(k)}\)和DC步数\(J\)等超参依赖经验启发式,缺乏理论最优设计
- 每次AC-DC去噪需11次分数函数评估(Tweedie)或20次(ODE),计算开销大
- 仅在FFHQ/ImageNet 256×256上验证,未测试更高分辨率或其他域
与相关工作的对比¶
- DiffPIR: 同为PnP框架但用变量分裂而非ADMM,仅AC步(加噪+Tweedie)无DC精炼,PSNR全面低于本文3-4 dB
- DAPS: 使用解耦噪声退火但仍为采样方法非优化,PSNR低1-2 dB,且无理论收敛保证
- DPS: 修改MCMC过程做条件采样,在难任务(相位恢复/运动去模糊)上PSNR远低于本文(11.63 vs 27.94)
- RED-diff: 显式构建正则化项取梯度,PSNR普遍最低(16-20 dB级别)
- SNORE: 类似噪声注入的原始方法,但无对偶变量处理,本文证明AC-DC可处理更困难的原始-对偶设置
启发与关联¶
- "修正再去噪"的AC-DC思路是流形对齐的通用范式——可推广到任何使用预训练模型做PnP的场景
- 弱非扩张算子的\(\delta\)-球收敛理论框架可用于分析其他带噪声去噪器的优化方法
- ADMM的灵活性(可加任意正则项)使其在需要多约束的实际逆问题中具有独特优势
评分¶
- 新颖性: ⭐⭐⭐⭐ AC-DC三阶段设计有理论新意,是首个系统处理ADMM+分数去噪器的收敛分析
- 实验充分度: ⭐⭐⭐⭐⭐ 7种逆问题(+2种补充)、2个数据集、6-8个基线、NFE效率分析、假设验证、消融
- 写作质量: ⭐⭐⭐⭐⭐ 理论推导严谨完整(5个定理6个引理),实验和理论互补
- 价值: ⭐⭐⭐⭐⭐ 对计算成像/逆问题求解领域有理论+实用双重贡献