🖼️ 图像恢复¶
🧠 NeurIPS2025 · 26 篇论文解读
📌 同领域跨会议浏览: 💬 ACL2026 (5) · 📷 CVPR2026 (47) · 🔬 ICLR2026 (15) · 🤖 AAAI2026 (13) · 📹 ICCV2025 (30) · 🧪 ICML2025 (5)
🔥 高频主题: 图像恢复 ×10 · 超分辨率 ×4 · 对抗鲁棒 ×3 · 扩散模型 ×3 · 模型压缩 ×2
- Adaptive Discretization for Consistency Models
-
提出ADCM——通过将一致性模型的离散化步长形式化为局部一致性(可训练性)与全局一致性(稳定性)的约束优化问题,并用Gauss-Newton法求闭式解,实现自适应离散化,在CIFAR-10上用不到25%训练预算超越所有先前CM。
- Audio Super-Resolution with Latent Bridge Models
-
提出 AudioLBM,将音频波形压缩到连续隐空间,用桥模型实现从低分辨率到高分辨率的 latent-to-latent 生成过程,配合频率感知训练扩展数据利用和级联设计突破 48kHz 上限,在语音/音效/音乐上全面超越 AudioSR 等方法,并首次实现 any-to-192kHz 音频超分。
- DenoiseRotator: Enhance Pruning Robustness for LLMs via Importance Concentration
-
提出 DenoiseRotator,在剪枝前通过可学习正交变换最小化参数重要性分数的信息熵,将重要性集中到少数参数上,使 LLaMA3-70B 在 2:4 半结构化稀疏下困惑度退化缩小 58%(8.1→3.4),可即插即用组合 Magnitude/Wanda/SparseGPT。
- DynaGuide: Steering Diffusion Policies with Active Dynamic Guidance
-
提出 DynaGuide,在推理时通过外部潜在动力学模型对预训练扩散策略施加 classifier guidance,无需修改策略权重即可引导机器人朝向任意正/负目标,在 CALVIN 仿真上平均成功率 70%,真实机器人达 80%。
- Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark
-
针对热红外(TIR)图像中低对比度、模糊、噪声等多种退化耦合的问题,提出基于双提示融合的渐进式网络PPFN和选择性渐进训练策略SPT,并构建首个大规模多场景TIR基准数据集HM-TIR,在复合退化场景下PSNR提升8.76%。
- FIPER: Factorized Features for Robust Image Super-Resolution and Compression
-
提出 Factorized Features 统一表示——将图像分解为可学习的非均匀基与空间变化系数,配合锯齿坐标变换和多频调制,在 4× 超分辨率上 PSNR 相对提升 204.4%(HAT-L-F vs SwinIR),在图像压缩上 BD-rate 相比 VTM 降低 21.09%。
- GC4NC: A Benchmark Framework for Graph Condensation on Node Classification with New Insights
-
提出 GC4NC——首个系统化的图凝缩(Graph Condensation)评估基准框架,跨 8 个维度(性能/效率/隐私保护/去噪/NAS有效性/可迁移性等)统一评估多种图凝缩方法,发现轨迹匹配方法最优、无结构方法效率最高,并在 1000x 压缩下图凝缩显著优于图像凝缩。
- Implicit Augmentation from Distributional Symmetry in Turbulence Super-Resolution
-
本文揭示湍流的统计各向同性本身就是一种隐式数据增强,使得标准CNN在超分辨率任务中无需显式旋转增强或等变架构即可部分习得旋转等变性,并展示了等变误差的尺度依赖性与Kolmogorov局部各向同性假说一致。
- Improving Diffusion-based Inverse Algorithms under Few-Step Constraint via Learnable Linear Extrapolation
-
提出 Learnable Linear Extrapolation (LLE)——用可学习的线性组合系数将当前和历史 clean data estimate 组合,以增强任何符合 Sampler-Corrector-Noiser 范式的扩散逆问题算法在少步(3-5步)下的表现,仅需 50 个样本、几分钟训练,跨 9+ 算法 × 5 个任务一致提升。
- Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement
-
提出 Latent Harmony 两阶段框架,通过潜在空间正则化构建泛化性 VAE(LH-VAE),并引入高频引导的可控 LoRA 微调机制,在保持结构完整性的同时实现 UHD 图像多退化类型统一修复的保真度-感知质量灵活权衡。
- Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement
-
提出 Latent Harmony 两阶段框架,通过潜在空间正则化构建退化鲁棒的 LH-VAE,再用高频引导的 LoRA 微调分别优化编码器(保真度)和解码器(感知质量),实现 UHD 全能图像复原中泛化-重建-感知三重权衡的统一解决方案。
- Learning Cocoercive Conservative Denoisers via Helmholtz Decomposition for Poisson Inverse Problems
-
提出共循环保守(CoCo)去噪器概念,通过广义Helmholtz分解设计新的训练策略——Hamiltonian正则化促进保守性 + 谱正则化促进共循环性——使去噪器成为隐式弱凸先验的近端算子,从而在Poisson逆问题(光子受限去卷积、低剂量CT等)中实现有收敛保证且性能优越的PnP方法。
- Luminance-Aware Statistical Quantization: Unsupervised Hierarchical Learning for Illumination Enhancement
-
提出 LASQ 框架,将低光图像增强重新定义为基于分层亮度分布的统计采样过程,利用自然亮度转换中固有的幂律分布特性,通过 MCMC 采样生成层次化亮度适配算子,嵌入扩散模型前向过程实现无监督增强,无需正常光照参考即可工作。
- MAP Estimation with Denoisers: Convergence Rates and Guarantees
-
证明了一个简单的 MMSE 去噪器迭代平均算法(与 Cold Diffusion 等实践方法密切相关)在对数凹先验假设下可证明收敛到负对数先验的近端算子,收敛速率为 Õ(1/k),为一类经验上成功但缺乏理论保证的去噪方法提供了严格的理论基础,并将其嵌入近端梯度下降框架解决 MAP 估计问题。
- MoDEM: A Morton-Order Degradation Estimation Mechanism for Adverse Weather Image Restoration
-
提出 MODEM 框架,通过 Morton 编码空间扫描与选择性状态空间模型(SSM)结合,建模空间异质性天气退化特征,配合双重退化估计模块提供全局和局部先验,实现多种天气退化图像的统一自适应复原 SOTA。
- MoE-Gyro: Self-Supervised Over-Range Reconstruction and Denoising for MEMS Gyroscopes
-
提出MoE-Gyro自监督专家混合框架,通过超量程重建专家(ORE,含高斯衰减注意力和物理信息约束)和降噪专家(DE,含双分支互补掩码和FFT引导增强)同时解决MEMS陀螺仪量程-噪声的根本权衡,将可测量范围从±450°/s扩展到±1500°/s,偏置不稳定性降低98.4%。
- MRO: Enhancing Reasoning in Diffusion Language Models via Multi-Reward Optimization
-
首次系统分析扩散语言模型(DLM)推理短板的根因——去噪过程中token独立生成导致序列内/序列间相关性缺失,提出多奖励优化框架MRO,在test-time scaling、reject sampling和RL三种模式下均显著提升LLaDA-8B的推理性能,MATH500从34.4%提升至37.4%。
- MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation
-
提出 MS-Bart,通过统一词表将分子指纹和分子结构(SELFIES)映射到共享的 token 空间,在 400 万指纹-分子对上进行多任务预训练,再通过实验谱微调和化学反馈对齐,实现从质谱到分子结构的高效生成。
- Real-World Adverse Weather Image Restoration via Dual-Level Reinforcement Learning with High-Quality Cold Start
-
提出双层强化学习框架(DRL),结合物理驱动的百万级合成天气数据集HFLS-Weather进行高质量冷启动训练,通过局部扰动驱动图像质量优化(PIQO)和全局元控制器多智能体协作,实现真实恶劣天气图像的自适应复原。
- Rethinking Circuit Completeness in Language Models: AND, OR, and ADDER Gates
-
系统引入AND、OR、ADDER三种逻辑门来分解语言模型电路,揭示电路不完整性主要源于OR门的遗漏,提出结合noising和denoising干预的框架来完整恢复三种逻辑门,同时保证忠实度和完整性。
- Rethinking Nighttime Image Deraining via Learnable Color Space Transformation
-
基于"夜间雨在YCbCr的Y通道(亮度)差异远大于RGB"的统计发现,提出可学习颜色空间转换器(CSC)在Y通道做去雨、隐式光照引导(IIG)编码夜间不均匀光照、以及光照感知的高质量数据集HQ-NightRain,三管齐下显著提升夜间去雨效果。
- SCAN: Self-Denoising Monte Carlo Annotation for Robust Process Reward Learning
-
提出 SCAN 框架,通过分析 Monte Carlo 注释中的噪声分布,设计自去噪采样策略和鲁棒学习损失,仅用 1.5B 模型生成的 101K 样本训练的 PRM 即超越人工标注数据集 PRM800K 的效果。
- scSplit: Bringing Severity Cognizance to Image Decomposition in Fluorescence Microscopy
-
提出 scSplit,通过引入混合比例感知的归一化模块(SCIN)和回归网络(Reg),使基于 InDI 的迭代图像分解方法能够感知荧光显微镜图像中两种结构叠加的严重程度,在5个公开数据集上统一解决图像分离和渗透去除两个任务。
- Spend Wisely: Maximizing Post-Training Gains in Iterative Synthetic Data Bootstrapping
-
首次从理论上分析了迭代合成数据自举训练中的预算分配问题,证明恒定策略无法高概率收敛,而指数增长策略在最坏情况下优于多项式策略,并在图像去噪(DPM)和数学推理(LLM)实验中验证了该结论。
- Spiking Meets Attention: Efficient Remote Sensing Image Super-Resolution with Attention Spiking Neural Networks
-
提出 SpikeSR,首个基于注意力脉冲神经网络(SNN)的遥感图像超分辨率框架,通过脉冲注意力块(SAB)结合混合维度注意力(HDA)和可变形相似度注意力(DSA),在 AID/DOTA/DIOR 上达到 SOTA 性能同时保持高计算效率。
- The Effect of Optimal Self-Distillation in Noisy Gaussian Mixture Model
-
利用统计物理的replica方法对噪声高斯混合数据上的超参优化多阶段自蒸馏进行严格理论分析,揭示硬伪标签的去噪效应是自蒸馏性能提升的主要驱动力,中等规模数据集获益最显著,并提出早停(限制蒸馏阶段数)和偏置参数固定两个实用改进策略,CIFAR-10+ResNet实验验证了理论预测。