跳转至

🖼️ 图像恢复

📹 ICCV2025 · 30 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (5) · 📷 CVPR2026 (47) · 🔬 ICLR2026 (15) · 🤖 AAAI2026 (13) · 🧠 NeurIPS2025 (26) · 🧪 ICML2025 (5)

🔥 高频主题: 图像恢复 ×14 · 超分辨率 ×5 · 扩散模型 ×3

Benchmarking Burst Super-Resolution for Polarization Images: Noise Dataset and Analysis

本文针对偏振图像 burst 超分辨率的缺乏数据集和噪声模型的问题,构建了两个专用数据集 PolarNS(噪声统计)和 PolarBurstSR(超分基准),提出了偏振噪声传播分析模型,并系统比较了现有 burst SR 方法在偏振场景下的表现,为偏振图像重建领域建立了标准化评测基准。

Benchmarking Burst Super-Resolution for Polarization Images: Noise Dataset and Analysis

针对偏振相机"光效低、分辨率低、噪声大"的硬件瓶颈,构建了两个专用数据集(PolarNS用于噪声统计分析,PolarBurstSR用于burst超分的训练/评测),提出偏振噪声传播分析模型,并将5种SOTA burst超分方法适配到偏振域,证明偏振专用训练在强度图(s0)和偏振角(AoLP)重建上显著优于RGB通用训练。

Blind2Sound: Self-Supervised Image Denoising without Residual Noise

提出 Blind2Sound 框架,通过自适应重可见损失(adaptive re-visible loss)感知噪声水平并实现个性化去噪,配合 Cramer Gaussian 损失提升噪声参数估计精度,在自监督盲去噪中消除残余噪声,性能超越同期所有自监督方法甚至部分有监督基线。

Blind Noisy Image Deblurring Using Residual Guidance Strategy

提出残差引导策略(RGS),在图像金字塔的粗到细估计过程中,利用相邻粗尺度的卷积残差经 guided filter 去噪后校正当前尺度的模糊图像,从而在高噪声(σ=0.1)下显著提升盲去模糊的核估计精度和恢复质量,无需训练即超越多种深度学习方法。

Closed-Loop Transfer for Weakly-supervised Affordance Grounding

提出LoopTrans闭环知识迁移框架,通过共享CAM实现外中心-自中心图像的统一知识激活,利用像素级伪掩码将粗激活精炼为精确定位,并通过去噪蒸馏将自中心定位反馈增强外中心知识提取,在AGD20K上全面超越SOTA。

Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention

GIGA-ToF 提出了一种基于运动不变图结构融合的 ToF 深度去噪网络,通过跨帧图注意力机制和 MAP 问题的算法展开,同时增强了时序稳定性和空间锐度,并在合成和真实数据上展现了优秀的泛化能力。

CWNet: Causal Wavelet Network for Low-Light Image Enhancement

提出因果小波网络CWNet,通过结构因果模型将低光增强中的语义信息视为因果因子、亮度/颜色退化视为非因果因子,结合小波变换骨干网络实现频域特征的精细化恢复。

Decouple to Reconstruct: High Quality UHD Restoration via Active Feature Disentanglement and Reversible Fusion

提出 D²R-UHDNet 框架,通过 Controlled Differential Disentangled VAE(CD²-VAE)将退化图像主动解耦为退化主导潜空间和背景主导特征,并利用复数域可逆多尺度融合网络处理背景特征,在仅 1M 参数下实现六项 UHD 复原任务的 SOTA。

Devil is in the Uniformity: Exploring Diverse Learners within Transformer for Image Restoration

针对标准Multi-Head Attention (MHA)中各head使用均匀子空间导致的冗余问题,提出HINT模型,通过异构层级多头注意力(HMHA)和Query-Key缓存更新(QKCU)机制增强head间多样性与交互,在5类图像恢复任务的12个benchmark上取得SOTA结果。

EAMamba: Efficient All-Around Vision State Space Model for Image Restoration

本文提出EAMamba框架,通过多头选择性扫描模块(MHSSM)和全方位扫描策略(all-around scanning),在不增加计算复杂度和参数量的情况下实现多方向扫描,解决了Vision Mamba在图像恢复中的计算开销和局部像素遗忘问题,在超分辨率、去噪、去模糊、去雾等任务上取得了31-89%的FLOPs降低同时保持优异性能。

Efficient Concertormer for Image Deblurring and Beyond

提出 Concertormer,通过将自注意力分解为全局 Concertino 和局部 Ripieno 两个分量,同时引入跨维度通信模块和门控深度卷积 MLP,实现了线性复杂度下的全局-局部特征建模,在去模糊及其他图像复原任务上取得 SOTA 性能。

Emulating Self-Attention with Convolution for Efficient Image Super-Resolution

观察到自注意力在相邻层之间的特征和注意力图高度相似(89%/87%),提出用共享大核卷积和动态卷积核组成的 ConvAttn 模块替代大部分自注意力,同时首次在轻量级超分辨率中引入 Flash Attention 将窗口扩展到 32×32,以极低延迟和内存代价实现了 SOTA 性能。

Enhancing Image Restoration Transformer via Adaptive Translation Equivariance

系统研究了平移等变性(Translation Equivariance, TE)对图像修复网络收敛速度和泛化能力的影响,提出滑动键值自注意力(SkvSA)及其自适应版本(ASkvSA)和下采样自注意力(DSA),构建了 TEAFormer,在超分、去模糊、去噪等多个任务上取得 SOTA,同时保持线性复杂度。

Exploiting Diffusion Prior for Task-driven Image Restoration

提出 EDTR 方法,通过预修复+部分扩散和短步去噪策略,有效利用扩散模型先验恢复与高层视觉任务相关的细节,在复杂退化场景下显著提升分类、分割和检测性能。

FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration

构建了首个百万级真实世界配对图像修复数据集(含 20 种退化类型),并提出 FoundIR 框架,通过退化无关的泛化器模型与退化感知的专家模型协同,在 24 个基准上突破了图像修复的性能天花板。

Generic Event Boundary Detection via Denoising Diffusion (DiffGEBD)

DiffGEBD 首次将扩散模型引入通用事件边界检测(GEBD),通过将边界预测建模为从随机噪声到合理边界分布的去噪过程,利用 Classifier-Free Guidance 控制预测多样性,并提出了对称 F1 和 Diversity Score 两项新评估指标来衡量多预测场景下的质量与多样性。

IM-LUT: Interpolation Mixing Look-Up Tables for Image Super-Resolution

本文提出 IM-LUT,通过学习混合多种插值函数的权重来实现任意尺度图像超分辨率,并将预测网络转换为查找表形式,在 CPU 上实现轻量快速推理同时保持重建质量。

Learning Pixel-adaptive Multi-layer Perceptrons for Real-time Image Enhancement

提出 BPAM 框架,将双边网格的空间建模能力与 MLP 的非线性映射能力相结合,通过为每个像素动态生成独特的微型 MLP 参数实现高质量、实时的图像增强。

Lightweight and Fast Real-time Image Enhancement via Decomposition of the Spatial-aware Lookup Tables

通过将3D LUT分解为2D LUT的线性组合并进一步做SVD,结合缓存高效的空间特征融合结构,实现了在保持空间感知能力的同时将模型参数减少84%、4K分辨率推理加速2.8倍的轻量实时图像增强。

Low-Light Image Enhancement using Event-Based Illumination Estimation (RetinEV)

RetinEV 提出利用事件相机的"时间映射事件"(temporal-mapping events,由透射率调制触发)而非传统"运动事件"进行光照估计,结合 Retinex 理论将低光照图像分解为光照和反射率分量,通过光照辅助反射率增强(IRE)模块实现高质量低光照图像增强,在 640×480 分辨率下达到 35.6 FPS 实时速度。

Metric Convolutions: A Unifying Theory to Adaptive Image Convolutions

从度量几何视角统一解释现有各种自适应卷积(标准/膨胀/平移/可变形),并基于显式 Randers 度量的单位球采样提出 Metric Convolution,以更少参数实现更好的几何正则化和泛化能力。

MobileIE: An Extremely Lightweight and Effective ConvNet for Real-Time Image Enhancement on Mobile Devices

提出 MobileIE,一个仅有约 4K 参数的极致轻量 CNN 框架,通过多分支重参数化卷积(MBRConv)、特征自变换(FST)模块、分层双路径注意力(HDPA)以及增量权重优化(IWO)策略,首次在移动设备上实现超过 1100 FPS 的实时图像增强,同时在低光增强、水下增强和 ISP 三个任务上取得最优的速度-性能平衡。

MP-HSIR: A Multi-Prompt Framework for Universal Hyperspectral Image Restoration

提出 MP-HSIR 框架,通过整合光谱提示(通用低秩光谱模式)、文本提示和视觉提示三种模态的引导信息,构建了统一的高光谱图像复原模型,在包含去噪、去模糊、超分辨率、修复、去雾、波段补全等 9 个 HSI 复原任务上全面超越现有 all-in-one 方法和多个任务专用方法。

Outlier-Aware Post-Training Quantization for Image Super-Resolution

提出一种面向图像超分辨率的离群值感知后训练量化方法,通过双区域分段线性量化平衡离群值保留与正常激活精度,并引入敏感度感知微调策略使模型关注量化敏感层,在 W4A4 设置下大幅超越现有 PTQ 方法并接近 QAT 性能。

PRE-Mamba: A 4D State Space Model for Ultra-High-Frequent Event Camera Deraining

首个基于点的事件相机去雨框架,利用4D事件云表示和多尺度状态空间模型(MS3M),在保持微秒级时间精度的同时实现高效去雨,仅0.26M参数即达到SOTA性能。

Robust Adverse Weather Removal via Spectral-based Spatial Grouping (SSGformer)

SSGformer 提出一种基于光谱分解和分组注意力的 All-in-One 恶劣天气图像复原方法:利用 Sobel 算子提取高频边缘信息和 SVD 分析低频退化纹理,将二者融合后生成空间分组掩码(grouping-mask),在组内执行通道和空间注意力以实现对多种天气退化(雨、雪、雾、雨滴)的鲁棒去除。

Self-Calibrated Variance-Stabilizing Transformations for Real-World Image Denoising

提出 Noise2VST 框架,通过自监督学习一个无模型假设的方差稳定化变换(VST),使现成的高斯去噪器无需额外训练即可高效处理真实世界噪声图像。

Towards a Universal Image Degradation Model via Content-Degradation Disentanglement

提出首个通用图像退化模型,通过"压缩解纠缠"方法分离退化信息与图像内容,引入 IDEN 和 IDA 层处理非均匀退化,实现跨退化类型的编码、合成和迁移,可作为 plug-in 模块将非盲图像恢复方法转化为盲方法。

UniPhys: Unified Planner and Controller with Diffusion for Flexible Physics-Based Character Control

提出 UniPhys,一个基于扩散模型的行为克隆框架,将运动规划和物理控制统一到单一模型中,通过 Diffusion Forcing 训练范式处理累积预测误差,实现了灵活的文本驱动、速度控制、目标达到和动态避障等多任务物理角色运动生成。

UniRes: Universal Image Restoration for Complex Degradations

提出 UniRes——一个基于扩散模型的通用图像复原框架,通过多任务训练学习超分辨率、运动去模糊、散焦去模糊和去噪等专家知识,推理时通过灵活组合不同任务的隐空间预测权重来端到端地处理真实世界中的任意复杂退化组合。