跳转至

🖼️ 图像恢复

🎞️ ECCV2024 · 34 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (5) · 📷 CVPR2026 (47) · 🔬 ICLR2026 (15) · 🤖 AAAI2026 (13) · 🧠 NeurIPS2025 (26) · 📹 ICCV2025 (30)

🔥 高频主题: 超分辨率 ×13 · 图像恢复 ×13 · 扩散模型 ×7 · 个性化生成 ×3 · 压缩/编码 ×2

A New Dataset and Framework for Real-World Blurred Images Super-Resolution

针对现有盲超分方法在处理含模糊(散焦/运动模糊)图像时过度纹理化、破坏模糊区域感知质量的问题,构建了包含近3000张模糊图像的ReBlurSR数据集,并提出PBaSR框架,通过双分支解耦训练(CDM)和基于权重插值的跨分支融合(CFM),在不增加任何推理开销的前提下,同时提升模糊图像和普通图像的超分效果,LPIPS提升0.02~0.10。

Accelerating Image Super-Resolution Networks with Pixel-Level Classification

提出PCSR——首个像素级计算资源分配的超分方法,用轻量MLP分类器逐像素判断恢复难度并分配到不同容量的上采样器,在PSNR几乎不掉的情况下将FLOPs压低至原始模型的18%~57%,大幅优于现有patch级方法ClassSR和ARM。

Adaptive Selection of Sampling-Reconstruction in Fourier Compressed Sensing

提出自适应选择采样-重建框架 \(\mathcal{H}_{1.5}\),为每个输入数据自适应选择最佳的采样mask与专用重建网络对,利用超分辨率空间生成模型量化高频不确定性实现选择,理论证明优于非自适应联合优化 \(\mathcal{H}_1\) 和自适应采样 \(\mathcal{H}_2\)

Asymmetric Mask Scheme for Self-supervised Real Image Denoising

提出非对称掩码方案 AMSNet,训练时用单掩码、推理时用多掩码互补,突破了 blind spot network 对网络感受野的结构限制,在真实图像自监督去噪任务上取得 SOTA。

BAMM: Bidirectional Autoregressive Motion Model

提出 BAMM(双向自回归运动模型),通过统一生成掩码建模和自回归建模的混合注意力掩码策略,在一个框架中同时实现高质量运动生成、自适应长度预测和零样本运动编辑,在 HumanML3D 和 KIT-ML 上全面超越 SOTA。

Blind Image Deblurring with Noise-Robust Kernel Estimation

本文提出一种基于噪声鲁棒核估计函数和深度图像先验(DIP)的盲去模糊方法,通过设计能在强噪声下仍能准确估计模糊核的核估计函数,结合多核估计方案处理未知噪声水平,在模拟和真实图像上取得了优越的去模糊性能。

Contourlet Residual for Prompt Learning Enhanced Infrared Image Super-Resolution

针对红外图像超分辨率的特殊挑战,提出 CoRPLE 框架,利用 Contourlet 变换进行多尺度多方向的红外频谱残差增强,并引入基于视觉语言模型的提示学习范式来捕获红外图像的固有特征,在红外 SR 任务上达到 SOTA 性能。

DenoiSplit: A Method for Joint Microscopy Image Splitting and Unsupervised Denoising

提出 DenoiSplit,首个将语义图像分解(image splitting)和无监督去噪(unsupervised denoising)联合解决的方法,通过在层次化 VAE 中整合像素噪声模型和改进的 KL 散度损失加权策略,在荧光显微镜图像上实现了端到端的去噪+分解,性能显著优于先去噪再分解的串行方案。

Domain-Adaptive Video Deblurring via Test-Time Blurring

提出基于扩散模糊模型的测试时域适应方法,通过从模糊视频中检测相对清晰区域作为伪清晰图像,并生成域自适应的模糊条件来合成训练对,实现在未知域上对去模糊模型的微调,在 5 个真实数据集上最高提升 7.54dB。

EDformer: Transformer-Based Event Denoising Across Varied Noise Levels

EDformer 提出了一种基于 Transformer 的逐事件去噪模型,通过学习事件之间的时空相关性来处理不同噪声水平下的事件相机噪声,并首次构建了包含 21 个噪声等级的真实世界事件去噪数据集 ED24。

Efficient Cascaded Multiscale Adaptive Network for Image Restoration

ECMA 提出了一种高效级联多尺度自适应网络,通过局部自适应模块(LAM)动态调整卷积核来处理空间变化的退化,并以级联多尺度的方式捕捉不同尺度的特征,在去模糊、去噪和超分辨率等多种图像复原任务上以 1.2×-9.7× 的计算量减少实现了与 SOTA 可比甚至更优的性能。

Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators

发现 Diffusion Transformer 中 query-key 交互存在显著冗余(尤其在去噪早期),提出 Attention Mediator 机制将注意力复杂度降至线性,并设计逐步动态调整策略,在 SiT-XL/2 上实现 SOTA FID 2.01,同时减少计算量。

Exploiting Dual-Correlation for Multi-frame Time-of-Flight Denoising

提出首个基于学习的多帧ToF深度去噪框架,通过双相关性估计模块(利用帧内和帧间相关性)和置信度引导的残差回归模块,有效利用多帧ToF数据之间的关联来指导噪声去除,在强噪声区域显著优于现有单帧方法。

Joint RGB-Spectral Decomposition Model Guided Image Enhancement in Mobile Photography

提出 JDM-HDRNet,通过联合 RGB-光谱分解模型从低分辨率多光谱图像(Lr-MSI)中提取 shading、reflectance 和材质语义三种先验,将它们分别融入 HDRNet 以增强动态范围、色彩映射和语义网格专家学习,并构建了首个 RGB-高光谱配对的 Mobile-Spec 数据集。

Learning Exhaustive Correlation for Spectral Super-Resolution: Where Spatial-Spectral Attention Meets Linear Dependence

本文提出 Exhaustive Correlation Transformer (ECT),通过光谱方向非连续3D切分策略 (SD3D) 建模统一的空间-光谱相关性,并通过动态低秩映射模块 (DLRM) 捕获多token间的线性依赖关系,在光谱超分辨率任务上以最少的参数量和最低的推理延迟实现了 SOTA 性能。

Learning to Robustly Reconstruct Dynamic Scenes from Low-Light Spike Streams

本文针对脉冲相机在低光环境下信息稀疏导致重建困难的问题,提出了一种双向循环重建框架,其核心是光鲁棒表示(LR-Rep)通过全局脉冲间隔(GISI)聚合时域信息,配合特征融合模块提取时序特征,并构建了专门的低光高速数据集,在合成和真实数据上均大幅超越现有方法。

MambaIR: A Simple Baseline for Image Restoration with State-Space Model

本文首次将 Mamba(选择性状态空间模型)引入底层图像修复任务,通过设计残差状态空间块(RSSB)中的局部卷积增强和通道注意力机制,解决了 vanilla Mamba 在 2D 图像上的局部像素遗忘和通道冗余问题,在图像超分辨率和去噪任务上以线性复杂度实现了与 Transformer 方法相当甚至更优的性能(SR 上超过 SwinIR 0.45dB)。

MoE-DiffIR: Task-customized Diffusion Priors for Universal Compressed Image Restoration

提出 MoE-DiffIR,首个基于扩散模型的通用压缩图像复原(CIR)框架,通过混合专家(MoE)Prompt 模块从 Stable Diffusion 中挖掘任务定制化的扩散先验,结合 Visual-to-Text 适配器激活 SD 的跨模态生成先验,并构建了覆盖 7 种编解码器 × 3 个压缩级别共 21 种退化的首个通用 CIR 基准数据集。

OAPT: Offset-Aware Partition Transformer for Double JPEG Artifacts Removal

针对双重 JPEG 压缩图像恢复问题,提出 OAPT,通过预测两次压缩之间的像素偏移量,将每个 8×8 block 中的四种不同模式进行聚类分组后分别进行自注意力处理,在双重 JPEG 恢复任务上超越 SOTA 方法 0.16 dB。

Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks

本文提出 ODM 框架,通过协同失配正则化(cooperative mismatch regularization)和逐层权重裁剪校正(weight clipping correction)两个简单策略,在不引入推理时动态模块的前提下解决 SR 网络量化中的分布失配问题,以极小的额外开销达到 SOTA。

Pairwise Distance Distillation for Unsupervised Real-World Image Super-Resolution

提出成对距离蒸馏框架,通过蒸馏专用模型和通用模型之间的内部和模型间距离关系,实现无监督真实世界图像超分辨率的退化自适应。

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

提出 PASD(Pixel-Aware Stable Diffusion),通过像素感知交叉注意力(PACA)模块使扩散模型在像素级感知图像局部结构,结合退化去除模块和可调噪声调度,实现了真实图像超分辨率和个性化风格化的统一框架,只需替换底座模型即可切换风格。

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

提出像素感知稳定扩散(PASD)网络,通过像素感知交叉注意力(PACA)在潜空间中实现像素级结构保持,配合退化移除模块和可调噪声调度,统一解决真实图像超分辨率和个性化风格迁移两大任务。

Restoring Images in Adverse Weather Conditions via Histogram Transformer

提出 Histoformer,一种基于直方图自注意力机制的高效 Transformer,通过将空间特征按像素强度排序分箱(bin),在箱内和箱间执行自注意力,实现动态范围的空间注意力以高效处理天气退化像素,配合动态范围卷积和 Pearson 相关性损失,在去雪/去雨雾/去雨滴三大任务上统一建模并达到 SOTA。

Rethinking Image Super-Resolution from Training Data Perspectives

从训练数据角度重新思考图像超分辨率,提出自动化数据评估流水线构建 DiverSeg 数据集(低分辨率但高质量、目标多样的图像),证明在该数据集上训练的 SR 模型可以超越使用高分辨率数据集(DF2K、LSDIR)训练的模型。

Seeing the Unseen: A Frequency Prompt Guided Transformer for Image Restoration

提出 FPro,通过频域视角的 prompt learning 指导图像复原:使用 Gated Dynamic Decoupler 将特征解耦为低频/高频分量,再通过 Dual Prompt Block(HPM + LPM)分别对两个频带注入可学习 prompt 并与解码器特征交互,在去雨、去雨滴、去摩尔纹、去模糊、去雾 5 个任务上全面超越 SOTA。

Spatially-Variant Degradation Model for Dataset-free Super-resolution

提出首个无需数据集训练的空间变化退化模型 SVDSR,每个像素的退化核由可学习的原子核字典的线性组合表示,系数矩阵通过模糊集的隶属函数从图像纹理信息推导,在 MAP 框架下用 Monte Carlo EM 算法推断,\(2\times\) 超分平均提升 1 dB。

Stream Query Denoising for Vectorized HD-Map Construction

提出 Stream Query Denoising (SQD) 策略,通过对前一帧 GT 添加噪声并训练网络恢复当前帧 GT 来增强流式 HD 地图构建中的时序一致性建模,在 nuScenes 和 Argoverse2 上全面超越 StreamMapNet。

Towards Real-world Event-guided Low-light Video Enhancement and Deblurring

本文首次提出事件相机引导的低光视频增强与去模糊联合任务,构建了基于分光棱镜的真实世界数据集 RELED,并设计了包含事件引导可变形时序对齐 (ED-TFA) 和频谱滤波跨模态增强 (SFCM-FE) 两个核心模块的端到端框架,在 PSNR 上比此前最佳方法提升 1.2dB 以上。

TTT-MIM: Test-Time Training with Masked Image Modeling for Denoising Distribution Shifts

本文提出 TTT-MIM,在训练阶段联合优化监督去噪损失和自监督掩码图像建模(MIM)损失,在测试时通过最小化 MIM 自监督损失对单张噪声图像进行适应性微调,从而显著提升对分布外噪声(如真实相机噪声、显微镜噪声)的去噪性能,且速度远超零样本方法。

Unrolled Decomposed Unpaired Learning for Controllable Low-Light Video Enhancement

提出 UDU-Net,将低光视频增强建模为 MAP 优化问题并展开为深度网络,通过 Intra/Inter 子网分别处理空间(光照)和时序(一致性)退化,支持无配对训练和人类感知反馈的可控增强。

XPSR: Cross-modal Priors for Diffusion-based Image Super-Resolution

XPSR 利用多模态大语言模型(MLLM)提取高层和低层语义先验,通过 Semantic-Fusion Attention 和 Degradation-Free Constraint 引导扩散模型实现高保真、高真实感的图像超分辨率。

XPSR: Cross-modal Priors for Diffusion-based Image Super-Resolution

XPSR提出将多模态大语言模型(LLaVA)生成的高层与低层语义描述作为跨模态先验,通过Semantic-Fusion Attention融合到扩散模型中,并设计Degradation-Free Constraint提取语义保留特征,实现高保真高真实感的图像超分辨率。

You Only Need One Step: Fast Super-Resolution with Stable Diffusion via Scale Distillation

提出YONOS-SR方法,通过尺度蒸馏(Scale Distillation)策略训练基于Stable Diffusion的超分辨率模型,仅需一步DDIM即可获得SOTA结果,速度比传统方法快200倍。