🖼️ 图像恢复¶
🤖 AAAI2026 · 13 篇论文解读
📌 同领域跨会议浏览: 💬 ACL2026 (5) · 📷 CVPR2026 (47) · 🔬 ICLR2026 (15) · 🧠 NeurIPS2025 (26) · 📹 ICCV2025 (30) · 🧪 ICML2025 (5)
🔥 高频主题: 图像恢复 ×4 · LLM ×2 · 超分辨率 ×2
- Blur-Robust Detection via Feature Restoration: An End-to-End Framework for Prior-Guided Infrared UAV Target Detection
-
提出 JFD3 端到端双分支框架,在特征域而非图像域进行去模糊,并利用频率结构先验引导检测网络,实现运动模糊条件下红外无人机目标的高精度实时检测。
- Clear Nights Ahead: Towards Multi-Weather Nighttime Image Restoration
-
首次定义并探索多天气夜间图像复原任务,构建 AllWeatherNight 数据集(8K 训练 + 1K 合成测试 + 1K 真实测试),提出 ClearNight 统一框架通过 Retinex 双先验引导和天气感知动态专一性-共性协作,一阶段同时移除雾/雨条/雨滴/雪/flare 复合退化,仅 2.84M 参数全面超越 SOTA。
- ClearAIR: A Human-Visual-Perception-Inspired All-in-One Image Restoration
-
受人类视觉感知(HVP)启发,提出一种从粗到细的统一图像复原框架 ClearAIR,通过 MLLM 质量评估 → 语义区域感知 → 退化类型识别 → 内部线索复用四阶段逐步恢复图像质量,在多种退化任务上取得 SOTA。
- Hard vs. Noise: Resolving Hard-Noisy Sample Confusion in Recommender Systems via Large Language Models
-
提出 LLMHNI 框架,利用 LLM 产生的语义相关性和逻辑相关性两类辅助信号,解决推荐系统中困难样本与噪声样本难以区分的问题,显著提升去噪推荐性能。
- HQ-SVC: Towards High-Quality Zero-Shot Singing Voice Conversion in Low-Resource Scenarios
-
提出 HQ-SVC 框架,基于解耦音频编解码器(FACodec)联合提取内容与说话人特征,结合增强语音适配模块(EVA)融合音高、能量等声学特征,通过 DDSP + 扩散模型渐进式优化,在单张 RTX 3090、不到 80 小时歌声数据条件下实现了超越大规模训练基线的零样本歌声转换质量,并附带支持语音超分辨率任务。
- ICLR: Inter-Chrominance and Luminance Interaction for Natural Color Restoration in Low-Light Image Enhancement
-
针对HVI色彩空间中色度和亮度分支分布差异大导致互补特征提取不足、以及色度分支间弱相关导致梯度冲突的问题,提出ICLR框架,通过双流交互增强模块(DIEM)和协方差校正损失(CCL)分别从融合增强和统计分布优化两个角度解决,在LOL系列数据集上取得SOTA。
- Large Language Models Meet Extreme Multi-label Classification: Scaling and Multi-modal Framework
-
本文探索了解码器型LLM在极端多标签分类(XMC)中的有效利用,提出双解码器学习策略和 ViXML 多模态框架,通过结构化提示模板适配LLM embedding + 高效融合视觉元数据,在四个公共数据集上大幅超越 SOTA(最大数据集 P@1 提升 +8.21%),证明"一张图胜过数十亿参数"。
- MFmamba: A Multi-function Network for Panchromatic Image Resolution Restoration Based on State-Space Model
-
提出MFmamba多功能网络,基于UNet++骨架结合Mamba上采样模块(MUB)、双池化注意力(DPA)和多尺度混合交叉块(MHCB),仅使用全色(PAN)图像输入即可同时实现超分辨率、光谱恢复及联合SR与着色三种任务。
- RefiDiff: Progressive Refinement Diffusion for Efficient Missing Data Imputation
-
提出 RefiDiff 四阶段框架(预处理→warm-up→扩散→polish),首次将 predictive 和 generative 缺失值填补范式渐进统一,结合 Mamba-based denoising 在 9 个数据集上取得 SOTA,速度比 DIFFPUTER 快 4 倍。
- SD-PSFNet: Sequential and Dynamic Point Spread Function Network for Image Deraining
-
提出基于动态 PSF 机制的级联 CNN 去雨网络 SD-PSFNet,通过多尺度可学习 PSF 字典建模雨滴光学效应,配合自适应门控融合的序列化修复架构,在 Rain100H 达 33.12 dB、RealRain-1k-L 达 42.28 dB 均为 SOTA,对比基线 MPRNet 累计提升 5.04 dB(13.5%)。
- SpatioTemporal Difference Network for Video Depth Super-Resolution
-
基于视频深度超分辨率(VDSR)中空间非光滑区域和时间变化区域呈长尾分布的统计发现,提出 STDNet,通过空间差异分支(学习空间差异表示进行帧内 RGB-D 自适应聚合)和时间差异分支(利用时间差异表示在变化区域进行运动补偿),在 TarTanAir 数据集上 ×16 超分 RMSE 从 112.04cm 降至 96.80cm,平均超越 SOTA 方法 27.6%-32.6%。
- Temporal Inconsistency Guidance for Super-resolution Video Quality Assessment
-
提出 TIG-SVQA 框架,首次将时间不一致性(temporal inconsistency)作为显式引导信号融入超分辨率视频质量评估,设计了不一致性高亮空间模块(IHSM)和不一致性引导时间模块(IGTM),在 SFD、MFD 和 Combined-VSR 三个数据集上 SRCC 分别达到 0.950、0.942、0.939,全面超越现有 IQA/VQA 方法。
- TMDC: A Two-Stage Modality Denoising and Complementation Framework for Multimodal Sentiment Analysis
-
提出 TMDC 两阶段框架,第一阶段在完整数据上学习去噪的 modality-specific 和 modality-common 表示,第二阶段利用可用模态的去噪表示补全缺失模态,首次同时处理 MSA 中的噪声和缺失问题。