Continuous Exposure-Time Modeling for Realistic Atmospheric Turbulence Synthesis¶
会议: CVPR 2026
arXiv: 2603.01398
代码: 有
领域: 科学计算
关键词: 大气湍流合成, 曝光时间建模, 调制传递函数(MTF), 点扩散函数(PSF), 湍流图像复原
一句话总结¶
提出曝光时间依赖的调制传递函数(ET-MTF),将曝光时间建模为连续变量,构建了大规模合成湍流数据集 ET-Turb(5083视频、200万帧),显著提升湍流复原模型在真实数据上的泛化能力。
研究背景与动机¶
大气湍流通过折射率的随机波动,对远距离成像引入几何扭曲(tilt)和曝光时间相关的模糊(blur),严重影响遥感、视频监控、天文观测等应用。学习方法的性能高度依赖训练数据的真实性,而获取大规模配对真实湍流数据极其昂贵,因此合成数据集至关重要。
现有合成方法的核心缺陷在于对曝光时间的处理过于粗糙:
- 固定曝光方法:大量方法对所有样本使用单一曝光设置,导致模糊统计特性单一,无法反映真实成像中的时间变化性
- 二值曝光方法:部分方法仅区分"短曝光"和"长曝光"两种模式,使用对应的 \(\text{MTF}_{\text{SE}}\) 和 \(\text{MTF}_{\text{LE}}\),忽略了中间曝光时间产生的平滑过渡
- 物理仿真方法:气体灶等物理装置受限于短光路,多步相位屏方法计算开销巨大
这些限制导致合成数据与真实湍流存在显著域差距,训练出的模型泛化能力受限。
方法详解¶
整体框架¶
论文把湍流退化建模为 \(I(\mathbf{x}) = \mathcal{B}_\tau(\mathcal{T}(J(\mathbf{x})))\):先对清晰图像 \(J\) 施加与曝光时间无关的几何扭曲算子 \(\mathcal{T}\)(tilt)得到 tilt 图像 \(I_T\),再施加曝光时间依赖的模糊算子 \(\mathcal{B}_\tau\)。tilt 直接沿用已有的随机位移场建模(不是本文重点),论文的贡献集中在如何把 \(\mathcal{B}_\tau\) 建得既随曝光时间连续变化、又随空间位置变化,并扩展到视频。
模糊合成流水线串起四个核心设计:① 从 Azoulay 有限曝光理论推出曝光时间依赖的 MTF(ET-MTF),把"短曝光 / 长曝光"两个离散状态连成一根连续旋钮;② 对 ET-MTF 做模糊宽度重参数化,用局部模糊宽度 \(\omega\) 替换 Fried 参数 \(r_0\),引入逐像素可调的空间维度;中间经一步通用操作——对 ET-MTF 逆傅里叶得到去 tilt 的纯模糊 PSF;③ 用受光学湍流统计约束的空间变化模糊宽度场 \(\mathcal{W}(\mathbf{x},\tau)\) 给每个像素分配局部 \(\omega\),逐像素卷积出单帧退化图;④ 借 Taylor 冻结流做帧间相关性建模,把单帧扩成时间连贯的视频。最后用这条流水线批量生成 ET-Turb 数据集。
%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
A["清晰图像 J(x) → 几何扭曲 tilt<br/>与曝光时间无关,得 tilt 图像 I_T"]
A --> C["ET-MTF<br/>曝光时间 τ 连续的调制传递函数"]
C --> D["模糊宽度重参数化<br/>用 ω 替换 r₀,引入空间维度"]
D --> E["纯模糊 PSF<br/>对 ET-MTF 逆傅里叶(去 tilt)"]
F["空间变化模糊宽度场 W(x,τ)<br/>物理约束随机场,逐像素给 ω"] --> E
E --> G["逐像素卷积 B_τ<br/>得单帧退化图"]
G --> H["帧间相关性建模<br/>Taylor 冻结流按风向平移"]
H --> I["ET-Turb 视频数据集"]
关键设计¶
1. 曝光时间依赖的 MTF(ET-MTF):把"短曝光 vs 长曝光"的二元开关变成一根连续旋钮
现有方法只给出 \(\text{MTF}_{\text{SE}}\) 和 \(\text{MTF}_{\text{LE}}\) 两个极端状态,中间曝光既无物理模型、又只能靠经验插值,物理意义模糊。本文回到 Azoulay 的有限曝光 MTF 理论,用一个直观概念把两端连起来:有效相干长度 \(\rho_p(\tau)\)。短曝光下湍流在物理口径 \(D\) 内近似"冻结",而长曝光时传感器在积分窗口内累积了多个湍流状态,等效于一个被风"拉大"的口径 \(D + v_w \tau\)。于是 MTF 写成
其中 \(r_0\) 是 Fried 参数、\(v_w\) 是风速、\(\boldsymbol{\xi}\) 是空间频率。曝光时间 \(\tau\) 一增大,等效口径变大、\(\rho_p(\tau)\) 平滑减小,MTF 的高频段衰减随之加快——从弱模糊到强模糊的过渡因此是连续、有物理出处的,而不是在两个离散模式间硬切。
2. 模糊宽度重参数化:让同一套 MTF 既随曝光时间变、也随空间位置变
\(\rho_p(\tau)\) 只含 \(\tau\),意味着整张图被同一强度的模糊覆盖;但真实湍流因局部折射率波动,模糊在画面上本就是空间非均匀的。要把空间维度引进来,作者用 PSF 的半高全宽(FWHM)定义局部模糊宽度 \(\omega \approx \frac{0.49 \lambda f}{r_0}\),再把这个关系反解出 \(r_0\) 代回有效相干长度,于是
重参数化之后,ET-MTF 同时由局部模糊宽度 \(\omega\)(空间)和曝光时间 \(\tau\)(时间)决定。换句话说,\(\omega\) 成了一个可以逐像素调节的"模糊旋钮",为下一步铺路。
3. 空间变化模糊宽度场:把标量 \(\omega\) 升级成受物理约束的随机场
有了逐像素可调的 \(\omega\),还需要决定每个位置具体取多大。作者把模糊宽度建模为一个空间相关的随机场 \(\mathcal{W}(\mathbf{x}, \tau)\),它的均值和标准差不是随便给的,而是由光学湍流理论约束:
其中 \(\bar{\omega}(\tau)\) 和 \(\sigma_\omega(\tau)\) 都是 \(\tau\) 的函数(由原文给出的物理公式确定),\(\mathcal{R}(\mathbf{x})\) 是一个经低通滤波的零均值、单位方差高斯随机场——低通保证相邻像素的模糊是平滑过渡而非椒盐噪点,\(\epsilon > 0\) 则托住下界防止出现负宽度。最终的空间变化模糊操作就是用每个位置自己的 PSF 去卷积去 tilt 后的图像:
这一步让合成图像在同一帧内就具备真实湍流那种"近处清、远处糊、局部还忽强忽弱"的空间不均匀模糊。
4. 帧间相关性建模:用 Taylor 冻结流把单帧扩成时间连贯的视频
前三步只解决了一帧怎么糊;视频还要求相邻帧的湍流是连续演化而非各帧独立随机。作者采用 Taylor 冻结流假设,把湍流看成一块准静态的折射率场被平均风整体平移:
只要先在一个比画面更大的退化场上采样,再沿风向按帧平移采样窗口,就能得到时间上相互关联的连续帧——既复用了同一套 ET-MTF 退化,又自然带出湍流随时间漂移的视觉效果。
损失函数 / 训练策略¶
本文核心贡献在于数据集构建而非网络训练。ET-Turb 数据集设计了 12 种湍流配置,系统性覆盖不同光学和大气条件:
- 参数空间:传播距离 30-1000m、焦距 0.1-1m、F 数 2.8-24、\(C_n^2\) 范围 \(0.5 \times 10^{-14}\) 到 \(300 \times 10^{-14}\) m\(^{-2/3}\)、风速 1-10 m/s、曝光时间 0.5-40ms
- 数据规模:5,083 个视频,2,005,835 帧,分为 3,988 训练 / 1,095 测试
- 真实数据集:ET-Turb-Real 包含 74 个视频,来自 3 种不同成像设备
实验关键数据¶
主实验¶
在真实湍流数据上评估不同合成数据集训练的模型(无参考指标,越低越好):
| 训练数据集 | TSR-WGAN NIQE↓ | TSR-WGAN BRISQUE↓ | TMT NIQE↓ | TMT BRISQUE↓ | DATUM NIQE↓ | DATUM BRISQUE↓ | MambaTM NIQE↓ | MambaTM BRISQUE↓ |
|---|---|---|---|---|---|---|---|---|
| TMT-dynamic | 4.231 | 52.502 | 4.361 | 58.581 | 4.219 | 54.921 | 4.217 | 55.062 |
| ATSyn-dynamic | 4.224 | 54.462 | 4.483 | 59.707 | 4.308 | 59.126 | 4.247 | 56.876 |
| ET-Turb | 4.190 | 50.981 | 4.221 | 56.691 | 4.204 | 54.070 | 4.212 | 55.050 |
ET-Turb 在全部 4 个模型 × 2 个指标共 8 项评测中取得 7 项最优。
消融实验¶
不同曝光建模策略的对比(MambaTM 模型):
| 曝光策略 | NIQE↓ | BRISQUE↓ |
|---|---|---|
| 固定曝光 τ=1ms | 4.355 | 55.457 |
| 二值 MTF_SE/LE | 4.297 | 55.123 |
| 连续 ET-MTF | 4.212 | 55.050 |
关键发现¶
- 固定曝光训练的模型难以恢复强模糊,因为训练数据中缺乏曝光变化
- 二值 MTF 模型有所改善但仍存在残余模糊,说明其对中间曝光范围覆盖不足
- 连续 ET-MTF 产生最自然、视觉一致的复原效果,证明连续建模的关键作用
- ET-Turb 训练的模型在零样本迁移到真实数据时,避免了其他数据集训练模型常见的建筑文字变形、远处电线杆失真等伪影
亮点与洞察¶
- 物理建模的简洁优雅:通过"有效口径 = 物理口径 + 风速×曝光时间"这一直觉概念,自然地桥接了短/长曝光 MTF,物理意义清晰
- 重参数化技巧:将 Fried 参数 \(r_0\) 替换为模糊宽度 \(\omega\),巧妙引入空间变化性
- 数据集设计思路:12 种配置 × 7 个物理参数的系统化采样,比随机采样更能覆盖真实场景的多样性
- 评估设计合理:使用无参考指标在真实数据上评估,避免了合成数据测合成数据的循环论证
局限与展望¶
- Taylor 冻结流假设的有效性受限于短曝光时间尺度,对极端条件可能失效
- 仅考虑了各向同性湍流模型,真实大气(尤其近地面)可能呈各向异性
- 合成数据仅包含模糊和几何扭曲,未建模散射、色散等其他大气效应
- 曝光时间限制在 0.5-40ms,超长曝光场景(如天文观测)可能需要不同建模
- 可结合可学习的曝光时间调度策略,做端到端的退化感知训练
评分¶
⭐⭐⭐⭐ 4/5
在湍流合成这个相对窄的领域做出了扎实的物理建模贡献。ET-MTF 的推导有清晰的物理根基,数据集设计周全,实验评估充分(4个SOTA模型×3个数据集的交叉验证)。扣分点在于这是一个数据集/仿真工具论文,缺少模型架构创新;此外消融实验中指标提升幅度有限(NIQE 从 4.297→4.212),虽然视觉效果差异更明显。