跳转至

TCP-Diffusion: A Multi-modal Diffusion Model for Global Tropical Cyclone Precipitation Forecasting with Change Awareness

会议: ICML 2025
arXiv: 2410.13175
代码: https://github.com/Zjut-MultimediaPlus/TCP-Diffusion
领域: 扩散模型 / 气象预测
关键词: 热带气旋降水, 扩散模型, 多模态气象数据, 邻接残差预测, NWP融合

一句话总结

提出 TCP-Diffusion,融合历史降水、多模态气象变量和 NWP 预报的条件扩散模型,通过邻接残差预测(ARP)机制预测降水变化量而非绝对值,在全球热带气旋降水预报中超越 ECMWF 等权威 NWP 方法。

研究背景与动机

领域现状:常规降水预报的深度学习方法已有进展(U-Net、GAN、扩散模型),但热带气旋(TC)降水预报尚未被系统研究——预测区域随 TC 移动,且 TC 降水的时空结构更复杂。

现有痛点:(a) 直接预测绝对降水值存在累积误差,且不保证物理一致性;(b) 仅用降水数据信息不足以捕获 TC 降水模式;(c) DL 方法未充分利用 NWP 模型提供的物理信息。

核心矛盾:TC 降水高度动态(区域跟随 TC 移动、受风场等多因素影响),纯数据驱动方法信息不足。

本文目标 (a) 减少累积预测误差;(b) 提取更丰富的气象信息;(c) 整合 NWP 预报作为引导。

切入角度:借鉴 NWP 中预测变化量的思想 + 多编码器提取异构气象数据 + NWP 预报作为条件。

核心 idea:预测降水变化量(ARP)+ 多模态条件编码 + NWP 融合的时空扩散模型。

方法详解

整体框架

TCP-Diffusion 基于时空 3D UNet 扩散模型,输入包括两部分:(1) 历史观测数据(降水、ΔRainfall、ERA5 环境变量、TC 标量变量);(2) NWP 未来预测数据。用 ARP 将预测目标从绝对降水值改为相邻时间步的降水残差。

关键设计

  1. 邻接残差预测 (ARP):

    • 功能:改变训练目标,从绝对降水值改为相邻步差值
    • 核心思路:\(\Delta_x^t = X_{\text{rain}}^t - X_{\text{rain}}^{t-1}\),模型预测未来的 \(\hat{\Delta}_y\),最终 \(\hat{y}_{n+t} = X_{\text{rain}}^n + \sum_{z=1}^t \hat{\Delta}_y^{n+z}\)
    • 设计动机:借鉴 NWP 中的增量预测思想,减少累积误差,保证降水变化趋势的物理一致性
  2. Historical Data Encoder(多模态):

    • 功能:编码 2D 气象场(降水+环境变量)和 1D 标量(TC 强度、路径)
    • 核心思路:2D 数据用 3D CNN 编码时空特征;1D 标量变量用 MLP + Transformer 编码时序依赖
    • 设计动机:不同模态数据维度不同,需要专用编码器
  3. Future Prediction Data Encoder:

    • 功能:编码 NWP 模型(ERA5-IFS)的未来预报作为条件
    • 核心思路:使用修改版 ResNet-18 提取未来预报的特征,注入 3DUNet 作为引导
    • 设计动机:NWP 预报包含物理方程编码的信息,可辅助 DL 模型做更准确的预测
  4. EA-3DUNet(核心去噪网络):

    • 功能:融合所有编码特征进行时空去噪
    • 核心思路:3D UNet 处理时空数据,编码器输出、标量特征和 NWP 条件分别注入不同层
    • 设计动机:需要同时捕获空间结构(雨带形状)和时间演化(降水增强/减弱趋势)

损失函数 / 训练策略

  • 标准扩散去噪 loss:\(L(\theta) = \|r_s - \hat{r}_s\|_2\)
  • 数据覆盖 1877 个 TC(1980-2020),训练/验证/测试 = 1751/87/126
  • 推理时采样 8 次取平均,作为概率预测

实验关键数据

主实验(vs DL方法)

方法 ETS-6 ↑ ETS-24 ↑ ETS-60 ↑ TPMAE ↓
U-Net 0.442 0.106 0 0.475
PreDiff 0.385 0.119 0.004 0.536
NowcastNet 0.422 0.090 0.000 0.570
TCP-Diffusion 0.438 0.147 0.006 0.423

vs NWP方法

方法 ETS-6 ↑ ETS-24 ↑ ETS-60 ↑ TPMAE ↓
ERA5-IFS 0.202 0.016 0 0.511
ECMWF-IFS 0.302 0.083 0.003 0.507
TCP-Diffusion 0.412 0.128 0.004 0.474

消融实验

组件 ETS-6 ↑ 相对提升
Baseline (3D DM) 0.391 -
+ ARP 0.406 +3.8%
+ ARP + 多模态 0.429 +9.7%
+ ARP + 多模态 + NWP 0.438 +12.0%

关键发现

  • TCP-Diffusion 是唯一在重降水(ETS-60)上超越 Persistence 基线的 DL 方法
  • 降水频率分布图显示 DM-based 方法(TCP-Diffusion, PreDiff)远优于非 DM 方法
  • 低成本 NWP (ERA5-IFS) + DL 的组合可超越高成本 NWP (ECMWF-IFS)

亮点与洞察

  • 首个全球 TC 降水 DL 预报系统:覆盖六大洋域的 1877 个 TC
  • DL + NWP 桥接:巧妙利用低分辨率 NWP 预报作为 DL 模型的条件输入
  • ARP 机制的通用性:预测变化量的思想可迁移到其他时序预测任务

局限与展望

  • 时间分辨率仅 3 小时,更高时间分辨率(1 小时)未验证
  • 扩散采样 8 次取平均的概率预测策略较粗糙
  • 未验证对未来 TC 的实时预报能力

评分

  • 新颖性: ⭐⭐⭐⭐ ARP + 多模态条件扩散在 TC 降水预报中的首次应用
  • 实验充分度: ⭐⭐⭐⭐⭐ 消融全面,与 DL 和 NWP 方法均有系统对比
  • 写作质量: ⭐⭐⭐⭐ 问题定义清晰,物理直觉好
  • 价值: ⭐⭐⭐⭐⭐ 对气象 AI 有重要实际意义