TCP-Diffusion: A Multi-modal Diffusion Model for Global Tropical Cyclone Precipitation Forecasting with Change Awareness¶
会议: ICML 2025
arXiv: 2410.13175
代码: https://github.com/Zjut-MultimediaPlus/TCP-Diffusion
领域: 扩散模型 / 气象预测
关键词: 热带气旋降水, 扩散模型, 多模态气象数据, 邻接残差预测, NWP融合
一句话总结¶
提出 TCP-Diffusion,融合历史降水、多模态气象变量和 NWP 预报的条件扩散模型,通过邻接残差预测(ARP)机制预测降水变化量而非绝对值,在全球热带气旋降水预报中超越 ECMWF 等权威 NWP 方法。
研究背景与动机¶
领域现状:常规降水预报的深度学习方法已有进展(U-Net、GAN、扩散模型),但热带气旋(TC)降水预报尚未被系统研究——预测区域随 TC 移动,且 TC 降水的时空结构更复杂。
现有痛点:(a) 直接预测绝对降水值存在累积误差,且不保证物理一致性;(b) 仅用降水数据信息不足以捕获 TC 降水模式;(c) DL 方法未充分利用 NWP 模型提供的物理信息。
核心矛盾:TC 降水高度动态(区域跟随 TC 移动、受风场等多因素影响),纯数据驱动方法信息不足。
本文目标 (a) 减少累积预测误差;(b) 提取更丰富的气象信息;(c) 整合 NWP 预报作为引导。
切入角度:借鉴 NWP 中预测变化量的思想 + 多编码器提取异构气象数据 + NWP 预报作为条件。
核心 idea:预测降水变化量(ARP)+ 多模态条件编码 + NWP 融合的时空扩散模型。
方法详解¶
整体框架¶
TCP-Diffusion 基于时空 3D UNet 扩散模型,输入包括两部分:(1) 历史观测数据(降水、ΔRainfall、ERA5 环境变量、TC 标量变量);(2) NWP 未来预测数据。用 ARP 将预测目标从绝对降水值改为相邻时间步的降水残差。
关键设计¶
-
邻接残差预测 (ARP):
- 功能:改变训练目标,从绝对降水值改为相邻步差值
- 核心思路:\(\Delta_x^t = X_{\text{rain}}^t - X_{\text{rain}}^{t-1}\),模型预测未来的 \(\hat{\Delta}_y\),最终 \(\hat{y}_{n+t} = X_{\text{rain}}^n + \sum_{z=1}^t \hat{\Delta}_y^{n+z}\)
- 设计动机:借鉴 NWP 中的增量预测思想,减少累积误差,保证降水变化趋势的物理一致性
-
Historical Data Encoder(多模态):
- 功能:编码 2D 气象场(降水+环境变量)和 1D 标量(TC 强度、路径)
- 核心思路:2D 数据用 3D CNN 编码时空特征;1D 标量变量用 MLP + Transformer 编码时序依赖
- 设计动机:不同模态数据维度不同,需要专用编码器
-
Future Prediction Data Encoder:
- 功能:编码 NWP 模型(ERA5-IFS)的未来预报作为条件
- 核心思路:使用修改版 ResNet-18 提取未来预报的特征,注入 3DUNet 作为引导
- 设计动机:NWP 预报包含物理方程编码的信息,可辅助 DL 模型做更准确的预测
-
EA-3DUNet(核心去噪网络):
- 功能:融合所有编码特征进行时空去噪
- 核心思路:3D UNet 处理时空数据,编码器输出、标量特征和 NWP 条件分别注入不同层
- 设计动机:需要同时捕获空间结构(雨带形状)和时间演化(降水增强/减弱趋势)
损失函数 / 训练策略¶
- 标准扩散去噪 loss:\(L(\theta) = \|r_s - \hat{r}_s\|_2\)
- 数据覆盖 1877 个 TC(1980-2020),训练/验证/测试 = 1751/87/126
- 推理时采样 8 次取平均,作为概率预测
实验关键数据¶
主实验(vs DL方法)¶
| 方法 | ETS-6 ↑ | ETS-24 ↑ | ETS-60 ↑ | TPMAE ↓ |
|---|---|---|---|---|
| U-Net | 0.442 | 0.106 | 0 | 0.475 |
| PreDiff | 0.385 | 0.119 | 0.004 | 0.536 |
| NowcastNet | 0.422 | 0.090 | 0.000 | 0.570 |
| TCP-Diffusion | 0.438 | 0.147 | 0.006 | 0.423 |
vs NWP方法¶
| 方法 | ETS-6 ↑ | ETS-24 ↑ | ETS-60 ↑ | TPMAE ↓ |
|---|---|---|---|---|
| ERA5-IFS | 0.202 | 0.016 | 0 | 0.511 |
| ECMWF-IFS | 0.302 | 0.083 | 0.003 | 0.507 |
| TCP-Diffusion | 0.412 | 0.128 | 0.004 | 0.474 |
消融实验¶
| 组件 | ETS-6 ↑ | 相对提升 |
|---|---|---|
| Baseline (3D DM) | 0.391 | - |
| + ARP | 0.406 | +3.8% |
| + ARP + 多模态 | 0.429 | +9.7% |
| + ARP + 多模态 + NWP | 0.438 | +12.0% |
关键发现¶
- TCP-Diffusion 是唯一在重降水(ETS-60)上超越 Persistence 基线的 DL 方法
- 降水频率分布图显示 DM-based 方法(TCP-Diffusion, PreDiff)远优于非 DM 方法
- 低成本 NWP (ERA5-IFS) + DL 的组合可超越高成本 NWP (ECMWF-IFS)
亮点与洞察¶
- 首个全球 TC 降水 DL 预报系统:覆盖六大洋域的 1877 个 TC
- DL + NWP 桥接:巧妙利用低分辨率 NWP 预报作为 DL 模型的条件输入
- ARP 机制的通用性:预测变化量的思想可迁移到其他时序预测任务
局限与展望¶
- 时间分辨率仅 3 小时,更高时间分辨率(1 小时)未验证
- 扩散采样 8 次取平均的概率预测策略较粗糙
- 未验证对未来 TC 的实时预报能力
评分¶
- 新颖性: ⭐⭐⭐⭐ ARP + 多模态条件扩散在 TC 降水预报中的首次应用
- 实验充分度: ⭐⭐⭐⭐⭐ 消融全面,与 DL 和 NWP 方法均有系统对比
- 写作质量: ⭐⭐⭐⭐ 问题定义清晰,物理直觉好
- 价值: ⭐⭐⭐⭐⭐ 对气象 AI 有重要实际意义