Station2Radar: Query-Conditioned Gaussian Splatting for Precipitation Field¶
会议: ICLR 2026
arXiv: 2603.00418
代码: 无
领域: 3D视觉 / 气象遥感
关键词: 高斯溅射, 降水场重建, 隐式神经表示, 卫星-站点融合, 分辨率无关渲染
一句话总结¶
提出 Query-Conditioned Gaussian Splatting (QCGS),首次将 2D 高斯溅射引入降水场生成任务,融合卫星图像与自动气象站稀疏观测,实现无雷达条件下分辨率灵活的降水场重建,RMSE 较传统网格化产品提升超 50%。
研究背景与动机¶
领域现状:降水预报依赖异构数据源——天气雷达精度高但地理覆盖有限、维护成本高;气象站提供准确的点测量但极为稀疏;卫星提供高分辨率广域覆盖但无法直接反演降雨量。目前大多数深度学习降水预报方法(如 ConvLSTM、扩散模型)均以雷达作为主要输入。
现有痛点:雷达网络在全球大部分地区(尤其是发展中国家)不可用,导致以雷达为中心的方法适用范围有限。传统无雷达方案主要采用经典插值方法(Barnes、Kriging),通过固定高斯权重将站点观测扩展到网格上,但这些方法严重模糊降水边界、对站点密度高度敏感。卫星直接估计方法(如 Sat2Radar)存在系统偏差,且输出固定分辨率。
核心矛盾:降水场的精确重建需要同时具备:(1) 地面真值的锚定精度(仅站点具备),(2) 空间连续覆盖(仅卫星具备),(3) 分辨率灵活性(现有方法均不具备)。这三者在已有框架中无法统一。
本文目标 如何在不依赖雷达的条件下,融合卫星图像和稀疏气象站观测,生成高分辨率、结构清晰的连续降水场?
切入角度:作者观察到经典高斯权重插值在数学形式上等价于 Gaussian Splatting 的特例——传统插值使用固定各向同性核,而 GS 允许可学习的各向异性核、自适应振幅和分辨率无关渲染。这一观察将气象学的经典方法与计算机视觉的新技术桥接起来。
核心 idea:将 2D 高斯溅射与隐式神经表示结合,以卫星特征为条件预测自适应高斯参数,仅在降水支撑区域选择性渲染,实现高效、分辨率灵活的降水场生成。
方法详解¶
整体框架¶
QCGS 是一个三阶段 pipeline:输入为卫星亮温图像(2km 分辨率)和稀疏 AWS 站点观测,输出为任意分辨率的连续降水场。(1) 雷达点提议网络融合卫星和 AWS 信息,生成粗降水代理场并识别降雨支撑位置;(2) 降水感知采样策略从代理场中选取查询点;(3) 基于 INR 的高斯参数估计器为每个查询点预测高斯溅射参数,最终通过可微分 2D 高斯渲染生成降水场。训练分两阶段——先训练点提议网络,再在固定提议上训练高斯渲染模块。
%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
SAT["卫星亮温图像<br/>(2km)"] --> PROP
AWS["稀疏 AWS<br/>站点观测"] --> PROP
PROP["雷达点提议网络<br/>ConvNeXt U-Net + GAT 交叉注意力"] --> PROXY["粗降水代理场<br/>+ 候选降雨位置"]
PROXY --> SAMP["降水感知采样策略<br/>梯度+均匀+重降水 凸组合"]
SAMP --> EST["INR 高斯参数估计器<br/>每点预测 σx,σy,ρ,α + AWS 锚定"]
EST --> RENDER["可微分 2D 高斯渲染"]
RENDER --> OUT["任意分辨率<br/>连续降水场"]
关键设计¶
1. 雷达点提议网络:用一张粗降水代理场圈出"哪里在下雨"
整条 pipeline 的第一步要解决的问题是:卫星看得广但只间接关联降雨,AWS 站点精确却稀疏,怎么把两者拼成一张能指出降雨位置的粗图。作者让卫星亮温图像走 ConvNeXt U-Net 编解码器提取空间密集特征,同时用一个图注意力网络(GAT,3 层 8 头)从不规则、带缺失值和异常值的 AWS 观测里提炼鲁棒表示 \(z^t\),再把这份站点表示通过交叉注意力注入 U-Net 解码器。网络输出一张粗降水场 \(\hat{R}^t\) 和一批候选降雨位置,供后续采样使用。GAT 的好处是天然能处理站点的不规则分布和噪声,交叉注意力则完成跨模态对齐——卫星管"哪里有空间结构",站点管"哪里真有雨、雨多大"。消融实验里加入 AWS 融合后 CSI 从 0.62 提升到 0.73,说明这一步是整套方法贡献最大的来源。
2. 降水感知采样策略:把高斯核只撒在该撒的地方
标准 GS 会渲染整个图像平面,但降水场里绝大部分区域根本没雨,对它们逐点放高斯核是浪费。QCGS 改成只在粗代理场标出的降雨区域采查询点,并把采样概率写成三项的凸组合:梯度项 \(G\) 拉高降水边界附近的采样密度让边界更锐利,均匀项 \(U\) 保证整体覆盖不漏,重降水项 \(H\) 用带温度的 softmax 优先采强降水区。三项混合权重取 0.3/0.4/0.3,再叠一层非极大值抑制去掉冗余采样点。这一设计的出发点是轻雨很少成灾、强降水才是高影响事件,所以把计算预算倾斜到强降水和边界上更划算。消融里三项组合的 CSI(0.76)高于仅均匀采样(0.68)以及任意单项/两项组合,印证了这个偏置确实有效。
3. INR-based 高斯参数估计器:每个查询点配一颗可学习、可锚定的各向异性高斯
传统 GS 是逐图像优化参数,换个场景就得重训、无法泛化;这一模块改用条件化的隐式神经表示来摆脱这一限制。它以卫星的中间特征为条件,通过交叉注意力为每个查询点预测一组高斯参数 \(\{\sigma_x, \sigma_y, \rho, \alpha\}\)——前三个定义各向异性协方差矩阵(相比经典插值的固定各向同性核能贴合降水的方向性结构),\(\alpha\) 控制振幅。INR 网络是一个 5 层 MLP(隐层 128,正弦位置编码),因为参数预测建立在卫星条件特征上,模型能跨区域、跨季节泛化。关键的一笔是地面真值锚定:在有非零降水的 AWS 站点,直接把该点的 \(\alpha\) 设为站点观测值,相当于在已知点打入一个硬约束,从而避免纯卫星驱动方法(如 Sat2Radar)常见的系统偏差。预测出的高斯核最终经可微分 2D 渲染合成出任意分辨率的连续降水场。
损失函数 / 训练策略¶
总损失为重建误差加正则化:\(\mathcal{L} = \text{MSE}(\tilde{R}^t, R^t) + \lambda_\sigma \sum_n (\sigma_x^{(n)} + \sigma_y^{(n)}) + \lambda_\alpha \sum_n \alpha^{(n)}\)。协方差和振幅的正则项(\(\lambda_\sigma = 10^{-3}\), \(\lambda_\alpha = 10^{-4}\))防止高斯核过度扩展导致过度平滑。训练使用 Adam 优化器(lr \(10^{-4}\), cosine schedule),batch size 16,100 epochs,8×H200 GPU。
实验关键数据¶
主实验¶
| 方法 | 类型 | 分辨率 | RMSE↓ | CSI↑ | FSS↑ | CC↑ |
|---|---|---|---|---|---|---|
| Pix2PixHD | 深度学习 | 0.5km | 2.45 | 0.59 | 0.71 | 0.55 |
| NPM | 深度学习 | 0.5km | 1.95 | 0.59 | 0.78 | 0.68 |
| BBDM | 深度学习 | 0.5km | 1.68 | 0.64 | 0.84 | 0.75 |
| Kriging | 经典插值 | 2.0km | 2.43 | 0.50 | 0.69 | 0.45 |
| QCGS | 本文 | 0.5km | 1.23 | 0.74 | 0.91 | 0.90 |
| QCGS | 本文 | 2.0km | 1.00 | 0.76 | 0.96 | 0.93 |
在与全球业务产品的对比中,QCGS 在日累积降水上也大幅领先:RMSE 6.68 vs IMERG 14.08 / MSWEP 12.44,CC 0.95 vs 最高 0.78。
消融实验¶
| 配置 | CSI↑ | 说明 |
|---|---|---|
| U-Net (ConvNeXt) only | 0.62 | 纯卫星基线 |
| + AWS fusion | 0.73 | 站点融合贡献 +0.11 |
| + AWS fusion + GS (完整) | 0.76 | GS 渲染再提升 +0.03 |
| 仅均匀采样 | 0.68 | 缺少边界和强降水关注 |
| 三项混合采样 | 0.76 | 最优组合 |
| K=1000 点 | 0.69 | 点数不足 |
| K=6000 点 | 0.76 | 最佳性价比 |
| K=9000 点 | 0.77 | 边际收益递减 |
关键发现¶
- AWS 融合是最大贡献因子(CSI +0.11),证明稀疏但精确的地面观测对降水场重建至关重要
- 高斯溅射提供的分辨率灵活性使 2km 训练的模型在 0.5km 评估时仍优于在 0.5km 训练的深度学习基线
- 功率谱密度分析显示 QCGS 在各空间尺度上最接近雷达谱,而业务产品在高波数处丢失方差
亮点与洞察¶
- 经典气象插值与 Gaussian Splatting 的等价性观察非常巧妙——传统高斯权重插值是 GS 的固定各向同性特例,这一联系使 3DGS 社区的技术自然迁移到气象领域
- 选择性渲染设计优雅:只在降水区域放置高斯核,避免对占比极大的非降水区域做无用计算,实现了效率和精度的双赢
- AWS 锚定策略简单有效——在站点处直接设置振幅为观测值,相当于硬约束,确保生成场在已知点完全准确
局限与展望¶
- 依赖 AWS 站点数据——在站网稀疏的地区(如非洲、海洋)适用性受限,未来可探索纯卫星模式的退化方案
- 实验仅限韩国区域(480×480 网格),全球尺度扩展是开放挑战
- 点提议网络和高斯渲染模块分两阶段训练,端到端联合训练可能带来进一步提升
- 仅处理降水场"生成",未涉及时序预报;结合时序外推可构建完整的无雷达降水预报系统
相关工作与启发¶
- vs Sat2Radar (NPM):NPM 纯卫星驱动,固定分辨率输出;QCGS 多源融合 + 分辨率灵活,RMSE 降低 37%
- vs 经典插值 (Kriging):Kriging 使用固定核、各向同性,QCGS 学习自适应各向异性核,CSI 从 0.50 提升到 0.76
- vs 2D GS 图像方法 (GaussianImage):图像 GS 逐图优化无法泛化,QCGS 通过条件化 INR 实现跨场景泛化
- 这种将新兴 CV 技术(GS/INR)迁移到科学领域的范式值得关注,类似方法可应用于温度场、风场等其他地球物理变量
评分¶
- 新颖性: ⭐⭐⭐⭐ 首次将 2D GS 引入降水场生成,经典插值-GS 等价性的观察有创意
- 实验充分度: ⭐⭐⭐⭐ 跨尺度对比全面(快照/小时/日),消融扎实,含功率谱分析
- 写作质量: ⭐⭐⭐⭐ 动机推导清晰,数学符号统一,图表质量高
- 价值: ⭐⭐⭐⭐ 打开了无雷达降水监测的新范式,但区域限制降低了直接影响力