DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics¶
会议: ICLR 2026
arXiv: 2603.09668
代码: 无(论文提及项目页面)
领域: 3D 视觉 / 物理仿真
关键词: physics-informed, differentiable simulation, wind modeling, 3D Gaussian Splatting, Material Point Method
一句话总结¶
提出 DiffWind,一个物理约束的可微分框架,通过将风建模为网格物理场、物体表示为 3D Gaussian Splatting 粒子系统、用 Material Point Method(MPM)建模风-物交互,并引入 Lattice Boltzmann Method(LBM)作为物理约束,实现了从视频中联合重建风力场和物体运动,并支持新风条件下的前向仿真和风力迁移等应用,在自建的 WD-Objects 数据集上显著超越已有动态场景建模方法。
研究背景与动机¶
领域现状:从视频观测中建模物体动力学已有大量工作,如基于 NeRF 和 3D Gaussian Splatting(3DGS)的动态场景重建。然而,这些方法主要关注物体自身运动或简单交互,对于由外部不可见力(如风力)驱动的复杂变形建模,研究仍然非常有限。
现有痛点: - 风不可见:风力不像碰撞力那样有明确的接触点,它在空间中连续分布且随时间变化,无法直接从视频中观测 - 时空变异性:风力场在空间和时间上都是变化的——同一场景中不同位置的风速/风向可能不同,且随时间演化 - 复杂变形:风驱动的物体(如旗帜、树叶、布料)会产生复杂的非刚体变形,难以用简单的运动模型描述 - 现有动态场景重建方法(如 Dynamic 3DGS)只拟合外观变化,不建模底层物理力,因此无法泛化到新的风条件或进行前向仿真
核心矛盾:要从视频中恢复风驱动的物体动力学,必须同时估计不可见的风力场和物体的物理响应——这是一个高度欠约束的逆问题。仅靠数据拟合(如 3DGS)虽能重建外观,但无法捕获底层物理规律,因此无法进行仿真和泛化。
本文目标:提出一个统一的框架,从视频中恢复风力场和物体运动,同时保证物理有效性,并支持前向仿真、风力迁移等下游应用。
切入角度:将物理仿真基元(粒子系统 + MPM)与神经渲染(3DGS + 可微渲染)结合,用可微分管线从视频反向优化风力场;同时用 LBM 流体动力学约束确保恢复的风场满足物理定律。
核心 idea:可微渲染提供外观监督 + MPM 提供物理动力学建模 + LBM 提供流体物理约束 = 从视频中物理一致地重建风-物交互。
方法详解¶
整体框架¶
DiffWind 要解决一个高度欠约束的逆问题:从一段拍到风吹物体的稀疏视角视频里,同时反推看不见、测不到的时空风力场和物体的物理响应。它的核心思路是按"各取所长"的方式分别表征两种介质——物体是发生局部变形的固体/半固体,用 3D Gaussian Splatting(3DGS)导出的拉格朗日粒子来表示;风是连续流动的流体,用欧拉网格上的速度/力场来表示——再用 Material Point Method(MPM)把网格上的风力施加到粒子上,算出每一帧的形变。整条前向链路(风场 → MPM 仿真 → 粒子变形 → 3DGS 渲染)全程可微,于是像素级的光度损失能一路反传到风场和物体材质参数上;与此同时再挂一个 Lattice Boltzmann Method(LBM)流体模拟,在每个时间步给风场方向引导,把优化往满足流体动力学的方向逼。最终输出物体的 4D 重建与运动、时空风力场,以及一个能换风条件继续做前向仿真、甚至把风迁移到新物体上的物理模型。
%%{init: {'flowchart': {'rankSpacing': 26, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
V["稀疏视角视频<br/>(风驱动物体)"] --> REP["粒子-网格耦合表征<br/>物体=拉格朗日粒子 / 风=欧拉网格场"]
REP --> OBJ["物体建模与物理属性推断<br/>3DGS+正则 → 补内部点 → MLLM 推材料参数"]
REP --> W["风力场<br/>(待优化网格速度场)"]
OBJ --> MPM["可微 MPM 风-物交互<br/>网格风力 → P2G/G2P → 粒子变形"]
W --> MPM
MPM --> RND["3DGS 可微渲染<br/>逐帧逐视角成图"]
RND -->|"光度损失 vs 视频帧"| OPT["可微逆向重建 + LBM 物理约束<br/>反传更新风场 / 物理参数"]
LBM["LBM 流体模拟<br/>方向引导"] -.物理约束.-> OPT
OPT -->|"梯度回传更新风场"| W
OPT --> OUT["4D 重建 + 风场<br/>+ 前向仿真 / 风力迁移"]
关键设计¶
1. 粒子-网格耦合表征:物体走拉格朗日粒子、风走欧拉网格
从视频里联合恢复"风"和"物",难点之一是这两种介质性质完全相反,强行塞进同一种表征会处处别扭。DiffWind 顺着物理直觉把它们拆开:物体只发生局部变形,用 3DGS 导出的拉格朗日粒子表示,每个粒子携带外观、材料与运动属性;风是连续流动、速度/压力随时空演化的流体,天然定义在欧拉网格上,于是建成一个格点存密度、速度、力的网格场。两者靠 MPM 耦合——风场格点正好和 MPM 求解动量方程的背景网格对齐,风力可以直接施加上去。这种"粒子-网格耦合"既让固体形变和流体演化各自用最合适的离散方式,又因为渲染和仿真共用同一套粒子,使外观监督的梯度能无缝流到物理状态,省掉了"先重建 NeRF 再网格化"那种异构表征间的来回转换。
2. 物体建模与物理属性推断:把 3DGS 变成带材料参数的可仿真粒子
要把"只能画图"的高斯当成能仿真的物理粒子,光重建外观还不够。一方面 vanilla 3DGS 在大变形下会冒出针状伪影、漂浮物,弱纹理处还会留空洞;另一方面质量、弹性这些 MPM 必需的物理量根本无法从静态图像直接读出。DiffWind 在静态帧上优化 3DGS 时加两个正则:各向异性损失 \(L_{aniso}\) 约束高斯核的长宽比、压住针状伪影,不透明度损失 \(L_o\) 逼每个高斯的不透明度趋近 0 或 1、让点贴到物体表面,并剪掉低不透明度点;再用 Kaolin 的八叉树体素填充补出物体内部看不见的点,给变形足够的几何支撑。物理参数则交给一个"物理 agent":先用对比学习训一个 3D 一致的特征场做 3D 区域分割,再让多模态大模型(MLLM)针对每个区域推断材料名、密度、泊松比 \(\nu_p\) 和杨氏模量 \(E\)。这样每个粒子才同时拥有可微渲染要的外观和 MPM 要的材料属性。
物理 agent 与 3D 区域分割的具体实现见原文附录。⚠️ 以原文为准
3. 可微 MPM 风-物交互:把网格风力翻译成粒子变形
有了粒子和风场,还缺一个能把"风吹"算成"物动"、并且可微的物理引擎。DiffWind 选 MPM 这种混合 Lagrangian-Eulerian 方法:把每个高斯核及填充出的内部点都绑定到一个 MPM 粒子上,逐时间步做四件事——先把粒子的质量、速度投影到网格(P2G),在网格上叠加材料内力与来自风场的外力、更新网格速度,再把速度插值回粒子(G2P)推进其位置;同时按 PhysGaussian 的方式更新高斯协方差 \(\Sigma_p(t)=F_p(t)\,\Sigma_p\,F_p(t)^{T}\)(\(F_p\) 为该粒子的变形梯度),让渲染外观随形变同步走样。MPM 天生擅长处理大变形,且整条求解链路可微,因此"风场如何影响最终形变"的梯度能被精确回传,这是后面能仅凭视频反推风场的前提。
4. 可微逆向重建 + LBM 物理约束:仅凭视频反推风场并锁定物理合理解
风场是一组自由变量,如果只用光度损失去拟合,优化器完全可能找到一个"画面对上了、物理却不合理"的风场(违反质量/动量守恒、风速突变)。DiffWind 把单步仿真写成可微算子 \(S(\cdot)\)、渲染写成可微的 \(R_{render}(\cdot)\),前向得到每帧每视角的图像,再最小化渲染图与视频帧之间的光度损失 \(L_{render}\);梯度经可微渲染、再经可微 MPM 一路回传到风场和物理参数,从而把看不见的风场学出来。在这条回路之上,再用 LBM(具体用 HOME-LBM)模拟流体:LBM 求解离散化的 Boltzmann 方程、宏观上恢复 Navier-Stokes,DiffWind 让它在每个时间步给风场提供方向引导(directional guidance),约束风场符合流体动力学规律。相比直接硬解 Navier-Stokes,LBM 这种软引导不钉死风场每一处取值,而是缩小解空间、把优化推向物理可行的方向,于是学到的风场既匹配视频又站得住物理。
损失函数 / 训练策略¶
训练分两阶段。静态阶段先在静态帧上优化 3DGS,损失为 \(L_{static}=L_{color}+\lambda_a L_{aniso}+\lambda_o L_o\),其中 \(L_{color}\) 是 3DGS 标准颜色损失,\(L_{aniso}\)、\(L_o\) 分别压制针状伪影、把点贴到表面,得到干净几何与外观,并据此补内部点、推物理参数。动态阶段在序列上联合优化风场与物体变形:以光度损失 \(L_{render}\)(L1 + SSIM 风格)作外观侧主监督,LBM 在每个时间步给的方向引导作物理侧约束;风场参数与物体物理参数(如弹性系数)在同一回路里同步更新。
实验关键数据¶
数据集:WD-Objects¶
论文引入 WD-Objects 数据集,包含: - 合成场景:在物理仿真器中生成的风驱动物体运动(旗帜、布料、树叶等),有精确的风场 ground truth - 真实场景:从现实世界录制的风驱动物体视频 - 合成数据用于定量评估(有 ground truth),真实数据用于定性评估
主实验¶
| 任务 | 指标 | DiffWind | 之前 SOTA | 提升 |
|---|---|---|---|---|
| 动态重建(合成) | PSNR↑ | 显著领先 | Dynamic 3DGS 等 | 大幅度 |
| 动态重建(合成) | SSIM↑ | 显著领先 | Dynamic 3DGS 等 | 大幅度 |
| 动态重建(合成) | LPIPS↓ | 显著领先 | Dynamic 3DGS 等 | 大幅度 |
| 风场估计(合成) | 风速误差 | 物理合理 | 无可比基线 | — |
| 前向仿真 | 视觉质量 | 高保真 | 不支持 | — |
对比方法包括 Dynamic 3DGS、PhysGaussian 等动态场景建模方法。DiffWind 在重建精度和仿真保真度上均显著超越。
消融实验¶
| 配置 | 关键指标 | 说明 |
|---|---|---|
| 去除 LBM 约束 | 风场物理合理性下降 | 无物理约束时风场可能不满足流体动力学 |
| 去除 MPM(纯外观拟合) | 无法仿真 | 退化为纯 3DGS 重建,丢失物理语义 |
| 不同物体材质 | 均有效 | 验证了框架对布料、薄板、树叶等不同材质的通用性 |
| 不同风速/风向 | 均可恢复 | 验证了风场优化对不同风条件的适应性 |
关键发现¶
- DiffWind 显著优于纯数据驱动的动态场景重建方法:物理约束不仅提升了重建质量,还赋予了模型仿真和泛化能力
- LBM 约束至关重要:去除 LBM 后,优化出的风场虽然能匹配视频,但在物理上不合理(如突变的风速分布)
- 前向仿真是独特优势:重建完成后,可以改变风条件(方向、强度)进行前向仿真,生成新的物体运动序列——这是纯数据方法完全无法实现的
- 风力迁移(Wind Retargeting):可以将从一个场景中恢复的风场应用到另一个物体上,生成物理合理的新动画
亮点与洞察¶
- 从不可见力中恢复物理:风力是典型的"不可见力"——无法直接观测,只能通过其对物体的效果间接推断。DiffWind 巧妙地通过可微分链条(视频 → 渲染 → 仿真 → 风场)实现了这一推断
- 物理仿真与神经渲染的优雅统一:3DGS粒子同时作为渲染原语和仿真原语,MPM 网格同时承载风场和物理计算,避免了异构表示间的转换开销
- LBM 作为"物理正则化器":不是直接求解 Navier-Stokes,而是用 LBM 的离散形式作为软约束引导优化,这比硬约束更灵活,同时保证了物理趋势的合理性
- 超越重建的应用潜力:前向仿真和风力迁移使其不仅是"分析工具",更是"创作工具"——可以用于影视特效、虚拟现实中的风效果模拟
- 开创性的问题定义:在 3D 视觉社区中首次系统性地研究"从视频中恢复风-物交互"这一问题,并提供了完整的数据集和 benchmark
局限与展望¶
- 计算开销:MPM 仿真 + 可微渲染的联合优化计算量大,优化单个场景可能需要较长时间
- 单一流体类型:当前只建模风力(空气流体),未考虑水流、沙流等其他流体驱动的物体动力学
- 物体拓扑限制:MPM 虽然能处理大变形,但对撕裂、断裂等拓扑变化的支持有限
- 真实场景的评估困难:真实视频没有风场 ground truth,只能做定性评估。未来可结合风速传感器数据进行验证
- 多物体交互:当前框架主要处理单个物体与风的交互,多物体间的遮挡和碰撞未充分考虑
- 风场初始化:优化过程对风场初始化可能敏感,需要合理的初始猜测以避免局部最优
相关工作与启发¶
- 可微物理仿真:DiffTaichi、Warp 等可微仿真框架为本工作提供了基础。DiffWind 将可微仿真与神经渲染结合用于逆问题求解
- 3D Gaussian Splatting:原始 3DGS 用于静态场景,Dynamic 3DGS 扩展到动态场景但缺乏物理建模。PhysGaussian 引入了物理但未涉及风力
- 流固耦合(FSI):工程领域的经典问题,但传统 FSI 需要已知的边界条件。DiffWind 从视频中推断边界条件(风场),是逆 FSI 问题
- 启发:可微物理 + 可微渲染的组合范式可以推广到其他不可见力的恢复,如磁场驱动、声波驱动等
评分¶
- 新颖性: ⭐⭐⭐⭐⭐
- 实验充分度: ⭐⭐⭐⭐
- 写作质量: ⭐⭐⭐⭐
- 价值: ⭐⭐⭐⭐⭐