EqGINO: Equivariant Geometry-Informed Fourier Neural Operators for 3D PDEs¶
会议: ICML 2026
arXiv: 2606.03260
代码: 论文中说"available at this URL",未给出具体仓库
领域: 科学计算 / 神经算子 / 等变网络 / 3D PDE
关键词: Fourier Neural Operator, SE(3) Equivariance, Spectral Convolution, Orbit-based Weight Sharing, 3D PDE Surrogate
一句话总结¶
EqGINO 把 GINO 的 GNO 编码器、FNO 主干、GNO 解码器全部改造成 SE(3) 等变模块:GNO 用相对距离作为旋转不变核、FNO 用"轨道权重共享"在频域强制 \(W(R\mathbf k)=W(\mathbf k)\) 的各向同性,从而在保留 FNO 全局感受野的同时让 3D PDE surrogate 对任意刚性变换鲁棒,且把谱权重参数量从 \(\mathcal O(K^3)\) 降到 \(\mathcal O(K)\)。
研究背景与动机¶
领域现状:3D PDE 代理模型(汽车气动、车身结构受力、湍流仿真等)目前主流分两路:基于点云/网格的 GNN(PointNet++、MeshGraphNet、Transolver、GINO),以及基于谱方法的 FNO 系列。GINO(Li et al., 2023)是公认的强 baseline,因为它用 GNO 把不规则点云投影到规则网格后再用 FNO 做谱卷积,兼顾不规则几何和全局感受野。
现有痛点:物理定律本身在坐标变换下不变(Navier–Stokes 在旋转/平移下形式一致),但现有 SOTA 几乎全都依赖绝对 Cartesian 坐标作为输入特征。这会让模型过拟合到训练时的"规范朝向",一旦测试样本被旋转 90°、180° 或任意角度,性能急剧崩塌(论文 Table 1b:GINO 的 ShapeNetCar 压强 RMSE 从 0.166 飙到 0.563;DeepJEB 形变从 0.111 飙到 2.319)。
核心矛盾:等变性和全局感受野难以兼得。已有等变 GNN(EGNN、EMNN、T-EMNN)靠局部消息传递保证 SE(3) 等变,但局部感受野无法捕捉 PDE 必需的长程相互作用;FNO 在频域有天然全局感受野,但 3D 谱群卷积(如 G-FNO 的 2D 扩展)算力代价高到无法实用。
本文目标:(i)找到能在 3D 频域强制 SE(3) 等变的轻量机制;(ii)把它和不规则几何的 GNO 编码器无缝集成,得到端到端等变的 GINO 升级版;(iii)能处理标量场(如 von Mises 应力)和向量场(如形变 \(\mathbf u\in\mathbb R^3\))两类预测任务。
切入角度:作者注意到 Fourier 变换本身满足 \(\widehat{\mathcal T_R f}(\mathbf k)=\hat f(R^{-1}\mathbf k)\),即空间旋转在频域对应 Fourier 模的同步旋转(引理 4.1)。FNO 之所以打破等变,仅仅是因为可学习的谱权重 \(W(\mathbf k)\) 对每个 \(\mathbf k\) 都独立——只要强制 \(W(R\mathbf k)=W(\mathbf k)\),等变性就回来了。
核心 idea:强制谱权重沿"等模长轨道"共享——所有 \(\|\mathbf k\|_2\approx r\) 的频率模共用一个权重 \(w_r\),从而既保证旋转等变又把参数复杂度从 \(\mathcal O(K^3)\) 砍到 \(\mathcal O(K)\)。
方法详解¶
EqGINO 沿用 GINO 的三段式骨架——EqGNO 编码器把点云提升到规则网格;多层 EqFNO 在频域做等变全局卷积;EqGNO 解码器把网格特征投回点云预测物理量——但每一段都被重新设计成 SE(3) 等变。
整体框架¶
- 输入:不规则点云 \(\mathcal P=\{y_j\}\)(CFD 网格或汽车表面);每个点带稀疏物理特征但不含绝对坐标。
- EqGNO 编码器 \(\mathcal E\):对每个规则网格点 \(x^{grid}\),在半径 \(r\) 的局部球内做 Riemann 求和 \(v_0(x^{grid})\approx\sum_j\kappa(x^{grid},y_j)\mu_j\),核函数 \(\kappa\) 只取相对距离作为输入。
- EqFNO 层 \(\mathcal K_l\):\(L\) 层等变谱卷积,每层 \(\mathcal K_l(v_{l-1})=\sigma(S_l v_{l-1}+\mathcal F^{-1}[W(\mathbf k)\cdot\mathcal F v_{l-1}])\),权重 \(W\) 强制各向同性。
- EqGNO 解码器 \(\mathcal D\):对每个目标点 \(y^{out}\),在邻居规则网格点上做 kernel 积分,回投出物理量 \(u(y^{out})\)。
- 整体管线:\(G_\theta=\mathcal D\circ \mathcal K_L\circ\cdots\circ\mathcal K_1\circ\mathcal E\)。
- 输出:每个原始点上的物理场(标量如压强/von Mises 应力;向量如壁面剪切应力/形变)。
关键设计¶
-
旋转不变核的 EqGNO 编码 / 解码器:
- 功能:把不规则点云稳定地映射到规则网格(编码器),以及把网格特征稳定地映射回点云(解码器),保证整个映射对刚性变换等变。
- 核心思路:原版 GNO 用绝对坐标 \((x,y)\) 喂给核 MLP,旋转后这些数值都会变。EqGNO 改用纯标量距离:\(\kappa(x^{grid},y_j)=\phi_\theta(\|x^{grid}-y_j\|,\|x^{grid}-\bar y\|)\),第二项是到点云中心 \(\bar y\) 的距离用来注入全局径向上下文。解码器对偶地使用 \(\|y^{out}-x^{grid}_j\|\) 和 \(\|y^{out}-\overline{x^{grid}}\|\)。所有量都是 \(SE(3)\) 不变标量,因此核值在旋转/平移下完全相同。
- 设计动机:等变性的最简实现就是只让网络看不变量。完全去掉坐标输入会丢失全局位置信息,所以补一个"到中心的距离"作为弱位置编码,既保等变又不至于让所有点看起来一样。这是处理几何不规则性同时保等变性的关键基础设施。
-
EqFNO:轨道权重共享的各向同性谱卷积:
- 功能:在频域执行全局卷积,同时严格满足 \(SO(3)\) 等变;并大幅降低参数量以可承担 Full-FFT 的代价。
- 核心思路:定理推导显示,对标量场,谱卷积等变的充要条件是 \(W(R\mathbf k)=W(\mathbf k)\),即 \(W\) 只依赖 \(\|\mathbf k\|_2\)。作者据此引入Orbit-based Weight Sharing:把所有满足 \(\|\mathbf k\|_2\approx r\) 的频率模归为同一个轨道 \(\mathcal O_r\),共享单个可学权重 \(w_r\)。这把每层谱参数从 \(\mathcal O(K^3)\) 降到 \(\mathcal O(K)\)。同时强制使用 Full-FFT 而非 RFFT——因为 RFFT 的 Hermitian 共轭对称会在旋转下要求"反线性"操作,破坏复线性卷积。为弥补 Full-FFT 翻倍的 FLOPs,又给通道维加 block-diagonal 分组(\(G\) 组),通道混合开销变成 \(d_{out}d_{in}N/G\);\(G=2\) 时恰好抵消 Full-FFT 的额外计算量,\(G>2\) 时可把省下的预算翻成更高的谱分辨率 \(K\)。
- 设计动机:3D 谱群卷积(G-FNO 的 3D 扩展)参数和算力都不可承受;而 PDE 物理本就要求各向同性响应,所以"权重仅依赖频率模长"既是等变所需的最弱约束、也是符合物理先验的强归纳偏置;轨道共享 + Full-FFT + 通道分块这三者配合,使等变 FNO 第一次能在 3D 大规模运行。
-
SE(3) 等变局部基的向量场预测:
- 功能:让本质上"标量友好"的轨道共享框架也能预测 3D 向量场(如形变 \(\mathbf u\)、壁面剪切应力 \(\boldsymbol\tau\))。
- 核心思路:直接让网络输出向量的三个分量会违反等变(旋转输入应该旋转输出,而独立标量回归做不到这点)。作者把向量预测转写成"在 SE(3) 等变局部基 \(\{\mathbf e_1,\mathbf e_2,\mathbf e_3\}\) 上回归三个投影系数 \((\alpha,\beta,\gamma)\)",再线性重构 \(\mathbf v=\alpha\mathbf e_1+\beta\mathbf e_2+\gamma\mathbf e_3\)。三个系数都是 \(SE(3)\) 不变标量,所以可以直接用 EqFNO 输出;重构出的向量则随基一起旋转,从而保证整体等变。
- 设计动机:这是一种"几何重参数化",把向量任务降级成标量任务,让所有既有等变模块都能直接复用。不同数据集(AhmedBody/DeepJEB)局部基的具体构造方式不同,但思想统一,这种解耦让框架可推广到任意 3D 物理量。
损失函数 / 训练策略¶
任务都是回归(相对 \(L_2\) 误差)。论文设两种 EqGINO 配置:EqGINO*(\(G=2,K=32\),对齐 GINO 算力预算)与 EqGINO(\(G=4,K=40\),同参数量但更高谱分辨率)。
实验关键数据¶
主实验:In-Distribution + 零样本离散旋转泛化(Octahedral 群 \(O\))¶
3 个数据集 / 8 个物理量;relative \(L_2\) error,越低越好;"Canonical→Discrete" 测的是训练时不见任何旋转、测试时旋转 90° 倍数。
| 数据集 / 物理量 | GINO (Canon.) | Transolver (Canon.) | EqGINO (Canon.) | GINO (Rot.) | Transolver (Rot.) | EqGINO (Rot.) |
|---|---|---|---|---|---|---|
| AhmedBody / Wall Shear | 0.199 | 0.129 | 0.196 | 0.624 | 0.795 | 0.196 |
| AhmedBody / Pressure | 0.167 | 0.276 | 0.164 | 0.563 | 0.519 | 0.164 |
| ShapeNetCar / Pressure | 0.161 | 0.119 | 0.177 | 1.495 | 1.663 | 0.177 |
| DeepJEB / Deflection | 0.111 | 0.162 | 0.171 | 2.319 | 4.506(PointNet) | 0.171 |
| DeepJEB / von Mises Stress | 0.403 | 0.374 | 0.385 | 1.127 | 1.042 | 0.385 |
关键观察:非等变 baseline 在旋转测试集上误差被放大 3~20 倍,而 EqGINO 的"Canonical→Rotated"和"Canonical→Canonical"完全一致——这就是"by design"的等变带来的零损失泛化。
消融 / 连续旋转泛化(训练用连续 \(SE(3)\) 增广)¶
| 模型 | AhmedBody Press ↓ | ShapeNetCar Press ↓ | DeepJEB Deflection ↓ | DeepJEB Stress ↓ |
|---|---|---|---|---|
| GINO(非等变) | 0.211 | 0.181 | 0.158 | 0.420 |
| Transolver(非等变) | 0.422 | 0.335 | 0.217 | 0.366 |
| EGNN(等变 GNN) | 0.818 | 0.654 | 0.838 | 0.592 |
| T-EMNN(等变 GNN) | 0.620 | 0.180 | 0.305 | 0.424 |
| Transolver*(去坐标版本) | 0.642 | 0.927 | 0.401 | 0.512 |
| EqGINO | 0.185 | 0.156 | 0.162 | 0.367 |
关键发现¶
- "非等变 SOTA + 增广训练"远不如"等变 by design":GINO/Transolver 即使被强行喂连续旋转增广,AhmedBody Pressure 仍是 0.21/0.42 量级,而 EqGINO 直接 0.185,且训练时根本不需要增广。
- 局部消息传递的等变 GNN(EGNN/EMNN/T-EMNN)在连续旋转任务里依旧打不过 EqGINO,验证了"全局感受野是 PDE 的硬需求"——把等变性嫁接到谱方法上才是正解。
- Transolver*(剥去坐标的等变变体)相比 Transolver 大幅劣化,说明"用绝对坐标作弊"在等变路线下是行不通的;EqGINO 通过 EqGNO 中"到中心距离"这种弱位置编码就能维持表达力。
- 轨道共享把 3D 谱权重从 \(\mathcal O(K^3)\) 砍到 \(\mathcal O(K)\),配合 block-diagonal 通道分组,整体训练成本与 GINO 持平,性能反而更好或持平——说明这种结构先验既省参数又涨点。
亮点与洞察¶
- "等变性的最低代价就是各向同性"——作者把 SO(3) 等变约束直接化简成 \(W(\mathbf k)\) 只依赖 \(\|\mathbf k\|\),避开了昂贵的 3D 谱群卷积。这是个非常优雅的简化,启示在于:很多看似需要复杂群卷积的等变需求,可以通过"对偶域上的同向性"以极小代价实现。
- Full-FFT + 通道分组的算力配平很有工程趣味:RFFT 在等变下因 Hermitian 共轭破坏复线性而不可用,作者老老实实用 Full-FFT 并通过通道分块换回算力预算,这种"先满足正确性、再优化效率"的设计值得借鉴。
- 向量场 = 标量系数 + 等变局部基这个 reparameterization 思路通用性很强,可以迁移到任何想用标量等变骨干处理向量预测的场景(如 RL policy 的力向量输出、形变重建等)。
局限与展望¶
- 严格等变只保证到 Octahedral 群 \(O\)(即规则网格上的 90° 倍数旋转),对任意连续 \(SE(3)\) 只能近似——通过结构先验"很好地泛化",但不是 by design 的精确等变;高度对称性极强的物理系统可能仍需进一步处理。
- 数据集都是单时间步的稳态预测(外流、结构静载),未直接验证时序滚动;时间维上是否也能享受同样的鲁棒性需要后续工作。
- Orbit 的离散化(\(\|\mathbf k\|_2\approx r\) 的阈值划分)本身依赖网格分辨率 \(K\),低分辨率下轨道粒度粗会限制表达力;自适应 / 多尺度轨道是值得探索的方向。
- 局部基的构造按数据集手工设计,缺少统一的几何构造原则,移植到新任务时需要重新设计基底。
相关工作与启发¶
- vs GINO:相同骨架,但 EqGINO 把每个模块都改造为等变;在 canonical 测试上几乎打平,在旋转测试上拉开数量级差距。
- vs G-FNO(Helwig 2023):G-FNO 在 2D 用谱群卷积达到等变,但拓展到 3D 算力爆炸;EqGINO 用轨道共享替代群卷积,把 3D 等变 FNO 第一次做到可用。
- vs EGNN / EMNN / T-EMNN:那一类依赖局部消息传递,受限于感受野;EqGINO 用谱方法天然全局。
- vs Transolver:Transolver 强但严重依赖坐标特征;剥掉坐标的等变变体 Transolver* 性能崩塌——说明"算子学习要等变"这条路上 Transformer 路线还需要新的位置编码方案。
- vs EGNO(Xu 2024):EGNO 关注时间维的等变(轨迹预测),EqGINO 关注空间维的 SE(3) 等变,两条思路互补。