ICLR 2026 物理/科学计算神经微分方程求解器特征网格径向基函数插值高阶可微多分辨率网格 PINN

\(\partial^\infty\)-Grid: A Neural Differential Equation Solver with Differentiable Feature Grids¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=7G0L4cj452
代码/项目页: https://4dqv.mpi-inf.mpg.de/DInf-Grid/
领域: 物理信息机器学习 / 神经场 / PDE 求解
关键词: 神经微分方程求解器, 特征网格, 径向基函数插值, 高阶可微, 多分辨率网格, PINN

一句话总结¶

用无限可微的径向基函数（RBF）插值替换特征网格里常用的线性插值，让原本只为"拟合信号"设计的快速网格表示第一次能稳定地算出高阶导数，从而把求解 Poisson/Helmholtz/Kirchhoff-Love 等微分方程的训练时间从几小时压到几秒到几分钟（5–20× 加速），精度还与 Siren 相当。

研究背景与动机¶

领域现状：用神经网络替代传统数值求解器去解微分方程（PDE）已成为物理信息机器学习的主流，代表作是基于坐标 MLP 的 PINN 和正弦激活的 Siren。Siren 因为无限可微、能拟合高频信号，成了求解物理场的首选表示。

现有痛点：坐标 MLP 类方法（包括 Siren）对每个采样点都要反向传播经过整个网络，且完全忽略物理场的空间结构，导致训练极慢，有时需要数小时。视觉/图形领域为了加速早就转向了网格类表示（Instant-NGP、K-Planes），它们利用空间局部性，只更新查询点附近的少量特征，训练快上一个数量级。

核心矛盾：但这些快速网格表示依赖 d-线性插值——它在网格节点处只有 \(C^0\) 连续（不可导），网格内部也只到 \(C^1\)。一阶导在节点处不连续、二阶导处处为零（\(\nabla^2_x u = 0\)），ReLU 同理。这意味着它们根本算不出求解 PDE 所必需的雅可比和拉普拉斯量，从架构上就无法用作 DE 求解器。于是研究者被迫在"慢但能解 PDE 的 MLP"和"快但解不了 PDE 的网格"之间二选一。

本文目标：造一个既有特征网格的训练效率、又支持任意高阶导数的表示，用 PDE 残差作损失直接隐式训练，精确建模物理场。

核心 idea：用径向基函数插值替换线性插值。RBF（高斯核）在整个邻域上光滑且无限可微（\(C^\infty\)），导数可由自动微分解析计算；再叠加多分辨率共址网格让全局梯度快速传播以捕捉高频。这样网格表示首次具备了求解 DE 的高阶可微性。

方法详解¶

整体框架¶

\(\partial^\infty\)-Grid 是一个"编码-解码"框架：把输入域 \(\Omega\subset\mathbb{R}^d\)（\(d=2,3\)）离散成多分辨率特征网格 \(\{F_s\}\)，对查询坐标 \(x\) 用 RBF 插值从各尺度网格抽取光滑特征 \(f(x)\)，拼接后送入小解码器 \(d(\cdot;\Theta)\) 得到解场 \(u(x)=d(f(x;F);\Theta)\)。训练时不直接监督 \(u\)，而是把控制方程 \(F(x,u,\nabla_x u,\nabla^2_x u,\dots)=0\) 的残差当损失，对 \(x\) 自动微分算出各阶导数后优化网格 \(F\) 与解码器 \(\Theta\)。

flowchart LR
    A[查询坐标 x ∈ Ω] --> B[多分辨率特征网格 F0...FS-1]
    B --> C[RBF 插值 φ‖x-xi‖<br/>无限可微]
    C --> D[拼接多尺度特征 f x]
    D --> E[小解码器 d f;Θ<br/>tanh/线性]
    E --> F[解场 u x]
    F --> G[autograd 求 ∇xu, ∇²xu...]
    G --> H[PDE 残差损失 ∫Ω F . dx]
    H -.反传更新.-> B
    H -.反传更新.-> E

关键设计¶

1. 特征网格 + PDE 残差损失：把"解方程"变成"局部更新网格" 与坐标 MLP 每个采样点都得反传整个网络不同，本文把场参数化为 \(u(x)=d(f(x;F);\Theta)\)，其中特征 \(f(x)=\sum_{i\in\mathcal{N}(x)} w(x,x_i)F(x_i)\) 只由查询点周围若干网格节点的可学习特征加权得到，因此一次反传只更新邻域里那一小撮参数，天然利用了空间局部性、训练大幅加速。损失则直接写成 PDE 残差在域上的积分 \(L(F,\Theta)=\int_\Omega F(x,u,\nabla_x u,\nabla^2_x u,\dots;g(x))\,dx\)，实际用域内分层随机采样近似。该形式同时容纳强形式（Poisson）、带边界的变分形式（布料）与数据驱动项（SDF）。边界条件以硬约束注入：\(u(x)=d(f(x;F);\Theta)\,B(x)+h(x)\,(1-B(x))\)，其中 \(B(x)=1-e^{-\|x-x_{\partial\Omega}\|^2/\sigma}\) 是距离加权函数，保证 \(x\in\partial\Omega\) 时 \(u(x)=h(x)\)，从而提升收敛性与解的唯一性。

2. 径向基函数插值：用 \(C^\infty\) 权重换来高阶可微 这是全文最关键的一刀。线性插值权重 \(w(x,x_i)=\prod_{k=1}^d (1-|x_k-x_{ik}|/\sigma)\) 只到 \(C^0/C^1\)，二阶以上导数全为零，求不了 PDE。本文改用归一化高斯 RBF 权重 \(w(x,x_i)=\frac{\phi(\|x-x_i\|)}{\sum_{j\in\mathcal{N}(x)}\phi(\|x-x_j\|)}\)，核为 \(\phi(r)=e^{-(\varepsilon r)^2}\)，其中 \(\varepsilon\) 控制核宽。它在邻域上光滑且无限可微，雅可比、拉普拉斯都能由 autograd 解析得到，从而支持四阶 PDE（如 Euler–Bernoulli 梁、Kirchhoff–Love 板）这种连三次基都不够的强形式。\(\varepsilon\) 还提供了固定阶多项式做不到的"局部性 vs 精度"可调支撑。代价是高斯 RBF 全局支撑，朴素实现要遍历整张网格，内存与算力爆炸；为此本文配合分层采样预计算邻域索引：由 \(\varepsilon\) 决定权重非零的有效邻域 \(\mathcal{N}_\rho(x)\)（如 \(\varepsilon=2\) 只需 1-环，\(\varepsilon=1\) 需 2-环），并因采样点可能落在格子边界处额外多取一环，使 RBF 的开销逼近线性插值。

3. 多分辨率共址网格：让全局梯度跑得动 单分辨率网格的插值邻域很小，梯度信息要在大网格上一步步爬过整个域，收敛极慢。借鉴 Instant-NGP/K-Planes 的层级思路，本文设一组多尺度网格 \(F_s\in\mathbb{R}^{(N+1)^d\times F}\)，第 \(s\) 级分辨率 \(N=N_{\max}/2^s\)，各尺度 RBF 插值结果拼成 \(f(x)=(f_0(x),\dots,f_{S-1}(x))\in\mathbb{R}^{S\cdot F}\)。粗尺度负责把梯度迅速铺满全域、保证全局梯度流稳定，细尺度补高频细节，两者组合既高效又富表达力，无需自适应调整 RBF 形状就能稳定恢复复杂信号。

实验关键数据¶

覆盖 Poisson（图像重建）、Helmholtz（波场）、Kirchhoff-Love（布料仿真）、Eikonal（SDF）、平流/热方程等多类问题。

主实验表格¶

图像重建（Poisson，512×512，仅用梯度/拉普拉斯监督）：

模型	监督	PSNR ↑	训练时间 ↓	参数量
K-Planes	梯度	17.96	9.5 min	8.4m
K-Planes	拉普拉斯	—（失败）	—	—
Siren	梯度	32.12	10 min	330k
Siren	拉普拉斯	11.82	1h56min	1.32m
Ours	梯度	32.24	25s	703k
Ours	拉普拉斯	12.19	15 min	701k

梯度监督下相对 Siren 约 20× 加速且 PSNR 略高；线性插值的 K-Planes 在拉普拉斯监督下直接失败（二阶导为零）。Helmholtz（\(\omega=20\) 点源波场）相对 Siren 约 4× 加速且精度匹配闭式 Hankel 解，而 K-Planes/Instant-NGP 完全失效。布料仿真因存在多个平衡解、无唯一参考，故不纳入数值精度评测但能恢复真实褶皱。

消融实验表格¶

RBF 形状 \(\varepsilon\) 与邻域环数 \(\rho\)（768×768 梯度图像重建）：

形状 \(\varepsilon\)	环数 \(\rho\)	PSNR ↑	SSIM ↑	训练 ↓
0.6	4	28.74	0.87	15 min
1	4	28.74	0.87	17 min
1	3	28.73	0.87	12 min
1	2	28.82	0.86	12 min
1	1	27.50	0.82	15 min
2	1	17.72	0.74	6 min

关键发现¶

核宽是核心超参：小 \(\varepsilon\) + 大环更平滑准确但更贵；过窄核（\(\varepsilon=2,\rho=1\)）退化成线性插值，出现不连续伪影、PSNR 崩到 17.72。\(\varepsilon=1\) 配 2–3 环是稳定甜点。
多分辨率的价值：单分辨率网格让 Eikonal 损失局限在局部、产生伪影；多分辨率以极小参数开销实现全域梯度传播，PSNR 收敛显著更快。
可微性是分水岭：所有线性插值/ReLU 网格（K-Planes、Instant-NGP）在二阶及以上监督任务上系统性失败，印证了 RBF 替换的必要性。

亮点与洞察¶

一个最小但精准的改动撬动整类问题：把网格插值核从"线性"换成"\(C^\infty\) 的 RBF"，看似一行公式，却恰好补上了快速网格表示通往 PDE 求解的唯一短板，思路干净、动机清晰。
效率与可微性不再二选一：通过分层采样 + 邻域预计算，把本应全局支撑的高斯 RBF 压到接近线性插值的成本，同时保留无限可微，工程上的折中很关键。
统一接口：同一个可微网格不改架构就能干"直接拟合信号"和"从导数/PDE 反解场"两类活（图像、SDF、波场、布料），泛化面广。

局限与展望¶

维度灾难：网格本质上随维数指数膨胀，3D SDF 明显比 2D 慢；作者建议未来用平面投影策略缓解高维与流形上 PDE 的扩展性。
对 RBF 核宽敏感 + 平滑偏置：\(\varepsilon\) 选不好会引入过度平滑或伪影；且 RBF 在域边界存在 Runge 现象带来的边界误差。
缺理论保证：邻域截断下虽实验均收敛，但 \(C^\infty\) 的理论保证尚未建立。
未必胜过传统数值法：相对多重网格等成熟数值求解器不一定更高效，作者坦言只是初步对比；当前为 PyTorch 实现，定制 CUDA 核有望进一步加速。

评分¶

新颖性: ⭐⭐⭐⭐ — 把 RBF 插值引入多分辨率特征网格以支持高阶可微、专为 PDE 求解服务，是清晰且此前缺失的一块拼图；与 NeuRBF 的目标区分讲得也充分。
实验充分度: ⭐⭐⭐⭐ — 覆盖 Poisson/Helmholtz/Kirchhoff-Love/Eikonal/平流热方程多类 PDE，含 Siren、K-Planes、Instant-NGP、NeuRBF 多基线与核宽/多分辨率消融；但缺少 3D 高维与流形上的规模化验证。
写作质量: ⭐⭐⭐⭐ — 动机—矛盾—方案链条干净，图 2 框架与公式表述清晰，痛点（线性插值二阶导为零）讲得直观。
价值: ⭐⭐⭐⭐ — 把神经 DE 求解从小时级压到秒/分钟级且精度持平，对物理信息机器学习、图形仿真有实用价值，且代码以"即插即用"模型形式释出。