DGNO: Discontinuous Galerkin Neural Operator for Pathology Defocus Deblurring¶
会议: ICML 2026
arXiv: 2605.23282
代码: https://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur
领域: 医学图像 / 神经算子 / 图像复原
关键词: 病理图像去模糊, 神经算子, 不连续 Galerkin, 元素级局部算子, 界面通量
一句话总结¶
DGNO 把病理显微图像的散焦去模糊重新表述为"空间变化积分算子"的反问题,用不连续 Galerkin 风格把全局核拆成元素局部积分算子 + 界面数值通量,既保留神经算子的物理可解释性,又能处理病理图像本质上的局部不连续模糊;在 BBBC006w1 等数据集上超越 NAFNet / Restormer / MambaIRv2 等 SOTA。
研究背景与动机¶
领域现状:病理显微图像的散焦去模糊对下游细胞检测/分割(StarDist 等)至关重要。主流深度学习方法用 CNN(NAFNet / Cho 等)、Transformer(Restormer / MPT)、Mamba(MambaIRv2)做端到端学习。最近也有把神经算子(NO)用到低层视觉的工作(SRNO / DiffFNO)。
现有痛点:(1)CNN 隐含 shift-invariance,但病理散焦因深度变化、组织非均质、折射率不均、像差等是空间变化的,shift-invariant convolution 根本不对;(2)Transformer 全局注意力没物理意义,对模糊形成过程没显式建模;(3)Mamba 在 feature-sequence 层操作,仍非物理结构化;(4)现有 NO(FNO / SRNO)用全局参数化核,隐含光滑/平稳假设,对病理图像的局部不连续模糊(不同组织区域过渡处 PSF 跳变)也不合适。
核心矛盾:病理散焦在物理上对应空间变化积分算子 \(g(x,y) = \iint K(x,y;\xi,\eta) h(\xi,\eta)\,d\xi d\eta\),只有在 shift-invariance 时才能退化为卷积;现实中 PSF 既空间变化又局部不连续。但已有 NO 全局参数化核假设光滑——既要 NO 的物理一致性,又要承认局部不连续,是个开放问题。
本文目标:(1)首次把散焦去模糊形式化为 NO(function-to-function map);(2)设计能显式处理局部不连续模糊的 NO 架构;(3)保持全局连贯(避免分块伪影)的同时刻画局部异质性。
切入角度:偏微分方程数值解里有个成熟的"不连续 Galerkin (DG)"方法——把域分成不重叠元素,元素内独立解,元素间用界面数值通量耦合。这套思路天然适合局部不连续场,刚好和病理图像"局部稳定 + 区域间一致过渡"的特性匹配。
核心 idea:把全局积分核拆成 元素局部体积算子 + 界面数值通量,前者刻画空间局部异质,后者控制元素间信息交换避免过平滑;既保留 NO 的物理一致性,又获得 DG 的局部不连续建模能力。
方法详解¶
整体框架¶
DGNO 沿用 NO 通用结构:输入图像 \(a(x)\) → 逐点 lift 到隐式特征场 \(z_0 = P(a)\)(用 Mamba 编码器) → 经过 \(T\) 层 DG-style 算子层 → 逐点 project 输出锐利图像 \(u(x) = Q(z_T)\)。
每层算子:\(z_{t+1}(x) = \sigma(W z_t(x) + (\mathcal{K} z_t)(x))\),其中 \(\mathcal{K}\) 是非局部积分算子——本文核心创新就是把 \(\mathcal{K}\) 用 DG 方式参数化。
域被剖分成不重叠元素 \(\{E_e\}\)。\(\mathcal{K} = \mathcal{K}_{\text{vol}} + \mathcal{K}_{\text{flux}}\):元素内体积积分 + 元素界面数值通量。
关键设计¶
-
元素局部体积积分算子:
- 功能:在每个元素内独立学习局部积分核,刻画病理图像的局部异质模糊
- 核心思路:对元素 \(E_e\) 上的特征 \(z|_{E_e}\) 应用元素内体积积分 \((\mathcal{K}_{\text{vol}} z)(x) = \int_{E_e} k_e(x, y) z(y)\,dy\),每个元素的 \(k_e\) 独立学习;具体实现采用 Galerkin-type attention 在元素内部对 token 做自适应聚合
- 设计动机:全局 FNO 假设核空间平稳,对病理图像不同区域(细胞核 vs. 胞质 vs. 细胞外基质)的不同 PSF 失效;元素局部参数化让不同区域的核可以差异化学习
-
界面数值通量算子(含 P0DG 轻量近似):
- 功能:跨元素边界交换信息,避免分块伪影但又保持局部不连续
- 核心思路:在元素界面定义数值通量 \(\mathcal{K}_{\text{flux}}\) 耦合相邻元素。提供两种形式——(a)一般 face-based 通量:每个界面有独立可学习算子;(b)零阶 DG(P0DG):直接由元素体积算子推导界面耦合,参数更省。前者表达力强,后者轻量
- 设计动机:纯元素独立会有块状伪影、纯全局核又过平滑;DG 的"局部 + 通量"是数值解 PDE 时处理不连续场的标准范式,本文把它移植到神经算子的离散化方案;P0DG 让方法在资源受限场景仍可用
-
物理对齐的整体设计:
- 功能:保持神经算子的物理可解释性
- 核心思路:整个 DGNO 直接对应 Fourier optics 的 \(g(x,y) = \iint K(x,y;\xi,\eta) h(\xi,\eta)\,d\xi d\eta\) 的反问题求解;元素剖分对应病理图像的"piecewise structural heterogeneity"假设;元素局部 = 区域内 PSF 缓慢变化,界面通量 = 区域间过渡
- 设计动机:CNN/Transformer 都是 black-box;NO + DG 让每个模块都有清晰物理对应,便于诊断失败案例和后续物理改进(如引入显式 PSF 先验)
实验关键数据¶
主实验:BBBC006w1 病理散焦去模糊¶
| 方法 | PSNR↑ | SSIM↑ | 参数(M) | FLOPs(G) |
|---|---|---|---|---|
| NAFNet | 28.92 | 0.879 | 17.1 | 16 |
| Restormer | 29.47 | 0.886 | 26.1 | 141 |
| MPT | 29.78 | 0.891 | 14.7 | 23 |
| MambaIRv2 | 30.12 | 0.895 | 25.9 | 24 |
| SRNO (NO 基线) | 30.05 | 0.893 | 16.3 | 19 |
| DGNO | 30.86 | 0.907 | 15.8 | 18 |
DGNO 在 PSNR / SSIM 双指标上明显领先,参数和 FLOPs 与现有方法相当甚至更低。
元素剖分粒度消融¶
| 元素数 | PSNR | 备注 |
|---|---|---|
| 1(全局核,退化为 SRNO 变体) | 30.05 | 失去局部性 |
| 4 × 4 | 30.42 | 元素过大 |
| 8 × 8 | 30.86 | 最优 |
| 16 × 16 | 30.71 | 元素过小,通量开销大 |
| 32 × 32 | 30.34 | 过细,块状伪影 |
存在最优粒度,验证"局部 + 通量"的平衡。
界面通量 vs P0DG 消融¶
| 配置 | PSNR | 参数 |
|---|---|---|
| 一般界面通量 | 30.86 | 15.8M |
| P0DG(零阶近似) | 30.62 | 12.3M |
| 无通量(纯元素独立) | 29.97 | 14.2M(块状伪影) |
P0DG 在 ~22% 参数节省下保留多数性能;纯元素独立有可见块状伪影,证明通量必要。
关键发现¶
- 空间变化模糊是病理图像 SOTA 的关键短板:现有 shift-invariant 假设方法都被 DGNO 显著拉开差距
- 元素粒度有甜点:太大失去局部、太小通量开销大且引入伪影
- 通量必不可少:去掉通量虽能学但生成块状伪影;DG 数学结构在神经网络中也成立
- 物理对齐有副作用——可解释性:可视化每个元素的核能直观看到模糊变化方向(论文附录有 PSF 可视化)
亮点与洞察¶
- 首个把 DG 数值方法引入神经算子的工作:把数值偏微分方程领域成熟工具(DG)跨界引入 NO,处理本来 NO 处理不了的局部不连续场——典型的跨学科创新
- 物理 framing 是真正的差异点:与其他端到端方法相比,DGNO 把散焦明确表述为积分算子的反问题,使得设计选择(元素局部 + 通量)有物理依据可追溯
- 元素剖分给出"结构归纳偏置":CNN 的归纳偏置是平移不变 + 局部连通;DGNO 的归纳偏置是"piecewise stable + interface coupled",更贴合病理图像;这套偏置可推广到其他局部异质问题(遥感云雾、显微镜多模态融合)
- P0DG 提供了实用 vs. 性能的甜点:参数 −22% 性能仅 −0.24 PSNR,对实际部署友好
局限性 / 可改进方向¶
- 元素剖分是固定方格,对病理图像的自适应剖分(按组织边界)可能进一步提升
- 仅在 2D 病理切片上验证;3D 病理体(如 confocal stack)的 DGNO 扩展未尝试
- PSF 是隐式学习的,没显式估计;可考虑联合估计 PSF + 去模糊
- 未与传统两阶段方法(PSF 估计 + 非盲去卷积)做严格对比,物理 baseline 还可加强
- DG 是元素离散,未来可探索"高阶 DG"(hp-refinement)让不同元素用不同基函数
相关工作与启发¶
- vs CNN / Transformer / Mamba 去模糊:那些隐含 shift-invariance 或无物理结构;DGNO 显式建模空间变化积分算子
- vs FNO / SRNO(全局 NO):那些假设核光滑,不能处理局部不连续;DGNO 通过 DG 元素剖分获得局部表达
- vs DG 数值方法:DG 用在 PDE 数值解(流体、电磁),本文是其在神经算子里的首次系统应用
- 启发:把数值 PDE 离散化方案(FEM、DG、HHO 等)作为神经算子的归纳偏置库;这种"借用数学物理工具"的策略可推广到所有需要算子学习的场景
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 首个 DG-NO,把数值 PDE 离散方案引入 NO,处理局部不连续场是真新方向
- 实验充分度: ⭐⭐⭐⭐ 主实验 + 元素粒度消融 + 通量消融完整;缺少 3D 病理体验证
- 写作质量: ⭐⭐⭐⭐ 从物理 → 数学 → 神经网络的推导清晰;Fig 2 直观解释 DG 思路
- 价值: ⭐⭐⭐⭐ 病理图像质量直接影响下游诊断,去模糊是高价值任务;DG-NO 思路本身可推广