Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions¶

会议: ICLR 2026
arXiv: 2603.00568
代码: 有
领域: 自监督学习 / 分子表征学习 / 图神经网络
关键词: molecular representation, dual-graph, bond modeling, GNN, property prediction

一句话总结¶

提出 DeMol 双图增强多尺度交互框架，通过并行的原子中心图和键中心图通道以及 Double-Helix Blocks 显式建模原子-原子、原子-键、键-键三类交互，在 PCQM4Mv2、OC20、QM9 等基准上取得 SOTA。

研究背景与动机¶

领域现状：分子表征学习主流方法基于 GNN，将分子建模为图（原子=节点，键=边），近期方法进一步利用 3D 几何信息（距离、角度）来增强预测。

现有痛点：现有方法是"原子中心"的，化学键只被当作原子间的成对交互。但键本身携带丰富信息（键级、长度、杂化态），且键与键之间存在非加性交互（如苯环的离域 π 电子系统、顺铂/反铂的构型差异直接决定药效）。

核心矛盾：单图模型无法同时充分编码原子的拓扑关系和键的几何关系（二面角、键角），导致预测精度受限。

本文目标 显式建模化学键信息及键间交互，构建原子-键双通道融合框架。

切入角度：信息论分析证明键中心图（line graph）包含原图不具备的额外结构信息（Proposition 1），双图表示严格保留更多互信息（Proposition 2）。

核心 idea：用双图（原子图+键图）并行编码分子，通过 Double-Helix Blocks 在多尺度上融合两个通道的信息，同时用共价半径正则确保几何一致性。

方法详解¶

整体框架¶

输入分子被表示为两个图：原子中心图 \(\mathcal{G}\)（原子为节点，键为边）和键中心图 \(\mathcal{L}(\mathcal{G})\)（键为节点，共享原子的键之间连边）。两个图分别通过各自的 Transformer 编码通道处理，中间通过 Double-Helix Blocks 进行跨通道信息交换，最终融合预测分子性质。

关键设计¶

原子中心通道:
- 功能：编码原子级特征和原子间关系
- 核心思路：使用结构编码（3D 距离的高斯基核 + 2D 最短路径距离）作为注意力偏置，通过 Transformer 自注意力更新原子嵌入
- 设计动机：捕获空间和拓扑信息，与现有方法兼容
键中心通道:
- 功能：显式编码键级特征和键间关系
- 核心思路：键成为节点，共享原子的键相连。创新性地引入扭转编码 \(\Phi_b^{tors}\)，将键角 \(\theta_{ijk}\) 和二面角 \(\varphi_{ijkl}\) 通过高斯基核编码为注意力偏置
- 设计动机：键中心图是表示几何关系的天然域（Proposition 3）
Double-Helix Blocks:
- 功能：在原子和键通道之间双向交换信息
- 核心思路：使用双向交叉注意力模块，原子嵌入查询键嵌入及反向，在多尺度上进行融合
- 设计动机：Proposition 2 表明预测能力来自两个表示的有效融合
键预测正则化:
- 功能：基于共价半径约束确保几何一致性
- 核心思路：预测原子对之间是否成键，保证学到的结构表示与化学合理结构一致

损失函数 / 训练策略¶

任务相关的主损失（如 MAE 回归损失）+ 共价半径键预测正则项 + 结构感知掩码提高效率。

实验关键数据¶

主实验：PCQM4Mv2¶

模型	参数量	MAE↓
GPS++	44.3M	0.0778
Transformer-M	69M	0.0772
Unimol+	77M	0.0693
TGT-At	203M	0.0671
DeMol	186M	0.0603

OC20 IS2RE 验证集¶

模型	平均能量MAE(eV)↓	平均EwT(%)↑
Unimol+	0.4088	8.61
TGT-At	0.4030	8.82
DeMol	0.3879	9.23

消融实验¶

配置	说明
仅原子通道	性能降低，缺失键信息
无Double-Helix	性能降低，通道间无融合
无扭转编码	性能降低，缺失键角/二面角
Full DeMol	0.0603，完整模型最优

关键发现¶

比上一个 SOTA（TGT-At）提升 10.1%，且使用单模型而非集成
在 OC20 IS2RE 的 OOD 场景中表现稳定，泛化能力强
键中心通道中的扭转编码贡献显著

亮点与洞察¶

信息论分析为双图设计提供严格理论支撑：4个 Proposition 从不同角度论证
顺铂/反铂的例子极为直观——相同原子组成、不同键构型、药效天差地别
Double-Helix Blocks 可迁移到其他多视图融合场景

局限与展望¶

模型参数量较大（186M），训练成本高
主要在小分子/材料上验证，大分子适用性待探索
信息论分析是必要条件，不保证网络充分利用

评分¶

新颖性: ⭐⭐⭐⭐ 双图+信息论动机+Double-Helix融合是新颖组合
实验充分度: ⭐⭐⭐⭐⭐ 覆盖4个主流基准，全面SOTA
写作质量: ⭐⭐⭐⭐ 理论分析扎实，示例直观
价值: ⭐⭐⭐⭐ 对分子表征学习有重要推动