Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions¶
会议: ICLR 2026
arXiv: 2603.00568
代码: 有
领域: 自监督学习 / 分子表征学习 / 图神经网络
关键词: molecular representation, dual-graph, bond modeling, GNN, property prediction
一句话总结¶
提出 DeMol 双图增强多尺度交互框架,通过并行的原子中心图和键中心图通道以及 Double-Helix Blocks 显式建模原子-原子、原子-键、键-键三类交互,在 PCQM4Mv2、OC20、QM9 等基准上取得 SOTA。
研究背景与动机¶
领域现状:分子表征学习主流方法基于 GNN,将分子建模为图(原子=节点,键=边),近期方法进一步利用 3D 几何信息(距离、角度)来增强预测。
现有痛点:现有方法是"原子中心"的,化学键只被当作原子间的成对交互。但键本身携带丰富信息(键级、长度、杂化态),且键与键之间存在非加性交互(如苯环的离域 π 电子系统、顺铂/反铂的构型差异直接决定药效)。
核心矛盾:单图模型无法同时充分编码原子的拓扑关系和键的几何关系(二面角、键角),导致预测精度受限。
本文目标 显式建模化学键信息及键间交互,构建原子-键双通道融合框架。
切入角度:信息论分析证明键中心图(line graph)包含原图不具备的额外结构信息(Proposition 1),双图表示严格保留更多互信息(Proposition 2)。
核心 idea:用双图(原子图+键图)并行编码分子,通过 Double-Helix Blocks 在多尺度上融合两个通道的信息,同时用共价半径正则确保几何一致性。
方法详解¶
整体框架¶
输入分子被表示为两个图:原子中心图 \(\mathcal{G}\)(原子为节点,键为边)和键中心图 \(\mathcal{L}(\mathcal{G})\)(键为节点,共享原子的键之间连边)。两个图分别通过各自的 Transformer 编码通道处理,中间通过 Double-Helix Blocks 进行跨通道信息交换,最终融合预测分子性质。
关键设计¶
-
原子中心通道:
- 功能:编码原子级特征和原子间关系
- 核心思路:使用结构编码(3D 距离的高斯基核 + 2D 最短路径距离)作为注意力偏置,通过 Transformer 自注意力更新原子嵌入
- 设计动机:捕获空间和拓扑信息,与现有方法兼容
-
键中心通道:
- 功能:显式编码键级特征和键间关系
- 核心思路:键成为节点,共享原子的键相连。创新性地引入扭转编码 \(\Phi_b^{tors}\),将键角 \(\theta_{ijk}\) 和二面角 \(\varphi_{ijkl}\) 通过高斯基核编码为注意力偏置
- 设计动机:键中心图是表示几何关系的天然域(Proposition 3)
-
Double-Helix Blocks:
- 功能:在原子和键通道之间双向交换信息
- 核心思路:使用双向交叉注意力模块,原子嵌入查询键嵌入及反向,在多尺度上进行融合
- 设计动机:Proposition 2 表明预测能力来自两个表示的有效融合
-
键预测正则化:
- 功能:基于共价半径约束确保几何一致性
- 核心思路:预测原子对之间是否成键,保证学到的结构表示与化学合理结构一致
损失函数 / 训练策略¶
任务相关的主损失(如 MAE 回归损失)+ 共价半径键预测正则项 + 结构感知掩码提高效率。
实验关键数据¶
主实验:PCQM4Mv2¶
| 模型 | 参数量 | MAE↓ |
|---|---|---|
| GPS++ | 44.3M | 0.0778 |
| Transformer-M | 69M | 0.0772 |
| Unimol+ | 77M | 0.0693 |
| TGT-At | 203M | 0.0671 |
| DeMol | 186M | 0.0603 |
OC20 IS2RE 验证集¶
| 模型 | 平均能量MAE(eV)↓ | 平均EwT(%)↑ |
|---|---|---|
| Unimol+ | 0.4088 | 8.61 |
| TGT-At | 0.4030 | 8.82 |
| DeMol | 0.3879 | 9.23 |
消融实验¶
| 配置 | 说明 |
|---|---|
| 仅原子通道 | 性能降低,缺失键信息 |
| 无Double-Helix | 性能降低,通道间无融合 |
| 无扭转编码 | 性能降低,缺失键角/二面角 |
| Full DeMol | 0.0603,完整模型最优 |
关键发现¶
- 比上一个 SOTA(TGT-At)提升 10.1%,且使用单模型而非集成
- 在 OC20 IS2RE 的 OOD 场景中表现稳定,泛化能力强
- 键中心通道中的扭转编码贡献显著
亮点与洞察¶
- 信息论分析为双图设计提供严格理论支撑:4个 Proposition 从不同角度论证
- 顺铂/反铂的例子极为直观——相同原子组成、不同键构型、药效天差地别
- Double-Helix Blocks 可迁移到其他多视图融合场景
局限与展望¶
- 模型参数量较大(186M),训练成本高
- 主要在小分子/材料上验证,大分子适用性待探索
- 信息论分析是必要条件,不保证网络充分利用
相关工作与启发¶
- vs Transformer-M: 只在原子图上集成 3D 距离编码,DeMol 额外引入键中心通道
- vs ALIGNN: 用 line graph 做消息传递但没有原子-键交叉注意力
- vs GemNet: 编码二面角但仍在原子空间操作
评分¶
- 新颖性: ⭐⭐⭐⭐ 双图+信息论动机+Double-Helix融合是新颖组合
- 实验充分度: ⭐⭐⭐⭐⭐ 覆盖4个主流基准,全面SOTA
- 写作质量: ⭐⭐⭐⭐ 理论分析扎实,示例直观
- 价值: ⭐⭐⭐⭐ 对分子表征学习有重要推动