跳转至

Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions

会议: ICLR 2026
arXiv: 2603.00568
代码: 有
领域: 自监督学习 / 分子表征学习 / 图神经网络
关键词: molecular representation, dual-graph, bond modeling, GNN, property prediction

一句话总结

提出 DeMol 双图增强多尺度交互框架,通过并行的原子中心图和键中心图通道以及 Double-Helix Blocks 显式建模原子-原子、原子-键、键-键三类交互,在 PCQM4Mv2、OC20、QM9 等基准上取得 SOTA。

研究背景与动机

领域现状:分子表征学习主流方法基于 GNN,将分子建模为图(原子=节点,键=边),近期方法进一步利用 3D 几何信息(距离、角度)来增强预测。

现有痛点:现有方法是"原子中心"的,化学键只被当作原子间的成对交互。但键本身携带丰富信息(键级、长度、杂化态),且键与键之间存在非加性交互(如苯环的离域 π 电子系统、顺铂/反铂的构型差异直接决定药效)。

核心矛盾:单图模型无法同时充分编码原子的拓扑关系和键的几何关系(二面角、键角),导致预测精度受限。

本文目标 显式建模化学键信息及键间交互,构建原子-键双通道融合框架。

切入角度:信息论分析证明键中心图(line graph)包含原图不具备的额外结构信息(Proposition 1),双图表示严格保留更多互信息(Proposition 2)。

核心 idea:用双图(原子图+键图)并行编码分子,通过 Double-Helix Blocks 在多尺度上融合两个通道的信息,同时用共价半径正则确保几何一致性。

方法详解

整体框架

输入分子被表示为两个图:原子中心图 \(\mathcal{G}\)(原子为节点,键为边)和键中心图 \(\mathcal{L}(\mathcal{G})\)(键为节点,共享原子的键之间连边)。两个图分别通过各自的 Transformer 编码通道处理,中间通过 Double-Helix Blocks 进行跨通道信息交换,最终融合预测分子性质。

关键设计

  1. 原子中心通道:

    • 功能:编码原子级特征和原子间关系
    • 核心思路:使用结构编码(3D 距离的高斯基核 + 2D 最短路径距离)作为注意力偏置,通过 Transformer 自注意力更新原子嵌入
    • 设计动机:捕获空间和拓扑信息,与现有方法兼容
  2. 键中心通道:

    • 功能:显式编码键级特征和键间关系
    • 核心思路:键成为节点,共享原子的键相连。创新性地引入扭转编码 \(\Phi_b^{tors}\),将键角 \(\theta_{ijk}\) 和二面角 \(\varphi_{ijkl}\) 通过高斯基核编码为注意力偏置
    • 设计动机:键中心图是表示几何关系的天然域(Proposition 3)
  3. Double-Helix Blocks:

    • 功能:在原子和键通道之间双向交换信息
    • 核心思路:使用双向交叉注意力模块,原子嵌入查询键嵌入及反向,在多尺度上进行融合
    • 设计动机:Proposition 2 表明预测能力来自两个表示的有效融合
  4. 键预测正则化:

    • 功能:基于共价半径约束确保几何一致性
    • 核心思路:预测原子对之间是否成键,保证学到的结构表示与化学合理结构一致

损失函数 / 训练策略

任务相关的主损失(如 MAE 回归损失)+ 共价半径键预测正则项 + 结构感知掩码提高效率。

实验关键数据

主实验:PCQM4Mv2

模型 参数量 MAE↓
GPS++ 44.3M 0.0778
Transformer-M 69M 0.0772
Unimol+ 77M 0.0693
TGT-At 203M 0.0671
DeMol 186M 0.0603

OC20 IS2RE 验证集

模型 平均能量MAE(eV)↓ 平均EwT(%)↑
Unimol+ 0.4088 8.61
TGT-At 0.4030 8.82
DeMol 0.3879 9.23

消融实验

配置 说明
仅原子通道 性能降低,缺失键信息
无Double-Helix 性能降低,通道间无融合
无扭转编码 性能降低,缺失键角/二面角
Full DeMol 0.0603,完整模型最优

关键发现

  • 比上一个 SOTA(TGT-At)提升 10.1%,且使用单模型而非集成
  • 在 OC20 IS2RE 的 OOD 场景中表现稳定,泛化能力强
  • 键中心通道中的扭转编码贡献显著

亮点与洞察

  • 信息论分析为双图设计提供严格理论支撑:4个 Proposition 从不同角度论证
  • 顺铂/反铂的例子极为直观——相同原子组成、不同键构型、药效天差地别
  • Double-Helix Blocks 可迁移到其他多视图融合场景

局限与展望

  • 模型参数量较大(186M),训练成本高
  • 主要在小分子/材料上验证,大分子适用性待探索
  • 信息论分析是必要条件,不保证网络充分利用

相关工作与启发

  • vs Transformer-M: 只在原子图上集成 3D 距离编码,DeMol 额外引入键中心通道
  • vs ALIGNN: 用 line graph 做消息传递但没有原子-键交叉注意力
  • vs GemNet: 编码二面角但仍在原子空间操作

评分

  • 新颖性: ⭐⭐⭐⭐ 双图+信息论动机+Double-Helix融合是新颖组合
  • 实验充分度: ⭐⭐⭐⭐⭐ 覆盖4个主流基准,全面SOTA
  • 写作质量: ⭐⭐⭐⭐ 理论分析扎实,示例直观
  • 价值: ⭐⭐⭐⭐ 对分子表征学习有重要推动