Beyond Ensembles: Simulating All-Atom Protein Dynamics in a Learned Latent Space¶

会议: ICLR2026
OpenReview: https://openreview.net/forum?id=AwowReRWXI
代码: 待确认
领域: 计算生物学 / 蛋白质动力学 / 生成模型
关键词: 潜空间模拟, 全原子蛋白质动力学, 自回归传播子, Koopman 算子, score-guided Langevin

一句话总结¶

本文在已训好的 LD-FPG 全原子潜空间里塞进一个时间传播子 GLDP，把"只会采静态构象系综"升级成"能模拟构象随时间演化"，并在同一冻结潜空间里公平对比了三类传播子（自回归神经网络、Koopman 线性算子、score-guided Langevin），结论是：自回归 NN 长轨迹最稳、骨架动力学最准；Langevin 侧链热力学最锐利；Koopman 是轻量但偏僵硬的可解释基线。

研究背景与动机¶

领域现状：研究蛋白质的慢速功能性运动（折叠、配体结合、变构开关）一直靠分子动力学（MD）模拟，但这些运动发生在崎岖的能量面上、由稀有事件主导，暴力 MD 算不动。一条越来越火的替代路线是"表征优先"：把模拟问题改写成 encoder–propagator–decoder 流水线——编码器把高维原子坐标压到低维连续潜空间，传播子在这个简化空间里推进状态，解码器再把潜轨迹映射回全原子坐标。

现有痛点：最近的生成模型 LD-FPG 证明了可以绕开"需要预先定义良好集体变量"这个老大难——它学着把静态平衡系综表示成相对参考结构的全原子形变，是个很强的"全原子系综生成器"。但 LD-FPG 只会采样"可能出现的构象"，完全不建模这些构象之间随时间的演化，也就是说它给的是一堆独立快照，没有动力学、没有动力学时间尺度。

核心矛盾：在潜空间里"推进状态"的那个传播子，本身就卡在一个三角权衡里——物理保真度、长时程稳定性、表达能力三者难以兼得。学界提出过 Koopman 线性算子、神经序列模型、score/扩散驱动的随机动力学等多种传播子，但它们各自用不同的编码器、不同的系统评测，谁强谁弱、强在哪一块，从来没在同一个潜空间里被干净地比较过。

本文目标：(1) 给 LD-FPG 补上"时间维度"，让它能真正模拟动力学而非只采系综；(2) 在一个受控设置下，把三类主流传播子放进同一个冻结潜空间公平 PK，搞清楚各自的甜区与失效模式。

切入角度：既然 LD-FPG 的编码-解码器已经把"局部几何合法性"（键长键角）这件事保证好了，那就把它整个冻住当固定坐标系，只替换中间的传播子——这样性能差异就完全归因于"传播规则"本身，而不是被编码器质量混淆。

核心 idea：冻结 LD-FPG 编解码器，在其潜空间里只换传播子，用"自回归 NN / Koopman / score-guided Langevin"三选一做受控对比，从而隔离出"用什么规则推进潜状态"对稳定性、系综保真度和动力学时间尺度的真实影响。

方法详解¶

整体框架¶

GLDP（Graph Latent Dynamics Propagator）的骨架沿用 LD-FPG 的 encoder–decoder，并在其中插入一个只在潜空间内工作的时间传播子。所有实验里编码器和解码器都被冻结，唯一变动的就是中间那个传播子。整条流水线严格走四步：

编码（Encoding）：一个 Chebyshev 图神经网络（ChebNet）把全原子坐标 \(X(t)\in\mathbb{R}^{N\times3}\) 映射成逐原子嵌入。
池化（Pooling）：一个确定性池化层把逐原子嵌入聚成单个紧凑潜向量 \(z(t)\in\mathbb{R}^d\)（\(d\ll 3N\)）。
传播（Propagation）：GLDP 用学到的转移函数把潜状态推进 \(z_t\to z_{t+1}\)，这一步是三类传播子的角逐场。
解码（Decoding）：冻结的解码器把演化后的 \(z_{t+1}\) 还原成全原子坐标 \(\hat X(t+1)\)。

潜时间更新写成统一形式 \(z_{t+1}=f(z_t)+\eta_t,\ \eta_t\sim\mathcal{N}(0,\sigma_\eta^2 I)\)，其中 \(f\) 是传播子、\(\eta_t\) 是可选的 rollout 噪声。训练对默认用单帧步长 \((z_t,z_{t+1})\)，潜向量按维度用训练集统计量标准化后再拟合传播子（解码前反标准化），初始状态 \(\hat z_0\) 取一帧留出的 MD 帧编码。之所以在潜空间而非 \(3N\) 维笛卡尔空间跑动力学，是因为高维空间里误差会快速累积、动辄破坏立体约束；而 LD-FPG 潜空间编码的是相对一个物理参考结构的形变，动力学天然被锚在合法构象盆地内，解码器负责把局部几何兜住，传播子就能专心学慢速集体运动。

%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
    A["全原子坐标 X(t)"] --> B["冻结骨架的受控对比<br/>ChebNet 编码 + 池化 → z(t)"]
    B --> C{"潜空间传播子<br/>三选一"}
    C -->|线性算子| D["Koopman 线性算子<br/>z_t+1 = A·z_t"]
    C -->|确定性非线性| E["自回归 NN 传播子<br/>z_t+1 = f_θ(z_t)"]
    C -->|随机动力学| F["score-guided Langevin<br/>潜空间 SDE"]
    D --> G["冻结解码器<br/>→ 全原子 X(t+Δt)"]
    E --> G
    F --> G

关键设计¶

1. 冻结骨架的受控对比：把编解码器钉死，只换传播子

本文最根本的方法学选择，是不去重训 LD-FPG，而是把它的 ChebNet 编码器和全原子解码器整个冻结，只在中间替换传播子。痛点在于：以往不同传播子工作各用各的潜空间和编码器，性能差异里混着"编码器好不好"的噪声，没法干净归因。冻结骨架后，重建质量被固定为常量，三类传播子面对完全相同的潜向量 \(z(t)\)、相同的解码通路，于是稳定性、系综保真度、动力学时间尺度上的任何差异都只能来自"传播规则"本身。它还有一个工程红利：解码器已经替你保证了键长键角等局部几何合法，传播子不必再操心物理约束，只需在一个被平滑过、没有高频噪声的能量面上学慢速集体运动。

2. Koopman 线性算子：用一个线性映射近似潜空间演化

Koopman 变体假设潜演化可以用一个时不变线性算子近似，\(z_{t+1}\approx A z_t,\ A\in\mathbb{R}^{d\times d}\)。\(A\) 通过动态模态分解（DMD）从数据估计：把潜轨迹排成两个错开一帧的快照矩阵 \(X=[z_0,\dots,z_{M-2}]\)、\(Y=[z_1,\dots,z_{M-1}]\)，解最小二乘 \(\min_A\|Y-AX\|_F^2\) 得到 \(A=YX^+\)（\(X^+\) 是 Moore–Penrose 伪逆）。为数值稳定，伪逆用 SVD 计算，并把 SVD 截断到较低秩 \(r\) 以滤掉噪声、聚焦最显著的动态模态。生成新轨迹时从 \(\hat z_0\) 自回归地反复作用 \(A\)，并加一点高斯 rollout 噪声 \(\eta_t\sim\mathcal{N}(0,\sigma_{koop}^2 I)\) 去匹配一步残差方差。它的价值是轻量、可解释（特征值直接对应动态模态），但线性假设过强，倾向于压低涨落、把能量面压窄。

3. 自回归神经网络传播子：直接学一个确定性非线性转移

这个传播子用神经网络直接参数化一个确定性非线性映射 \(z_{t+1}=f_\theta(z_t)\)，以一步预测目标训练：\(L(\theta)=\frac{1}{M-1}\sum_{t=0}^{M-2}\|f_\theta(z_t)-z_{t+1}\|^2\)。它不像 Koopman 那样被线性束缚，能拟合更复杂的转移；但纯一步训练在长 rollout 时误差会累积，作者用 dropout 和权重衰减来抑制。推理时从 \(\hat z_0\) 迭代 \(\hat z_{i+1}=f_\theta(\hat z_i)+\eta_i,\ \eta_i\sim\mathcal{N}(0,\sigma_{roll}^2 I)\)，其中 \(\sigma_{roll}\) 在验证集上选取，使其匹配 \(z_{t+1}-z_t\) 的一步潜残差方差。实验里它是综合最稳的传播子：长时程不崩、骨架二面角分布最准。

4. score-guided Langevin 传播子：用学到的平衡分布 score 驱动随机模拟

这个传播子分两阶段。阶段一训练一个时间条件去噪器 \(\epsilon_\theta(z_t,t)\)，在潜嵌入上用 DDPM 式的方差保持（VP）噪声调度，前向加噪 \(z_t=\sqrt{\bar\alpha_t}z_0+\sqrt{1-\bar\alpha_t}\epsilon\)。当网络学会预测噪声后，扰动数据的 score 为 \(s(z_t)=\nabla_z\log p_t(z_t)\approx-\epsilon_\theta(z_t,t)/\sqrt{1-\bar\alpha_t}\)；测试时查询极低噪声水平 \(t_{noise}\approx0\) 来逼近未扰动 score \(s(z)\)。阶段二用 Euler–Maruyama 积分一个过阻尼 Langevin SDE，把 score 当作漂移项：\(z_{t+1}=z_t+T\Delta t\,s(z_t)+\sqrt{2T\Delta t}\,\eta_t,\ \eta_t\sim\mathcal{N}(0,\sigma_\eta^2 I)\)。若 \(p(z)\propto\exp(-U(z)/T)\)，则 \(T s(z)=-\nabla U(z)\)，漂移恰好对应潜空间一个有效能量面的梯度，因此理论上 score 精确时其不变分布就是目标潜分布 \(p_Z\)。它的甜区是侧链：热力学一致的漂移加各向同性噪声特别擅长采样锐利、多峰的 rotamer 分布；代价是对 score 估计质量和积分步长敏感、轨迹间方差偏大。

三个传播子建模的目标对象略有差异：Langevin 瞄准潜空间一个不变密度为 \(p_Z\) 的正则分布，而 Koopman 和自回归 NN 近似的是在固定编码器下从 \((z_t,z_{t+1})\) 观测到的一步转移核 \(K(z_{t+1}\mid z_t)\)。由于潜空间只演化坐标 \(z\)、不含动量/控压，作者明确不声称严格 NVE 能量守恒或精确物理动力学，时间尺度的比较是诊断性的而非绝对标定。

损失函数 / 训练策略¶

自回归 NN：一步 MSE 损失 \(L(\theta)=\frac{1}{M-1}\sum\|f_\theta(z_t)-z_{t+1}\|^2\)，配 dropout + 权重衰减抑制长 rollout 误差累积。
Koopman：闭式最小二乘 \(A=YX^+\)，SVD 截断到秩 \(r\) 正则化，无梯度训练。
Langevin：DDPM 式 VP 去噪损失训 score 网络，温度 \(T\)、步长 \(\Delta t\)、采样步长 \(s\)、score clipping 等为关键超参（不同系统需单独标定，如 ADP 用 \(\Delta t=10^{-8}\)、A1AR 用 \(\Delta t=10^{-10}\)）。
所有传播子共享冻结的 LD-FPG 编解码器，潜向量按维度标准化后拟合、解码前反标准化。

实验关键数据¶

主实验¶

在 ADP（丙氨酸二肽）、7JFL（α-螺旋）、1R6W（混合拓扑 HIV-1 蛋白酶）、A1AR（GPCR）上，把 GLDP（用自回归 NN 传播子，记 GLDP-NN）对比 LSS、MD-Gen、GeoTDM。指标含二面角/坐标 JSD（越低越好）、接触相关性（越高越好）、TICA 慢时间尺度 \(t_1\) 与去相关时间 \(t_{decorr}\)（越接近真值越好）。

系统	模型	二面角 JSD (BB/SC)	坐标 JSD (BB/SC)	接触相关	TICA \(t_1\)
A1AR	Ground Truth	—	—	—	1058.85
A1AR	LSS	0.134 / 0.146	0.657 / 0.602	0.971	不稳定
A1AR	MD-Gen	0.033 / 0.088	0.106 / 0.117	0.941	85.4
A1AR	GLDP	0.019 / 0.067	0.063 / 0.087	0.985	650.2
1R6W	GLDP	0.045 / 0.092	0.220 / 0.185	0.972	980.1
1R6W	LSS	0.035 / 0.135	0.620 / 0.610	0.885	102.5

在最复杂的 A1AR 上 GLDP 全面领先：二面角与坐标 JSD 双双最低，接触相关 0.985 最高；LSS 的 TICA 出现负特征值（数值不稳定），而 GLDP 仍能恢复物理上合理的 \(t_1\approx650\) 步。在 1R6W 上 GLDP 侧链分歧最低（JSD 0.092 vs LSS 0.135），并恢复出 980 步的慢时间尺度与深记忆（\(t_{decorr}=1650\)）。GeoTDM 在 7JFL/1R6W/A1AR 上超出 H100 的 80GB 显存无法跑，凸显坐标空间扩散模型的可扩展性瓶颈。

消融实验¶

固定 GLDP 框架、只换传播子，比较二面角自由能面保真度（JSD，5 次独立运行均值，越低越好）：

传播子	ADP \((\phi,\psi)\)	A1AR \((\phi,\psi)\)	A1AR \((\chi_1,\chi_2)\)
Koopman	0.138 ± 0.015	0.043 ± 0.006	0.121 ± 0.012
自回归 NN	0.061 ± 0.003	0.019 ± 0.001	0.067 ± 0.002
Langevin	0.164 ± 0.021	0.052 ± 0.008	0.058 ± 0.009

长时程稳定性（失效定义：lDDT 相对初始帧首次 < 0.65 的帧号）：ADP 上自回归 NN 跑满 10000 帧不失效，Koopman 撑到 4443 帧，Langevin 仅 206 帧就崩（小系统上 score 估计噪声大、积分步长过激进）；A1AR 上 NN 同样跑满 10000 帧，Langevin 7476、Koopman 5740。

关键发现¶

骨架归 NN、侧链归 Langevin：自回归 NN 在骨架二面角上又准又稳（A1AR \((\phi,\psi)\) JSD 0.019、方差仅 ±0.001）；但侧链 rotamer 反转——Langevin 在 A1AR \((\chi_1,\chi_2)\) 上 JSD 0.058 最优，能采出最锐利的多峰 rotamer 带，代价是方差较大（±0.009）。
Koopman 偏僵硬：线性假设让它压低涨落、把自由能盆地压窄、抬高肩部，在 A2AR 活化面上难以覆盖连接非活化↔活化态的过渡走廊。
GPCR 活化面：在 A2AR 上（投影到 TM3–6、TM3–7 距离的二维自由能面）Langevin 覆盖过渡谷最完整，NN 落在谷中但足迹偏紧、欠采两翼，Koopman 只抓到中心盆地。非线性传播子（NN/Langevin）整体更能描出完整活化路径。

亮点与洞察¶

"冻结骨架 + 只换零件"的受控对比范式：把编解码器钉死当常量，是一种很干净的科学对照设计，让"传播规则"成为唯一自变量；这个思路可迁移到任何 encoder–propagator–decoder 类生成模拟器的组件评测。
三向权衡讲得很透：稳定性（NN）、细粒度物理精度（Langevin）、可解释轻量（Koopman）各占一角，而且作者诚实地指出"无动量、不控压，所以不声称严格物理动力学"，没有过度包装。
把扩散去噪器复用成 score 来源：训一个 DDPM 式去噪器、在极低噪声水平查询就得到平衡分布的 score，再喂进 Langevin SDE 当漂移——这种"去噪器即能量梯度"的复用很优雅，省掉单独训能量模型。
混合传播子的明确指引：实验直接暗示了下一步——用 NN 做慢速集体运动的稳定长程积分、用 Langevin 做局部高频侧链采样，按物理尺度分工。

局限与展望¶

系统专用、不可迁移：GLDP 是 per-system 代理模型，每个目标蛋白都要单独训传播子，没有跨蛋白泛化；作者把"端到端联训编码器+传播子于多蛋白数据集"列为未来方向。
不建模动量与精确动力学：潜空间只演化坐标 \(z\)、无动量/控压，因此时间尺度只能做诊断性比较，不能标定到 wall-clock 时间，也不保证严格物理动力学。
Langevin 超参敏感：步长 \(\Delta t\)、采样步长需逐系统标定，小系统（ADP）上极易崩（206 帧失效），鲁棒性弱于 NN。
依赖 LD-FPG 重建上限：整个动力学保真度被冻结解码器的重建能力封顶，编码器若漏掉某类构象，传播子无论多强也救不回来。
改进思路：训练时加显式动力学约束（如谱匹配损失）以进一步对齐时间尺度；探索 NN+Langevin 混合传播子兼顾稳定与热力学正确性。

评分¶

新颖性: ⭐⭐⭐⭐ 给静态系综生成器补时间维度 + 同潜空间三传播子受控对比，组合角度新颖，但单个传播子本身都是已有家族。
实验充分度: ⭐⭐⭐⭐⭐ 覆盖从二肽到大型 GPCR 的难度梯队，含 SOTA 对比、5 次重复消融、长时程稳定性与 TICA 动力学多维度评测。
写作质量: ⭐⭐⭐⭐⭐ 框架清晰、权衡讲得透、对方法局限诚实标注，公式与协议交代完整。
价值: ⭐⭐⭐⭐ 为潜空间蛋白动力学模拟器的传播子选型提供了实用指引（骨架用 NN、侧链用 Langevin），并指明混合传播子方向。