ICLR2026 计算生物论文解读论文笔记生物分子扩散模型对齐/RLHF 多模态对抗鲁棒推理

🧬 计算生物¶

🔬 ICLR2026 · 155 篇论文解读

📌 同领域跨会议浏览： 📷 CVPR2026 (21) · 💬 ACL2026 (5) · 🧪 ICML2026 (51) · 🤖 AAAI2026 (20) · 🧠 NeurIPS2025 (76) · 📹 ICCV2025 (4)

🔥 高频主题： 生物分子 ×65 · 扩散模型 ×23 · 对齐/RLHF ×7 · 多模态 ×5 · 对抗鲁棒 ×4

3DCS: Datasets and Benchmark for Evaluating Conformational Sensitivity in Molecular Representations: 作者构建了首个专测「同一分子不同构象」表示敏感性的基准 3DCS：用 >1M 分子、~10M 构象覆盖几何/手性/能量三个维度，配一套 Geometry–Chirality–Energy（GCE）评测框架，揭示现代 3D 分子表示模型几何很敏感、但手性时好时坏、能量几乎对不上。
A Cross-Species Neural Foundation Model for End-to-End Speech Decoding: 本文提出 BIT，一个把皮层神经活动直接翻译成完整句子的端到端脑机接口：先用跨物种（人+猴）、跨任务的自监督掩码预训练得到一个 Transformer 神经编码器，再把它接到音频大模型上做对比对齐微调，把先前端到端方法的词错误率（WER）从 24.69% 压到 10.22%，同时在级联框架下刷新 Brain-to-Text '24/'25 榜单 SOTA。
A Diffusion Model to Shrink Proteins While Maintaining Their Function: 提出 SCISOR——一个只学"删字母"的离散扩散模型：用纯生灭过程（随机插入）做前向加噪，训练去噪器反向规划删除，从而把长蛋白序列缩短成既"自然"又保功能的短序列，在 ProteinGym 删除效应预测上达到 SOTA。
A Foundation Model with Multi-Variate Parallel Attention to Generate Neuronal Activity: 本文提出多变量并行注意力（MVPA），把注意力解耦为内容、时间、通道三路并行分量，从而无视通道数量与排布的差异，并以此构建首个开源、开权重、开数据的颅内脑电（iEEG）基础模型 MVPFormer，在癫痫检测与脑活动解码上达到专家级 SOTA。
A Genetic Algorithm for Navigating Synthesizable Molecular Spaces: 提出 SynGA，一种直接在合成路线（合成树）上操作的遗传算法，通过自定义的交叉和变异算子将搜索严格约束在可合成分子空间内，结合 ML 驱动的构建块过滤实现 SOTA 的可合成类似物搜索和属性优化性能。
A Joint Diffusion Model with Pre-Trained Priors for RNA Sequence-Structure Co-Design: 把预训练的生物大分子结构预测模型 RoseTTAFold2NA 直接当作扩散去噪器，套进一个「离散序列扩散 + SE(3) 等变结构扩散」的联合框架（RiboDiff），用极少的 RNA 三维数据就能同时生成 RNA 序列和全原子三维构象，在单链 RNA、RNA-蛋白复合物、蛋白条件结合三类任务上把自洽性指标拉到远超从零训练的扩散/流匹配基线。
A New Paradigm for Genome-wide DNA Methylation Prediction Without Methylation Input: MethylProphet 是一个"基因上下文 + DNA 序列"驱动的 Transformer 基础模型，完全不需要任何已测甲基化值作为输入，仅凭一个样本的基因表达谱和每个 CpG 位点周围的局部 DNA 序列，就能推断全基因组（约 2800 万个 CpG）的甲基化水平，并能泛化到训练时从未见过的 CpG 位点和样本。
A Resolution-Agnostic Geometric Transformer for Chromosome Modeling Using Inertial Frame: InertialGenome 用惯性系把初始染色体三维坐标先规范到稳定姿态，再用带 3D-RoPE 与 Nyström 结构编码的 Transformer 精修坐标，在两个单细胞 Hi-C 数据集、多个分辨率和生物功能验证上都优于传统优化方法与图神经网络基线。
A tale of two tails: Preferred and anti-preferred natural stimuli in visual cortex: 本文发现灵长类视觉皮层 V4 神经元对自然图像的响应不是只有“偏好刺激”一端，而是同时存在能增强放电的偏好图像和能压低基线放电的反偏好图像，并通过电生理验证、编码模型、心理物理实验和 ImageBeagle 搜索工具证明反偏好刺激是理解 V4 调谐不可缺的一半。
Adaptive Data-Knowledge Alignment in Genetic Perturbation Prediction: ALIGNED 把"数据驱动的神经网络"和"专家整理的基因调控知识库"放进同一个溯因学习（Abductive Learning）框架里，用一个无梯度训练的适配器逐基因决定该信谁，再反过来用预测去精炼调控知识库，在多个大规模扰动数据集上拿到了最高的"平衡一致性"，并且能重新发现有生物学意义的调控关系。
Align Your Structures: Generating Trajectories with Structure Pretraining for Molecular Dynamics: 这篇论文提出 EGINTERPOLATOR：先在大规模静态分子构象数据上训练等变扩散结构模型，再用时间插值器在少量 MD 轨迹上学习帧间相关性，从而在小分子、药物分子、四肽和蛋白单体上生成更接近真实分子动力学的轨迹。
Animal behavioral analysis and neural encoding with transformer-based self-supervised pretraining: BEAST 用「掩码自编码 + 时序对比学习」双目标，在单个实验装置自己采集的无标注行为视频上预训练一个 ViT backbone，让同一个模型在神经编码、姿态估计、动作分割三类神经行为学任务上都打过需要大量标注的专用模型。
Antibody: Strengthening Defense Against Harmful Fine-Tuning for Large Language Models via Attenuating Harmful Gradient Influence: 提出Antibody防御框架：在对齐阶段通过平坦度正则化使模型处于有害损失的平坦区域（梯度小→难被攻击），在微调阶段用基于模型安全知识的样本加权方案（对比目标完成 vs 拒绝的似然比）抑制有害样本的学习，平均Harmful Score从15.29%降至7.04%。
AntigenLM: Structure-Aware DNA Language Modeling for Influenza: AntigenLM 是一个保留基因组功能单元完整性的 GPT-2 风格 DNA 语言模型，通过在流感病毒全基因组上预训练并微调，能够自回归预测未来流行毒株的抗原序列，在氨基酸错配率上显著优于进化模型 beth-1 和通用基因组模型。
Automatic and Structure-Aware Sparsification of Hybrid Neural ODEs with Application to Glucose Prediction: 针对"机理模型嵌进神经 ODE 后潜变量太多、小数据下过拟合"的痛点，本文提出三步混合图稀疏化算法 HGS（合并强连通分量→加捷径→L1/L2 正则剪边），自动选出既稀疏又保持机理可解释的子图，在合成数据和真实 T1D 血糖预测上用更少参数拿到更好、更鲁棒的预测。
Automatic Image-Level Morphological Trait Annotation for Organismal Images: 用在基础模型特征上训练的稀疏自编码器（SAE）作为"可解释的部件检测器"，自动定位昆虫图像中有生物学意义的形态结构，再交给多模态大模型生成性状描述，从而免去专家手工标注，构建出 8 万条性状标注的 BIOSCAN-TRAITS 数据集。
Beyond Ensembles: Simulating All-Atom Protein Dynamics in a Learned Latent Space: 本文在已训好的 LD-FPG 全原子潜空间里塞进一个时间传播子 GLDP，把"只会采静态构象系综"升级成"能模拟构象随时间演化"，并在同一冻结潜空间里公平对比了三类传播子（自回归神经网络、Koopman 线性算子、score-guided Langevin），结论是：自回归 NN 长轨迹最稳、骨架动力学最准；Langevin 侧链热力学最锐利；Koopman 是轻量但偏僵硬的可解释基线。
Beyond Grid-Locked Voxels: Neural Response Functions for Continuous Brain Encoding: 本文提出 NRF（Neural Response Function），把 fMRI 视觉编码从"对每个被试的离散体素向量做回归"改成"在标准 MNI 解剖空间上学一个连续隐式函数 \(\Phi(M,x)\)"，输入图像 \(M\) 和坐标 \(x=(x,y,z)\) 直接预测该位置的脑响应，从而利用体素的局部平滑性和跨被试解剖对齐，做到在只有几百张图的低数据场景下也明显超过传统编码模型，并支持把一个被试上预训练的模型微调迁移到新被试。
BioBO: Biology-informed Bayesian Optimization for Perturbation Design: BioBO 把多模态基因表征（Achilles + Gene2Vec + GenePT）塞进贝叶斯优化的代理模型、再用富集分析（enrichment analysis）结果当作 πBO 框架下的先验去增广采集函数，让 CRISPR 基因敲除筛选的标注效率提升 25–40%，同时给出通路级（pathway-level）的可解释设计依据。
BioMD: All-atom Generative Model for Biomolecular Dynamics Simulation: BioMD 是首个面向蛋白-配体体系的全原子生成式分子动力学模型，用"粗粒度预测 + 细粒度插值"的分层流匹配框架，把传统 MD 需要数小时的长时程轨迹（含配体解离路径）压缩到几十秒生成，并在 DD-13M 上对 97.1% 的体系成功重建出解离路径。
CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization: CAPSUL 构建了首个同时带有蛋白质 3D 结构信息和 20 类细粒度亚细胞定位标注的人类蛋白质 benchmark（20,181 条蛋白质），把 11 个序列/结构 baseline 拉到同一套评测里，证明引入 3D 结构对亚细胞定位预测是必要的，并通过注意力可视化在高尔基体上发现了 α-螺旋这一可与实验吻合的决定性定位模式。
CDBridge: A Cross-omics Post-training Bridge Strategy for Context-aware Biological Modeling: CDBridge 提出一种"后训练桥接"策略，把已经预训练好的冻结 DNA 模型和蛋白质模型在不重新训练的前提下拼到一起，通过"剪接启发的自适应 token 合并 + 组织条件解码器"两阶段对齐，首次让模型既能做 DNA→蛋白的定性功能对齐、又能在不同组织语境下做定量基因表达预测。
CellDuality: Unlocking Biological Reasoning in LLMs with Self-Supervised RLVR: CellDuality 把单细胞生物学的四类推理任务组织成一个统一框架，再用"互补任务对偶"——让模型正向预测一个生物结果、再逆向从结果重构出原始输入条件，用重构保真度当内在奖励——在完全没有 ground-truth 标签的情况下做 RLVR 对齐，使一个 3B 的 LLaMA 在细胞类型注释、药敏分类、扰动响应生成等任务上达到 SOTA，并在 OOD 扰动预测上把与"有监督 RLVR oracle"的差距缩小了 35–56%。
Clustering by Denoising: Latent Plug-and-Play Diffusion for Single-Cell Embeddings: 把"即插即用扩散去噪"搬到单细胞场景，提出 DICE：在低维隐空间里跑扩散先验做去噪、却在原始高维观测空间里重注噪声来"导航"采样轨迹，从而避开 PCA 隐空间把不同细胞类型挤在一起的塌缩问题，用一份高质量参考数据去噪另一份更脏的目标数据，显著提升聚类与细胞类型可分性。
ConfHit: Conformal Generative Design with Oracle Free Guarantees: 提出 ConfHit 框架，利用密度比加权的共形排列 p 值实现"认证"（判断生成批次是否包含 hit）和"设计"（精简候选集同时保持统计保证），在无需实验验证 oracle 和存在分布偏移的条件下，为生成式分子设计提供有限样本 \(1-\alpha\) 覆盖保证。
Constrained Diffusion for Protein Design with Hard Structural Constraints: 把约束扩散重新解释成"随机近端优化"，在每一步预测出的干净结构上施加可行性修正、再加噪回到数据流形（predict-prox-renoise），并用 ADMM 把局部立体化学与全局拓扑约束解耦，从而在蛋白质 motif scaffolding 和空腔设计任务上做到键长键角约束 100% 严格满足，可用率远超 RFDiffusion 系列基线。
Continuous Multinomial Logistic Regression for Neural Decoding: 本文把经典的多项逻辑回归（MLR）从"有限离散类别"推广到"连续输出空间"，提出 CMLR：用一组带高斯过程先验的平滑权重函数 \(w_d(y)\) 取代离散类别权重，从而把神经群体活动映射成关于连续变量（朝向、位置、速度等）的完整条件概率密度；配合 Fourier 域的随机变分推断使其能在上万神经元规模上高效训练，在小鼠/猴的视觉皮层、海马、运动皮层数据上普遍优于 DNN、XGBoost 和 FlexCode。
Controllable Diffusion-based Generation for Multi-channel Biological Data: 本文提出多通道扩散框架 MCD，用"随机通道掩码训练 + 多分辨率空间条件注入 + 双重通道注意力"让单个扩散模型能在任意"已观测/缺失通道"组合下补全完整通道面板，在空间蛋白组学、单细胞基因到蛋白翻译、MRI 缺失模态合成上都拿到 SOTA。
Controllable Sequence Editing for Biological and Clinical Trajectories: 提出 Clef，一个基于"时间概念"（temporal concepts）的可控序列编辑模型，能够在给定条件（如药物、手术）下对生物/临床多变量轨迹进行即时和延迟编辑，在细胞重编程和患者实验室检测数据上，即时编辑 MAE 提升 16.28%，延迟编辑提升 26.73%，零样本反事实生成提升达 62.84%。
Controlling Repetition in Protein Language Models: 首次系统性研究蛋白质语言模型（PLM）中的病态重复问题，提出统一的重复度量指标 \(R(x)\) 和效用指标 \(U(x)\)，并设计 UCCS（Utility-Controlled Contrastive Steering）方法，通过在隐层注入与重复解耦的引导向量，在不重训模型的前提下有效抑制重复同时保持折叠可信度。
Convex Efficient Coding: 本文把一大类"神经表征优化"问题（高效编码、半非负矩阵分解、非负稀疏编码等）重写成在表征相似度矩阵 \(Q\)（神经响应两两点积构成的矩阵）上的凸优化，从而既保留了深度网络的灵活性又拿回了线性模型的可分析性，并用它一次性给出半非负矩阵分解的首个充要可辨识性条件、为单神经元调谐分析提供理论辩护、以及解释视网膜 ON-OFF 编码的稀疏度阈值。
Count Bridges enable Modeling and Deconvolving Transcriptomic Data: 本文提出 Count Bridges——一个定义在整数格 \(\mathbb{Z}^d\) 上、由 Poisson 生灭过程驱动的随机桥模型，为计数数据提供了扩散模型的精确可解析对应；并通过 EM 把"只观测到聚合计数"的解卷积纳入同一框架，在合成分布匹配、bulk RNA-seq 核苷酸级解卷积和空间转录组 spot 解卷积上都达到 SOTA。
Coupled Transformer Autoencoder for Disentangling Multi-Region Neural Latent Dynamics: CTAE 用一对（或多个）耦合的因果 Transformer 自编码器同时建模多个脑区的神经群体活动，把每个脑区的潜在空间显式切成「跨区共享」和「区域私有」两个正交子空间，靠四个损失函数把跨区共有的信号逼进共享块、把区域特有的信号留在私有块，从而在保留非平稳非线性时序动态的同时干净地分离共享与私有成分，下游用简单线性解码器就能比 DLAG/mDLAG 等线性方法更准地解出行为变量。
CP-Agent: Context-Aware Multimodal Reasoning for Cellular Morphological Profiling under Chemical Perturbations: CP-Agent 把"实验上下文感知的图文对齐模块 CP-CLIP"和"多智能体 MLLM 推理流水线"串成一条单遍管线，从一对 Cell Painting 显微图像出发，自动检索实验背景、分割提取单细胞形态特征、统计对比扰动组与对照组，最终生成可追溯、可解释的药物作用机制（MoA）报告。
CryoLVM: Self-supervised Learning from Cryo-EM Density Maps with Large Vision Models: CryoLVM 把联合嵌入预测架构（JEPA）+ SCUNet 主干引入 cryo-EM 三维密度图领域，用 EMDB 上 7,302 张真实实验密度图做表征空间的自监督预训练，再配一个新颖的直方图分布对齐损失做微调，在密度图锐化、超分辨、缺失楔补全三个下游任务上一致超越 DeepEMhancer、EMReady、EM-GAN、IsoNet 等专用方法。
CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints: 提出CryoNet.Refine——首个基于AI的冷冻电镜(cryo-EM)原子模型精修框架：设计单步扩散模型(初始化自Boltz-2权重)→创新可微分密度生成器(物理模拟合成密度图)→首次将密度图相关性作为可微损失函数(余弦相似度)→联合Ramachandran/Rotamer/键角等几何约束损失→测试时优化策略逐案定制→在120个蛋白质/DNA-RNA复合物上全面超越Phenix.real_space_refine(CC_mask 0.59 vs 0.54, Ramachandran favored 98.92%)。
CryoSplat: Gaussian Splatting for Cryo-EM Homogeneous Reconstruction: CryoSplat 把 3D 高斯泼溅改造成符合冷冻电镜成像物理的可微渲染器，用各向异性高斯混合模型（GMM）从随机初始化、无需任何外部共识图或原子模型，就能直接从原始噪声粒子图稳定地完成 cryo-EM 同质重建，在四个真实数据集上的分辨率全面超越 cryoSPARC 和 cryoDRGN，且内存/速度都更优。
DCFold: Efficient Protein Structure Generation with Single Forward Pass: DCFold 把 AlphaFold3 的两大迭代瓶颈（多步扩散 + Pairformer 循环）同时用"双一致性"蒸馏掉，再配一个针对变长蛋白序列设计的 Temporal Geodesic Matching 调度器，做到单次前向就能达到 AlphaFold3 级别的结构预测精度，推理提速约 15×（平均 133s → 9s）。
Decoding Dynamic Visual Experience from Calcium Imaging via Cell-Pattern-Aware Pretraining: POYO-CAP 把"统计规律性"（用偏度和峰度衡量）当成显式的数据筛选准则，先在最"可预测"的一批神经元（抑制性中间神经元等）上做掩码重建预训练，再迁移到嘈杂神经元做下游解码，从而把钙成像里的神经元异质性从拦路虎变成可扩展的学习优势——电影帧重建 SSIM 达 0.593、数据效率提升 1.98×，且模型越大性能越稳地上升。
DeepSADR: Deep Transfer Learning with Subsequence Interaction and Adaptive Readout for Cancer Drug Response Prediction: DeepSADR 把“药物-患者是否响应”建模成药物子结构与基因功能子序列之间的二部交互图，再用图自编码器和 Set Transformer 自适应读出把细胞系中的丰富响应知识迁移到样本稀缺的临床患者数据，在 5 种临床药物上取得平均 AUC 0.856、AUPR 0.862。
Diffusion Alignment as Variational Expectation-Maximization: 将扩散模型对齐形式化为变分 EM 算法：E-step 用 test-time search（soft Q 引导 + 重要性采样）探索高奖励多模态轨迹，M-step 通过 forward-KL 蒸馏将搜索结果写入模型参数，在图像生成和 DNA 序列设计上同时实现高奖励和高多样性。
Discovering heterogeneous synaptic plasticity rules via large-scale neural evolution: 这篇论文把小鼠初级视觉皮层 V1 建成一个可塑的脉冲神经网络，在由脉冲、资格迹和奖赏预测误差信号组成的巨大可解释规则空间中，用多目标进化算法搜索不同突触类型各自的学习规则，发现多种数学形式很不一样的规则都能同时保持生物合理性、视觉变化检测能力、少样本适应性和跨网络规模泛化。
Discrete Compositional Generation via General Soft Operators and Robust Reinforcement Learning: 针对 GFlowNet 在指数级搜索空间里"按奖励正比采样"会被海量次优物体淹没掉极少数高奖励物体的问题，本文提出一个把软 Bellman、mellowmax、soft mellowmax 三类软 RL 算子统一起来的 general mellowmax 算子（用一个参数 \(q\) 在"累积"和"稀释"两种偏差之间插值），并据此导出一个简单易用的轨迹级算法 TGM，在 DNA/蛋白质等真实生物序列设计任务上比 GFN/PPO/SAC 找到奖励更高且仍然多样的候选。
Discrete Diffusion Trajectory Alignment via Stepwise Decomposition: 提出 SDPO（Stepwise Decomposition Preference Optimization），将离散扩散模型的轨迹对齐问题分解为逐步后验对齐子问题，避免了在整条去噪链上反传梯度的困难，在 DNA 序列设计、蛋白质逆折叠和语言建模三个任务上均显著超越现有方法。
Distilling Causal Signals for One-Shot Directed Evolution of Antibodies: AFFINITYENHANCER 提出在「只给一条先导抗体序列、不给抗原信息、不微调、不用抗原-抗体复合物结构」的极端单次（one-shot）设定下做抗体亲和力成熟：通过在跨抗原数据集中构造「同抗原、低亲和力→高亲和力」的近邻配对，让一个残差图 Transformer 在冻结的序列-结构 embedding 空间里学习「把低亲和力 embedding 推向高亲和力」的映射，理论上证明这种配对监督被因果（causal）变化主导而把伪相关（spurious）漂移压在很小的预算内，从而泛化到完全没见过的抗体种子，并把突变集中在 paratope 界面的边缘（rim），效果超过结构条件反折叠（AntiFold）和序列 inpainting（IgCraft）基线。
DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials: 提出 DistMLIP 分布式推理平台，基于零冗余图级并行化策略（graph-level parallelization），解决现有机器学习原子间势（MLIP）缺乏多 GPU 支持的问题，在 8 GPU 上实现接近百万原子的模拟，比空间分区方法快达 8 倍且能模拟 3.4 倍更大的系统。
Doloris: Dual Conditional Diffusion Implicit Bridges with Sparsity Masking Strategy for Unpaired Single-Cell Perturbation Estimation: Doloris 用两个共享高斯隐空间的条件扩散模型分别建模"未扰动细胞"和"扰动后细胞"的分布，靠隐式桥（DDIB）绕过单细胞测序"同一细胞测不到扰动前后两态"的非配对难题，再配一个稀疏掩码模型专门预测哪些基因被沉默，让扩散模型把力气花在真正表达的基因上，从而在遗传/分子扰动数据集上达到 SOTA 并保住单细胞响应的多样性。
DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models: DriftLite 提出在 Fokker-Planck 方程中利用漂移-势函数的自由度，通过轻量级线性系统求解最优控制漂移来主动稳定粒子权重，以最小代价解决 Sequential Monte Carlo 中的权重退化问题，在高斯混合、分子系统和蛋白质-配体共折叠任务上大幅超越 Guidance-SMC 基线。
Drugging the Undruggable: Benchmarking and Modeling Fragment-Based Screening: 针对"不可成药"蛋白（口袋浅、瞬态、隐蔽）上传统分子筛选失效的问题，本文构建了首个片段级虚拟筛选基准 FragBench（54 个挑战性靶点，多智能体 LLM+人工协同标注），并提出三模态对比学习框架 FragCLIP（联合编码口袋、整分子、片段），在片段检索上大幅超越对接软件和已有 ML 方法（FragBench 上 [email protected]% 从 Glide 的 1.86 提到 6.85），且检索出的片段能被扩展/连接成高亲和力先导化合物。
DrugTrail: Interpretable Drug Discovery via Structured Reasoning and Druggability‑Tailored Preference Optimization: DrugTrail 把通用大模型改造成"会像药化专家一样思考"的药物设计器：先用临床化学引导的五维结构化推理（CCIR）做轻量 SFT，再用一套不依赖耗时打分、能在线计算的成药性偏好优化（DTPO）做 GRPO 强化学习，让 7B 级小模型在口袋导向分子生成上对接能量、QED、SA 等指标全面碾压 DeepSeek-R1 等大模型，且每个分子都附带可读的推理链。
Efficient Prediction of Large Protein Complexes via Subunit-Guided Hierarchical Refinement: HIERAFOLD 用 PAE 从粗粒度两两预测中自动切出刚性子单元和跨链接口，再只对“焦点链 + 相关接口子单元”做高精度精修，最后用置信度加权对齐装配，从而在接近 AlphaFold3 准确率的同时把大蛋白复合物的峰值显存压到可运行范围。
Enhancing Diffusion-Based Sampling with Molecular Collective Variables: 把分子动力学里的"well-tempered metadynamics"沿集体变量（CV）施加在线排斥偏置的思想，嫁接到 state-of-the-art 的扩散采样器 ASBS 上，得到 WT-ASBS：训练中沿低维 CV 持续累积偏置逼出稀有构象、推理时按偏置重加权恢复玻尔兹曼分布，首次用扩散采样器以远低于 metadynamics 的墙钟时间采样了带键断裂/形成的反应能面。
Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions: 提出 DeMol 双图增强多尺度交互框架，通过并行的原子中心图和键中心图通道以及 Double-Helix Blocks 显式建模原子-原子、原子-键、键-键三类交互，在 PCQM4Mv2、OC20、QM9 等基准上取得 SOTA。
Exploring Synthesizable Chemical Space with Iterative Pathway Refinements: ReaSyn 把"给分子找可合成类似物"建模成一个搜索/推理问题：用单个自回归 Transformer 同时支持自底向上与自顶向下生成合成树，并叠加一个整体级的离散流编辑器（Edit Bridge），通过"自底向上解码→自顶向下解码→整体编辑"的迭代循环，大幅提升可合成化学空间的覆盖率与重构率。
Extending Sequence Length is Not All You Need: Effective Integration of Multimodal Signals for Gene Expression Prediction: 挑战基因表达预测中"越长越好"的长序列建模范式，发现当前 SSM 模型本质上只利用近端信息；进而识别出背景染色质信号（DNase-seq/Hi-C）作为混杂变量引入虚假关联，提出 Prism 框架通过后门调整去混杂，仅用 2k 短序列即超越 200k 长序列的 SOTA。
FACET: A Fragment-Aware Conformer Ensemble Transformer: FACET 用一个可微图 Transformer 去学习逼近昂贵的 Fused Gromov-Wasserstein (FGW) 距离，把"几何感知的多构象聚合"从在线求解优化问题变成一次前向推理，再叠加片段级结构先验，在保持 SOTA 精度的同时把训练提速 5–6 倍，可扩展到 7.5 万分子规模。
Fast and Interpretable Protein Substructure Alignment via Optimal Transport: PLASMA 把蛋白质局部结构对齐重新表述为带熵正则的最优传输问题，用可微 Sinkhorn 迭代直接输出残基级对齐矩阵和一个 [0,1] 区间的可解释相似度分数，做到了又快（约 10ms/对，比 TM-align 快 50×）又准又能看懂的活性位点/结合位点对齐。
Fast Proteome-Scale Protein Interaction Retrieval via Residue-Level Factorization: RaftPPI 把传统 residue-residue 蛋白互作评分近似成可分解的单蛋白 embedding 内积，用 Gaussian kernel、SORF 随机傅里叶特征和低秩注意力保留残基级建模能力，同时把全人类蛋白组候选互作检索从 GPU 月级降到单机数分钟。
Fine-Tuning Diffusion Models via Intermediate Distribution Shaping: 统一拒绝采样微调方法为GRAFT框架并证明其隐式执行KL正则化奖励最大化，进而提出P-GRAFT在中间去噪步骤做分布整形（偏差-方差权衡更优），以及Inverse Noise Correction无需奖励即可改进流模型质量，在T2I上VQAScore提升8.81%。
FlexRibbon: Joint Sequence and Structure Pretraining for Protein Modeling: FlexRibbon 用「掩码语言建模 + 扩散去噪」把氨基酸序列和三维结构在预训练阶段双向绑在一起，不依赖 MSA，在抗体/纳米抗体 CDR、多肽界面、蛋白-配体对接、功能注释等 12 个任务上刷新 SOTA，尤其在高突变、低同源场景下显著超越 AlphaFold 这类 MSA 方法。
Flow Autoencoders are Effective Protein Tokenizers: 本文提出 Kanzi——一个用流匹配损失训练的非等变蛋白质结构 tokenizer，用一个扩散解码器加一个 FSQ 量化瓶颈，替换掉传统 tokenizer 里那套 SE(3)-不变模块和繁杂损失，以 1/20 参数量、1/400 训练数据就拿下重建 SOTA。
FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching: FragFM 把分子生成搬到"化学片段"这一更高层次：用离散流匹配在片段级图上采样，再用粗到细自编码器无损还原到原子级；配合"随机片段袋"策略绕开固定片段词表的限制，在更少去噪步数下生成更大、更真实、更可控的分子。
Fusing Pixels and Genes: Spatially-Aware Learning in Computational Pathology: 本文提出 Stamp 框架，利用空间转录组学基因表达数据作为监督信号，通过空间感知基因编码器预训练和层次化多尺度对比对齐，实现病理图像与空间转录组数据的联合表示学习，在 6 个数据集 4 个下游任务上取得 SOTA。
GAGA: Gaussianity-Aware Gaussian Approximation for Efficient 3D Molecular Generation: GAGA 发现 3D 分子数据在前向加噪过程中远早于图像就达到了"足够高斯"的状态，于是用统计检验定位这个特征时间步 \(T^*\)、把它之后的冗余轨迹直接替换成闭式高斯近似，从而在不改架构、不改噪声调度的前提下同时加速训练与采样并提升生成质量。
GeomMotif: A Benchmark for Arbitrary Geometric Preservation in Protein Generation: GeomMotif 把蛋白质 motif scaffolding 任务从"功能位点"中解耦出来，构造了 57 个保证可解、模态无关的"纯几何保持"任务，用统一的 SUN（成功×独特×新颖）指标系统揭示出结构类模型远超序列类模型、以及结构条件反而可能干扰生成等反直觉现象。
GRAM-DTI: Adaptive Multimodal Representation Learning for Drug-Target Interaction Prediction: GRAM-DTI 把药物 SMILES、分子文本、分子层级分类标注和蛋白序列放进同一个预训练框架，用 Gramian 体积对齐、自适应模态 dropout 和 IC50 弱监督学习更稳健的药物-靶点表示，并在 DTI / MoA 预测和零样本检索上整体超过强基线。
Graph Diffusion Transformers are In-Context Molecular Designers: 用「分子-分数」示例对替代文本 prompt 来定义任务上下文，把图扩散 Transformer 训成一个 0.7B 的分子基础模型 DemoDiff，仅靠几十个 in-context 示例就能在 33 个设计任务上匹敌甚至超过大 100–1000 倍的 LLM。
Greater than the Sum of Its Parts: Building Substructure into Protein Encoding Models: 本文提出 Magneton 环境（含 53 万蛋白、170 万子结构标注的数据集、训练框架与 13 项基准任务）和 substructure-tuning 这一模型无关的监督微调方法，把"蛋白由进化保守的重复子结构（domain、active site 等）组装而成"这一生物学先验显式注入预训练蛋白编码器，在不依赖全局结构输入的情况下系统性提升功能相关任务表现。
h-MINT: Modeling Pocket-Ligand Binding with Hierarchical Molecular Interaction Network: 本文提出可重叠的分子分词算法 OverlapBPE 与配套的层次分子交互网络 h-MINT，用"片段可共享原子"的多对多映射保留芳香性/手性/电荷等化学语境，在结合亲和力预测、虚拟筛选与高通量筛选上全面超越现有最优。
HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data: HEIST 把组织建模成「空间细胞图 + 每个细胞内部的基因共表达网络」双层层次图，通过跨层级有向注意力让基因表征受空间微环境调制、细胞表征受内部转录态影响，从而摆脱固定基因词表、零样本迁移到蛋白质组学，并在临床预测、细胞注释、基因填补等任务上刷新 SOTA。
HeurekaBench: A Benchmarking Framework for AI Co-scientist: 提出 HeurekaBench，一个基于真实科学工作流构建评测基准的框架，通过多LLM流水线从论文中提取可验证的科学洞见并生成开放式研究问题，用于评估AI co-scientist在数据驱动科学发现中的端到端能力。
Hierarchical Multi-Scale Molecular Conformer Generation: MSGEN 把分子构象生成拆成"粗骨架→细原子"的多阶段层次过程，用前一阶段生成的关键子结构位置作为几何引导，并配上一套尊重化学连接性的"分子上采样"来弥合尺度差，从而以即插即用的方式让 GeoDiff / ET-Flow / EBD 等多种生成模型产出更稳定、更化学合理的构象。
I2Mole: Interaction-aware Invariant Molecular Learning for Generalizable Drug-Drug Interaction Prediction: I2Mole 把一对药物分子拼成一张「合并图」，先用注意力建模原子间的跨分子相互作用，再用改进的图信息瓶颈抽出决定性核心子结构（rationale），并用向量量化把训练集环境聚成一本「环境码本」当作可控噪声源做不变学习，从而在归纳和跨域分布偏移下都能稳健预测药物相互作用。
Interpolation-Based Conditioning of Flow Matching Models for Bioisosteric Ligand Design: 在预训练的 E(3)-等变 flow matching 分子生成模型上，提出两种完全无需重训、只在推理时介入的条件化策略——Interpolate–Integrate（软全局相似）和 Replacement Guidance（硬局部锚定），实现以参考配体/片段集为条件的生物等排体 3D 分子设计。
Intrinsic Lorentz Neural Network: 提出完全内禀（fully intrinsic）的双曲神经网络 ILNN，所有运算均在 Lorentz 模型内完成，消除了现有方法中混合欧几里得操作的几何不一致性，在图像分类、基因组学和图分类上取得 SOTA。
Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design: VIDD 把"用奖励微调扩散模型"重新表述为离线策略蒸馏：用软最优策略当 teacher，通过最小化前向 KL（值加权 MLE）把它蒸馏进 student 模型，从而在蛋白质、DNA、小分子等存在不可微奖励的生物分子设计任务上获得比 PPO 类 RL 方法更稳定、更高效的奖励优化。
KGOT: Unified Knowledge Graph and Optimal Transport Pseudo-Labeling for Molecule-Protein Interaction Prediction: KGOT 把"给未标注分子-蛋白质对打伪标签"建模成最优传输（OT）匹配问题，再把生成的传输计划作为一条新关系写回大规模生物知识图谱联合训练，用 OT + KG 闭环缓解 MPI 任务标签稀缺，在虚拟筛选和链接预测上全面超越 docking 和 DrugCLIP。
La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching: La-Proteina 用「α-碳坐标显式建模 + 其余原子细节与序列压进每残基固定维隐变量」的部分隐变量表示，把全原子蛋白质的混合离散-连续、变维难题转成纯连续定维问题，再用流匹配联合生成序列与全原子结构，在全原子可共设计性、多样性、结构合理性上达到 SOTA，并能扩展到 800 残基的长蛋白。
Learning Brain Representation with Hierarchical Visual Embeddings: 用多个具有不同归纳偏置的预训练视觉编码器（CLIP 语义 + VAE 像素）拼出"层级视觉表征"作为对齐目标，再配一个在大规模图像上预训练好的 Fusion Prior 把融合特征稳定地映射到扩散条件，从而让 EEG/MEG 脑信号同时对齐到高层语义和低层像素，兼顾零样本检索精度与重建保真度。
Learning Collective Variables from BioEmu with Time-Lagged Generation: 把冻结的蛋白质生成基础模型 BioEmu 改造成「时滞生成器」——给它当前构象 \(x_t\)，逼它生成 \(\tau\) 时间后的构象 \(x_{t+\tau}\)，从而让一个轻量编码器自动学到只编码慢自由度的一维集体变量(CV)，可直接喂给 OPES、Steered MD 等增强采样方法。
Learning Explicit Single-Cell Dynamics Using ODE Representations: 本文提出 Cell-MNN——一个编码器-解码器架构，把单细胞分化动力学表示为「随状态条件化的局部线性 ODE」，从而抛弃昂贵的最优传输（OT）预处理与多阶段训练，端到端单阶段就能在单细胞插值基准上拿到 SOTA 平均成绩，并顺带产出可对照 TRRUST 数据库验证的可解释基因调控相互作用。
Learning Flexible Forward Trajectories for Masked Molecular Diffusion: 本文发现把掩码扩散模型（MDM）直接搬到分子图生成上会因为不同分子在前向加噪中坍缩到同一中间态（state-clashing）而严重退化，于是提出 MELD——用一个可学习的噪声调度网络给每个原子/化学键分配各自的掩码速率，让前向轨迹相互错开，从而在 QM9/ZINC250K 上做到 100% 化学有效性且分布对齐 SOTA。
Learning Molecular Chirality via Chiral Determinant Kernels: 提出手性行列式核(ChiDeK)来编码 SE(3) 不变的手性矩阵，首次在 GNN 框架中统一处理中心手性和轴向手性，结合交叉注意力传播立体化学信息，在新构建的轴向手性基准上准确率提升 >7%。
Learning Residue Level Protein Dynamics with Multiscale Gaussians: DYNAPROT 把蛋白质动力学建模成「对静态结构上 Cα 坐标的多元高斯分布」，用一个轻量 SE(3) 不变网络从单个静态结构直接预测每残基 3×3 边缘协方差和残基对 N×N 标量耦合，再用一个启发式拼出完整 3N×3N 联合协方差，从而以小三个数量级的参数量实现快速且可解释的柔性预测与构象集成采样。
Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs: 本文系统验证了一个反直觉结论：与其逼科学大模型（Sci-LLM）去直接"读懂"原始生物分子序列，不如用 BLAST/Pfam/GO 等成熟生物信息学工具把序列预处理成高层、人类可读的文本上下文喂给模型——"只给上下文"在蛋白质 QA 上大幅超越"只给序列"，而且把原始序列和上下文一起喂反而会拖累性能，说明现有 Sci-LLM 的真正价值是"知识推理引擎"而非"序列解码器"。
Low rank adaptation of chemical foundation models generate effective odorant representations: 本文先用大规模 benchmark 证明现成化学基础模型生成的气味分子表征并不比手工理化描述符更强（因为信息高度冗余重叠），再提出 LORAX——用 LoRA 对化学基础模型做嗅觉任务微调 + 交叉注意力 + XGBoost 集成，造出与神经表征更对齐、泛化更好的气味分子表征。
MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models: 不再去学固定 lag time 的逐帧 MD 转移密度，而是先用马尔可夫态模型（MSM）把轨迹粗粒化成离散亚稳态，再用 Flow Matching 学"态到态"的跳转分布，从而以两个数量级的加速、更强的稀有大构象变化探索能力来替代分子动力学采样。
Meta-Learning Theory-Informed Inductive Biases using Deep Kernel Gaussian Processes: 用贝叶斯元学习把"黑箱"规范理论（如视网膜的高效编码）自动蒸馏成一个深度核高斯过程先验（Theory-Informed Kernel），既能作为归纳偏置提升对真实神经数据的拟合，又能用精确边际似然严格量化"理论与数据的吻合程度"。
MicroVerse: A Preliminary Exploration Toward a Micro-World Simulation: 本文首次提出"微观世界模拟"（Micro-World Simulation）概念，构建了细粒度 rubric 评测基准 MicroWorldBench、专家核验数据集 MicroSim-10K，并基于 Wan2.1 微调出面向微观尺度的视频生成模型 MicroVerse，揭示并初步弥合了当前 SOTA 视频模型在微观生物机制模拟上"看似正确、实则违背物理/生物规律"的缺口。
MindPilot: Closed-loop Visual Stimulation Optimization for Brain Modulation with EEG-guided Diffusion: MindPilot 把人脑当成一个不可微的黑盒函数，用非侵入式 EEG 信号作为优化反馈、配合一个"伪模型 (pseudo-model)"提供替代梯度，闭环迭代地生成/检索能把大脑神经状态推向指定目标的自然图像，首次在语义与频谱两类神经目标上验证了"用图像反向调控大脑"的可行性。
Model-Guided Microstimulation Steers Primate Visual Behavior: 用带皮层拓扑结构的深度视觉模型在"硅内"预演微电刺激实验，挑出最能改变行为的刺激位点与图像，再把这些预测搬到活体猕猴的下颞叶皮层上验证——结果模型预测的行为偏移与猴子真实选择显著相关，并首次实现模型在环（model-in-the-loop）引导的高级视觉皮层刺激。
MolEditRL: Structure-Preserving Molecular Editing via Discrete Diffusion and Reinforcement Learning: MolEditRL 把分子编辑直接放在离散分子图上做：先用图文本条件扩散学会从源分子和自然语言指令重构目标分子，再用带结构约束的强化学习细调属性优化，在更少参数下同时提高编辑成功率、结构相似度和化学分布质量。
Multi-Marginal Flow Matching with Adversarially Learnt Interpolants: 用 GAN 式对抗损失学习「神经插值曲线」，让插值曲线在中间时刻的边际分布逼近观测快照分布（而非逐点穿过样本），再用流匹配把这些光滑插值边际化为向量场，从而在缺少真实轨迹、只有离散时间快照的科学数据上推断连续动力学。
Multi-state Protein Sequence Design with DynamicMPNN: DynamicMPNN 是首个"显式"多态逆折叠模型，直接学习一条序列对多个构象的联合条件分布 \(p(Y|X_1,\dots,X_m)\)，在多态蛋白基准上把 ProteinMPNN 的序列恢复率提高 12%、decoy-归一化 RMSD 自洽性提高 31%。
Multifidelity Simulation-based Inference for Computationally Expensive Simulators: 提出 MF-(TS)NPE：用便宜的低保真仿真预训练神经密度估计器，再用少量昂贵的高保真仿真微调，把基于仿真的贝叶斯推断所需的高保真仿真次数降低最多两个数量级。
Musculoskeletal simulation of limb movement biomechanics in Drosophila melanogaster: 首次为果蝇腿构建解剖学+生理学精确的 3D 肌骨模型（OpenSim + MuJoCo 双引擎），用 Hill-type 肌肉桥接运动神经元活动与关节运动，从真实行为数据反推肌肉协同，并证明被动关节属性（刚度/阻尼）能加速肌肉驱动控制的学习。
NC-Bench and NCfold: A Benchmark and Closed-Loop Framework for RNA Non-Canonical Base-Pair Prediction: 本文构建了首个面向 RNA 非经典（NC）碱基对预测的标准化基准 NC-Bench（925 条序列、6708 条 NC 标注），并提出双分支闭环框架 NCfold，通过 IsoScore 筛选 RNA 基础模型嵌入、以代表性嵌入融合（REF）注入注意力作为结构先验，在 NC 边类型与朝向预测上显著超越传统机器学习与 RFM 基线。
OmniMouse: Scaling properties of multi-modal, multi-task Brain Models on 150B Neural Tokens: OmniMouse 用单神经元 token + 灵活掩码的统一架构，在 73 只小鼠视觉皮层、超 1500 亿神经元 token 上联合做神经预测/预报、行为解码与刺激编码，刷新了 SOTA；并发现一个反直觉的缩放结论——脑活动建模目前是数据受限而非参数受限，加数据持续有用，加模型规模很快饱和。
One Protein Is All You Need: 本文提出 ProteinTTT，把测试时训练搬到蛋白质语言模型上——给定一条待测蛋白序列，在推理前用掩码语言建模目标在这一条序列上对骨干网络做几十步自监督微调，使模型对该序列的困惑度下降、表示变好，从而在不改动任何下游任务头的前提下提升结构、适应度、功能三类预测，并在 ProteinGym 上刷新 SOTA。
Only Brains Align with Brains: Cross-Region Alignment Patterns Expose Limits of Normative Models: 作者指出现有"模型-脑对齐"基准只做单点（ROI-层）打分、判别力极低（一大堆架构迥异的视觉模型分数难分伯仲），于是提出对齐模式分析（APA）——把每个脑区相对所有其他脑区的对齐关系画成一条"指纹"曲线，要求模型不仅在单个 ROI 上分数高、还要复现这条跨脑区关系曲线，结果发现连排名最高的 V-JEPA 2 等模型都对不上，从而揭示出"高对齐分 ≠ 真正像脑"。
Optimal Transport Unlocks End-to-End Learning for Single-Molecule Localization: 针对单分子定位显微（SMLM）高密度场景下深度学习方法依赖不可微 NMS 的痛点，本文把训练目标重写成「预测活化点集合 vs 真值集合」的集合匹配问题，用熵正则最优传输（Sinkhorn）构造可微损失彻底替掉 NMS，并配上一个把显微镜成像物理当作反馈的迭代细化网络，在合成基准与真实生物数据的中高密度区均刷新了 SOTA。
Pallatom-Ligand: an All-Atom Diffusion Model for Designing Ligand-Binding Proteins: Pallatom-Ligand 用一个全原子扩散 transformer 直接学习「蛋白质 + 小分子配体」复合物里所有原子的联合分布，端到端地同时生成蛋白主链、侧链和配体口袋，并支持对蛋白整体折叠（α/β 比例）和配体溶剂可及性的可编程控制，在八个配体的综合 benchmark 上取得了最高的 in silico 成功率。
PatchDNA: A Flexible and Biologically-Informed Alternative to Tokenization for DNA: PatchDNA 把自然语言里的 Byte Latent Transformer「分块（patching）」机制搬到 DNA 上，用进化保守性分数（PhyloP）而非固定词表来决定可变长度的 patch 边界，并支持训练后「重新 patching」，让参数量小一个数量级的模型在多个基因组 benchmark 上超过现有 SOTA，还能在不重训的情况下按下游任务/细胞类型调整切块策略。
PepBenchmark: A Standardized Benchmark for Peptide Machine Learning: PepBenchmark 把肽药物发现中的 35 个 canonical / non-canonical peptide 数据集、统一清洗采样划分流程和四类模型 leaderboard 放到同一套可复现实验框架里，并揭示了 PLM、fingerprint、GNN 与 SMILES 模型在不同肽任务上的真实优势边界。
PepTri: 物理、进化与互信息三重引导的全原子扩散肽设计: PepTri 在一个 SE(3) 等变的潜空间里把肽的序列和三维结构一起做扩散生成，并在去噪过程中同时注入物理、进化和互信息三路引导，让生成的肽既物理稳定、又进化上合理、还序列-结构自洽，在多个肽-蛋白设计基准上取得 SOTA。
PETRI: Learning Unified Cell Embeddings from Unpaired Modalities via Early-Fusion Joint Reconstruction: PETRI 把扰动相同的一批细胞当成一篇"多模态文档"，用早融合 Transformer 对掩码后的图像与转录组做联合重建，无需细胞级配对就能学到统一的细胞嵌入，在恢复已知基因关系上显著超过单模态与晚融合基线。
PoinnCARE: Hyperbolic Multi-Modal Learning for Enzyme Classification: PoinnCARE 把酶的序列、结构、活性位点三种模态投影到双曲（Poincaré 球）空间里联合编码与对齐，用图扩散补全稀疏的活性位点标注、用双曲几何忠实保留 EC 编号系统的树状层级，在 CARE 基准四个测试集上的 EC number 预测全面超过 12 个 SOTA，level-4 最高领先 CLEAN 10.4%。
PoseX: AI Defeats Physics-based Methods on Protein Ligand Cross-Docking: PoseX 构建了一个同时覆盖 self-docking 和更贴近真实场景的 cross-docking 的开源对接基准，用 718 + 1312 条无训练泄漏的新晶体结构、23 个跨三大类的对接方法、一套精心设计的能量松弛后处理和一个实时榜单，系统证明了在 cross-docking 这个更难的现实任务上 AI 方法已经全面碾压传统物理对接软件。
Pretraining with Re-parametrized Self-Attention: Unlocking Generalization in SNN-Based Neural Decoding Across Time, Brains, and Tasks: 本文提出 RAT SNN——一个把"重参数化脉冲自注意力 + 多时间尺度脉冲神经元 + 分阶段跨条件预训练"捏在一起的轻量脉冲神经网络，用来从皮层脉冲序列解码运动意图，在仅 60 万参数、推理只用加法（AC）操作的前提下，做到媲美主流 ANN 解码器的精度，并能跨时间、跨被试、跨任务快速泛化，瞄准全植入式脑机接口（fully iBMI）的严苛功耗约束。
PRISM: Enhancing Protein Inverse Folding through Fine-Grained Retrieval on Structure-Sequence Multimodal Representations: PRISM 把"检索增强生成（RAG）"搬进蛋白质逆折叠：先在已知蛋白库里为每个残基检索细粒度的结构-序列 motif 表示，再用一个混合自/交叉注意力解码器把这些检索到的局部片段融进骨架上下文，从而在几乎不增加推理开销（+14%）的前提下把 SoTA 的困惑度和氨基酸恢复率再往上推一截。
Property-Driven Protein Inverse Folding with Multi-Objective Preference Alignment: 本文提出 ProtAlign，用一个带「弹性偏好边界」的半在线 DPO 框架去微调预训练逆折叠模型，让它在保住「可设计性」（序列能复原目标骨架）的同时同时优化溶解度、热稳定性等多个相互冲突的「可开发性」属性；应用到 ProteinMPNN 上得到的 MoMPNN 在晶体结构、de novo 骨架和真实 binder 设计三类任务上都优于专门为单属性训练的基线。
ProTDyn: A Foundation Protein Language Model for Thermodynamics and Dynamics Generation: ProTDyn 把蛋白质构象离散成结构 token，用一个 14 亿参数的自回归 Transformer 在同一框架里同时学会"热力学"（采样平衡态构象系综）和"动力学"（生成多时间尺度轨迹），并通过 inpainting 把粗粒度轨迹补成细粒度，从而用一个模型替代昂贵的分子动力学（MD）模拟，且在训练集外的蛋白上仍能泛化。
Protein Structure Tokenization via Geometric Byte Pair Encoding: 提出 GeoBPE——首个将 BPE（字节对编码）从离散文本扩展到连续蛋白质骨架几何的 tokenizer，通过交替执行"局部合并（k-medoids聚类+量化）"和"全局校正（可微逆运动学）"构建层次化结构 motif 词汇表，以 >10× 压缩比和 >10× 数据效率超越 VQ-VAE 类 PST，在 12 个下游任务 24 个测试集上排名第一。
ProteinAE: Protein Diffusion Autoencoders for Structure Encoding: ProteinAE 用一个非等变的 Diffusion Transformer，把蛋白质骨架坐标直接在 E(3) 空间压成连续紧凑的隐表示，只靠单一流匹配损失端到端训练，重建精度（Cα RMSD）大幅超越现有离散 tokenizer，并在此隐空间上搭建出可与结构域扩散模型抗衡、却快近 10 倍的蛋白质生成模型。
PSDNorm: Temporal Normalization for Deep Learning in Sleep Staging: 本文提出 PSDNorm——一种可直接替换 BatchNorm/InstanceNorm 的归一化层，它在网络内部用 Monge 映射把每个特征图的功率谱密度（PSD）对齐到一个滑动 Riemann 重心 PSD，从而在 10 个数据集、上万被试的睡眠分期任务上取得 SOTA，并且只需 1/4 的标注数据就能达到最强基线的精度。
Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding: 针对 TCR-pMHC 结合预测模型普遍采用「编码器-解码器」架构、而现有可解释方法只会处理自注意力的盲区，本文提出 QCAI：把解码器里非对称的跨注意力矩阵拆解成 query 和 key 两侧残基的重要性分数，并配套构建了带结构真值的 TCR-XAI 基准，在可解释性和预测一致性上都取得 SOTA。
RankFlow: Property-aware Transport for Protein Optimization: RankFlow 不再把蛋白质语言模型（PLM）的嵌入直接接一个回归头去拟合适应度数值，而是学一个能量引导的条件流，把"与性质无关"的 PLM 表征搬运成"与目标性质对齐"的分布，再配上一个可微排序损失（RC2）和一个性质引导的方向门（PSG），在 ProteinGym、PEER、FLIP 三大基准上拿到 SOTA 的排序精度和更强的跨实验泛化。
Readout Representation: Redefining Neural Codes by Input Recovery: 这篇论文提出用“能从神经特征中读出什么”而不是“这个特征由什么输入因果地产生”来定义神经表征，并用视觉与语言模型的扰动特征反演实验表明：同一个输入往往对应特征空间中一大片可恢复区域，表征大小可作为刻画冗余、鲁棒性和单样本可表征性的指标。
Refine Drugs, Don't Complete Them: Uniform-Source Discrete Flows for Fragment-Based Drug Discovery: InVirtuoGen 用「均匀源连续时间离散流」在片段化 SMILES 上生成小分子，把生成范式从「逐步补全」改成「全位置同时精炼」，既在 de novo 生成上刷出更优的质量-多样性帕累托前沿，又靠遗传算法 + PPO 的混合优化在 PMO 基准和先导优化上拿到新 SOTA。
Representing Local Protein Environments with Machine Learning Force Fields: 这篇论文把原本只用来预测能量和受力的机器学习力场（MLFF）的中间层嵌入，重新当作蛋白质局部环境的通用表示来用——只要从冻结的预训练 MLFF 里抽出以某个残基为中心、5Å 邻域内原子的特征，就能零样本地组织出二级结构、氨基酸身份、质子化状态等生化信息，并在 pKa、NMR 化学位移等下游任务上做到 SOTA，还顺带能算似然来给预测打不确定度。
Reverse Distillation: Consistently Scaling Protein Language Model Representations: 针对蛋白质语言模型（PLM）"模型越大性能不一定越好"的反常缩放现象，提出反向蒸馏框架：以小模型表示为基底、用SVD提取大模型正交残差信息，构造Matryoshka嵌套嵌入，使得更大的反向蒸馏模型一致优于更小的，ESM-2 15B经反向蒸馏后首次成为全家族最强。
Riemannian High-Order Pooling for Brain Foundation Models: 针对 EEG 基础模型普遍只用单个 CLS token、丢掉时空二阶统计的问题，本文提出即插即用的黎曼高阶池化头 RHOP：把每个 token 编码成尺度不变的商高斯并嵌入 SPD 流形，再用黎曼高斯（Fréchet 均值 + 切空间协方差）跨 token 聚合，最后稀疏逆协方差化后与 CLS token 拼接分类，在 4 个 EEG 基准、3 种训练范式下都以千级参数量稳定提点。
Riemannian Variational Flow Matching for Material and Protein Design: 本文提出 Riemannian Gaussian Variational Flow Matching（RG-VFM），用黎曼高斯分布把"预测端点"的变分流匹配（VFM）搬到曲面流形上，并用 Jacobi 场证明：相比预测速度的黎曼流匹配（RFM），RG-VFM 的损失天然多了一项曲率相关惩罚，从而提供更强的监督信号；在合成球面/双曲数据以及 MOF 材料、蛋白质骨架生成任务上都稳定优于欧氏和速度型基线。
Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles: RigidSSL 把蛋白质骨架表示为残基级刚体序列，先在 AFDB 静态结构上学习 SE(3) 扰动下稳定的几何先验，再用 MD 轨迹学习真实构象转移，从而提升蛋白质骨架生成、motif scaffolding 和 GPCR 构象 ensemble 生成的设计性、多样性与生物物理合理性。
SAIR: Enabling Deep Learning for Protein-Ligand Interactions with a Synthetic Structural Dataset: SAIR 用 Boltz-1x cofolding 模型对从 ChEMBL/BindingDB 整理出的 104.9 万个蛋白-配体复合物批量折叠，构建出迄今最大的、带实测活性标注的 3D 蛋白-配体结构数据集（524 万个结构），并基于它系统评测了多类结合亲和力预测方法，揭示出现有模型在合成结构上泛化能力不足、亟需针对性微调的现实。
SAVE: A Generalizable Framework for Multi-Condition Single-Cell Generation with Gene Block Attention: SAVE 把单细胞表达谱里的几千个基因按 LLM 语义相似度聚成若干"基因块"，在块粒度上做 Transformer 注意力 + 变分自编码压缩 + 潜空间 Flow Matching 生成，并用 AdaLN 注入条件、用条件掩码统一生成与迁移任务，在条件生成、批次校正、扰动预测三类任务上、尤其在低资源和未见条件组合下显著超过现有方法。
SC-Arena：面向单细胞推理的自然语言基准与知识增强评测: SC-Arena 把"评测 LLM 能不能当一个虚拟细胞"重构成一个自然语言竞技场：用面向对象的"知识细胞类"抽象统一评测目标（属性 + 方法），设计 5 个开放式自然语言任务，并用挂接本体/标记基因数据库/文献的知识增强 LLM 裁判替代脆弱的字符串匹配指标，最终发现当前模型在描述类任务流畅、却在机制/因果类任务（扰动预测、细胞类型标注）系统性翻车。
Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics: 提出 STAR-MD，一个 SE(3) 等变的因果扩散 Transformer，通过联合时空注意力和上下文噪声扰动实现微秒级蛋白质动力学轨迹生成，在 ATLAS 基准上所有指标达到 SOTA，且能稳定外推到训练中未见的微秒时间尺度。
scDFM: Distributional Flow Matching for Robust Single-Cell Perturbation Prediction: 提出 scDFM，基于条件流匹配（CFM）的生成式框架，通过 MMD 正则化保证分布级保真度，并设计 PAD-Transformer 骨干处理噪声稀疏的单细胞数据，在组合扰动预测上比最强基线 CellFlow 的 MSE 降低 19.6%。
SigmaDock: Untwisting Molecular Docking with Fragment-Based SE(3) Diffusion: 把配体拆成"刚体片段"、让生成任务从预测扭转角变成为每个片段预测一个 SE(3) 刚体变换，再用 SE(3) 黎曼扩散把片段重新拼回结合口袋——SigmaDock 在 PoseBusters 上 Top-1（RMSD < 2 Å 且 PB-valid）成功率达 79.9%，是首个在公平 train-test split 下超越经典物理对接方法的深度学习对接模型。
SimpleFold: Folding Proteins is Simpler Than You Think: SimpleFold 把蛋白质折叠当成「氨基酸序列→全原子 3D 结构」的条件生成任务，仅用标准 Transformer 块 + flow-matching 目标训练，彻底丢掉 AlphaFold2 那套 MSA、配对表示、三角更新和等变模块，在 9M 蒸馏结构上把模型规模拉到 3B，在标准折叠基准上逼近 SOTA，并在构象集合生成上表现尤其突出。
SpectraLLM: Uncovering the Ability of LLMs for Molecular Structure Elucidation from Multi-Spectral Data: SpectraLLM 把 IR / Raman / UV-Vis / NMR / MS 等异构光谱统一翻译成自然语言提示，喂给一个 LoRA 微调的 Qwen3，让它端到端地自回归生成分子的 SMILES 结构；在四个公开基准上全面超越各单模态专用 baseline，并且越多光谱联合输入、预测越准。
Structural Prognostic Event Modeling for Multimodal Cancer Survival Analysis: SlotSPE 将病理 WSI 与转录组通路特征压缩成患者自适应的少量 prognostic event slots，再用选择性激活、跨模态重建和迭代 slot 交互完成生存风险预测，在 10 个 TCGA 癌种上取得平均 C-index 0.721，并在基因组缺失时仍保持 0.704 的整体表现。
SubDyve: Subgraph-Driven Dynamic Propagation for Virtual Screening Enhancement: SubDyve 用「类别判别性子图」代替通用分子指纹来建相似度网络，再用局部假发现率（LFDR）引导的迭代种子精炼把少量已知活性分子安全地扩展成更多种子，在只有几十个活性标签的低标签虚拟筛选场景下，于 DUD-E 和千万级 ZINC 库上把早期富集指标（BEDROC / EF1%）大幅拉高。
SYNC: Measuring and Advancing Synthesizability in Structure-Based Drug Design: 这篇论文先用 8 个经典合成性指标在 11 个 SBDD 模型上做基准测试、揭示这些指标互相打架不可靠，进而提出一个轻量的 SE(3) 不变可合成性分类器 SYNC，并把它当作即插即用模块塞进扩散过程（引导扩散 + DPO），在几乎不损失结合亲和力的前提下让生成分子的可合成性大幅提升。
SynCoGen: Synthesizable 3D Molecule Generation via Joint Reaction and Coordinate Modeling: SynCoGen 提出了一种结合掩码图扩散和流匹配的多模态生成框架，能够同时采样分子构建块反应图和3D原子坐标，在保证合成可行性的同时实现高质量的3D分子生成。
Take Note: Your Molecular Dataset Is Probably Aligned: 这篇论文系统性地揭露并量化了 QM9、QMugs、OMol25 等主流分子数据集中"分子并非随机朝向"这一被机器学习新人普遍忽视的陷阱：一个简单分类器就能把原始样本和随机旋转后的样本高精度区分开，神经网络甚至能"只看朝向"就预测出分子性质，从而提醒大家——非等变模型若不做旋转增强，其测试性能会被这种虚假信号人为抬高。
Temporally Detailed Hypergraph Neural ODEs for Disease Progression Modeling: 把临床公认的疾病进展通路建模成"带逐标记时间戳"的时序细化超图（TD-Hypergraph），再用一个由可学习超图拉普拉斯算子驱动的 Neural ODE 来刻画不规则就诊数据下的连续时间进展动力学，在两个真实 EHR 数据集上预测下一次就诊的并发症标记，F1 显著超过 LSTM / Transformer / 时序图网络 / Neural ODE 等多类基线。
Test-Time Adaptation without Source Data for Out-of-Domain Bioactivity Prediction: 针对"拿不到源训练数据、只有一个预训练好的源模型"这种真实药物发现场景，本文提出 TAB——一个测试时自适应框架，用不确定性加权的一致性学习把模型注意力逼向真实结合区域、压制对捷径子结构的依赖，再用对比学习防止表征坍缩，从而在 scaffold / protein / assay 三类分布漂移下都稳定超过需要源数据的 SOTA 方法。
TetraGT: Tetrahedral Geometry-Driven Explicit Token Interactions with Graph Transformer for Molecular Representation Learning: TetraGT 首次把分子的键角、二面角当成显式 token 喂进图 Transformer，用一套受四面体几何约束的"空间四面体注意力"让这些角度 token 直接互相通信，再配上能判别手性的有向循环角损失和层次化虚拟节点，在 PCQM4Mv2、OC20 IS2RE 等量子化学基准上刷到 SOTA，并在 QM9、PDBBind、Peptides、LIT-PCBA 等下游迁移任务上同样领先。
The Human Brain as a Dynamic Mixture of Expert Models in Video Understanding: 作者首次在大规模 EEG（脑电）动态记录上对 110 个视频/图像深度模型做"模型-脑表征对齐"基准，提出跨时间表征相似性分析（CT-RSA）把模型逐帧特征与脑响应逐毫秒匹配，发现大脑在看 3 秒短视频时的神经偏好随时间不断切换（从静态低级→静态高级物体→中级时序动作），不同脑区（后部 vs 额部）和不同时刻偏爱不同类型的模型，因此最佳"对齐模型"不存在于任何单一网络，而更像一个能动态切换的"专家混合体"。
Thompson Sampling via Fine-Tuning of LLMs: 提出 ToSFiT，通过微调大语言模型直接参数化最大概率（Probability of Maximality），将 Thompson Sampling 扩展到大规模非结构化离散空间，避免了获取函数最大化的难题。
Tokenization to Transfer: Do Genomic Foundation Models Learn Good Representations?: 作者把 7 个基因组基础模型（GFM）和它们「权重随机初始化」的同架构对照版本放在 52 个基因组任务上系统对打，发现随机初始化基线强得惊人、预训练的收益被分词器牢牢卡住（字符级几乎不涨、子词级才涨），而且无论是否预训练，这些模型都几乎读不出临床相关的单核苷酸突变——结论是当前照搬 NLP 的预训练范式在基因组上只带来「分词器门控的微弱提升」。
Towards All-atom Foundation Models for Biomolecular Binding Affinity Prediction: 本文把 AlphaFold 3 的架构从"生成式结构预测"改造成"表征学习器"，提出全原子扩散 Transformer ADiT：用统一 tokenization 同时编码蛋白质与小分子、砍掉重条件 trunk 与 MSA/模板依赖、在 PDB 上做去噪预训练，单一模型就在蛋白-配体、药物-靶点、蛋白-蛋白、抗体-抗原四类亲和力任务上达到或逼近 SOTA，并随模型增大稳定提升。
Towards Knowledge-and-Data-Driven Organic Reaction Prediction: RAG-Enhanced and Reasoning-Powered Hybrid System with LLMs: 本文提出 Reaction-Thinker——一个知识与数据双驱动的有机反应预测系统：先用分类器+相似案例检索库把样本分流，有相似案例的走 RAG 路径（把反应类型和类比案例注入提示），没相似案例的走"CoT 推理 + GRPO 强化学习"路径，最终 Exact Match 达 89.86%，超过了所有对比 LLM 乃至传统专用模型（Chemformer 88.13%）。
Towards Understanding the Shape of Representations in Protein Language Models: 本文不去解释蛋白质语言模型（PLM）如何处理单条序列，而是借用形状分析里的平方根速度（SRV）表征和图过滤工具，把"整个蛋白质空间被 PLM 怎样变形"刻画成可度量的几何对象，进而发现 ESM2 的各层表征会先膨胀后收缩，且在倒数第二层附近最忠实地编码三维结构、最擅长捕捉约 2 个和约 8 个残基的局部上下文。
Triangle Multiplication is All You Need for Biomolecular Structure Representations: 这篇论文提出 Pairmixer：在 AlphaFold3/Boltz-1 风格的共折叠模型中去掉昂贵的 triangle attention 和 sequence update，只保留 pair representation 上的 triangle multiplication 与 FFN，就能接近 Pairformer 的结构预测精度，同时显著降低训练、推理和蛋白质设计中的计算开销。
TRIBE: Trimodal Brain Encoder for Whole-Brain fMRI Response Prediction: TRIBE 把文本、音频、视频三个预训练基础模型的中间层表征喂给一个时序 Transformer，端到端地预测被试看视频时全脑 1000 个 parcel 的 fMRI 响应，凭借「非线性 + 跨被试 + 多模态」三位一体的设计在 Algonauts 2025 脑编码竞赛中以明显优势从 267 支队伍中夺冠。
Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct: 提出 DiDi-Instruct，一种基于积分 KL 散度 (IKL) 最小化的蒸馏框架，将预训练的扩散大语言模型 (dLLM) 蒸馏为少步学生模型，通过对抗性密度比估计 + 分组奖励归一化 + 分数分解 + 奖励引导祖先采样器 (RGAS) 四大关键设计，在 OpenWebText 上仅用 16 步即超越 1024 步教师模型的 PPL，实现最高 64× 推理加速，同时训练成本仅需 1 GPU 小时。
Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion: 本文提出 MIG-Vis：先用「群组解耦 VAE」把猕猴 IT 皮层的神经放电编成多个低维 latent 组，再用「互信息引导的确定性 DDIM 编辑」把每组 latent 的微扰可视化成图像变化，从而直接看见高级视觉皮层里哪一簇神经元负责姿态、哪一簇负责类别、哪一簇负责类内细节。
Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge: PVB（Pretrained Variational Bridge）通过编码器-解码器架构结合增强桥匹配，统一了单结构预训练和配对轨迹微调的训练目标，实现了跨领域生物分子轨迹生成，并通过RL微调加速蛋白质-配体holo态探索。
VCWorld: A Biological World Model for Virtual Cell Simulation: 提出 VCWorld，一个细胞级白盒模拟器，整合结构化生物知识图谱与大语言模型的迭代推理能力，以数据高效的方式模拟药物扰动引发的信号级联，生成可解释的逐步预测和显式机制假说，在药物扰动基准上达到 SOTA。
VenusX: Unlocking Fine-Grained Functional Understanding of Proteins: VenusX 是首个面向蛋白质内部细粒度功能理解的大规模基准，把活性位点、结合位点、保守位点、motif、domain、表位这六类残基级注释整理成「残基级二分类 / 片段级多分类 / 成对功能相似度打分」三大任务（共 56 个数据集、87.8 万样本），并用混合家族 / 跨家族两种划分系统评测了一批主流蛋白质模型，揭示出「全局蛋白级表现强 ≠ 细粒度功能理解强」。
Verifier-Constrained Flow Expansion for Discovery Beyond the Data: 提出Flow Expander (FE)，通过验证器约束的熵最大化在概率空间中扩展预训练流模型的覆盖范围，使其生成超越训练数据分布但保持有效性的设计样本，在分子构象设计中增加多样性同时保持化学有效性。
WFR-FM: Simulation-Free Dynamic Unbalanced Optimal Transport: WFR-FM 把 flow matching 扩展到「质量不守恒」的动态不平衡最优传输：在 Wasserstein–Fisher–Rao（WFR）几何下，同时回归一个位移速度场和一个标量生长率函数，用解析的 Dirac-to-Dirac 测地线构造条件路径，从而无需 ODE 仿真就能恢复带细胞增殖/凋亡的单细胞动力学，在轨迹推断的精度、稳定性和效率上全面超过现有 ODE/FM 基线。