跳转至

MAC-AMP: A Closed-Loop Multi-Agent Collaboration System for Multi-Objective Antimicrobial Peptide Design

会议: ICLR 2026
arXiv: 2602.14926
代码: GitHub
领域: 图像生成
关键词: 抗菌肽设计, 多智能体协作, 闭环强化学习, 多目标优化, LLM agent

一句话总结

提出 MAC-AMP,首个闭环多智能体协作系统,将抗菌肽(AMP)设计重构为协调多智能体优化问题,通过 AI 模拟同行评审和自适应奖励设计实现多目标优化。

研究背景与动机

  • 抗菌素耐药性(AMR)危机:2021 年直接导致约 114 万人死亡,预计 2025-2050 年间将直接导致超 3900 万人死亡
  • 现有 AMP 设计模型的局限
    • 大多数仅优化抗菌活性,忽略毒性、稳定性和新颖性
    • 多目标优化不稳定,静态权重容易导致 reward hacking 或多样性崩溃
    • 输出为分散的分数或文本,难以转换为可复现的学习信号
  • 现有多智能体系统的不足
    • 输出多为自然语言,缺乏可训练的优化信号
    • 大多是开环系统,依赖人工干预

方法详解

整体框架

MAC-AMP 包含六个互连模块:输入模块 → 属性预测 → AI 模拟同行评审 → RL 精炼 → 肽段生成 → 输出模块。用户只需提供目标细菌名称和示例数据集。

1. 属性预测模块(Property Prediction)

评估 AMP 的多种属性并分为两类: - 显式奖励信号 \(S\):抗菌活性分数 \(S_a\)(基于 ProtBERT 微调的 MIC 预测器)、AMP 似然分数 \(S_b\)(Macrel 1.5) - 辅助证据 \(V\):毒性分数 \(V_a\)(ToxinPred 3.0)、结构可靠性 \(V_b\)(OmegaFold)、理化性质 \(V_c\)(ProtParam)、模板相似性 \(V_d\)(Foldseek)

2. AI 模拟同行评审模块

  • 三个独立审稿人智能体(GPT-5, Gemini 2.5, Perplexity),从效率、安全性、发育结构和原创性四个维度评估
  • 每个维度关联加权词典子表,使用 Tag 格式 \(\text{ID}(\text{State}, \text{Weight})\) 进行结构化标注
  • Area Chair 智能体:聚合评审结果,解决语义冲突,计算维度级元评分,输出元评审文本 \(T\) 和平均元分数 \(S_c\)

3. RL 精炼模块

  • CS 基础奖励设计智能体:基于可观测信号和数学属性优化奖励函数
  • 生物医学奖励对齐智能体:分析元评审文本,提出基于领域知识的修订建议
  • 候选奖励通过规则验证器过滤 → 沙箱短期训练 → Pareto 优化选择最佳奖励函数
  • 阶段自适应优化:每 15 个 epoch 重新设计奖励函数,共迭代 3 次

4. PPO 优化

标准化优势:\(A = \text{norm}(R - \bar{V}_\phi)\)

裁剪代理损失:

\[L_{policy}(\theta) = \mathbb{E}[\min(r(\theta)A, \text{clip}(r(\theta), 1-\epsilon, 1+\epsilon)A)]\]

总损失函数:

\[L = L_{policy} + c_v L_{value} - c_e L_{ent}\]

其中 \(L_{value}\) 为值回归损失,\(L_{ent}\) 为熵正则化项。

实验关键数据

主实验:目标特异性 AMP 测试

模型 抗菌活性 (↑) AMP 似然 (↑) 毒性 (↓) 结构可靠性 (↑)
MAC-AMP 0.943±0.008 0.797±0.012 0.154±0.008 0.873±0.009
AMP-Designer 0.807±0.021 0.811±0.011 0.251±0.024 0.817±0.017
BroadAMP-GPT 0.831±0.025 0.821±0.018 0.246±0.033 0.763±0.023
PepGAN 0.823±0.023 0.572±0.035 0.247±0.064 0.637±0.026
Diff-AMP 0.822±0.006 0.554±0.036 0.235±0.072 0.752±0.020

E. coli 目标结果

广谱活性测试

模型 E. coli S. aureus P. aeruginosa K. pneumoniae E. faecium
MAC-AMP 0.94 0.81 0.94 0.98 0.95
AMP-Designer 0.81 0.81 0.85 0.96 0.96
PepGAN 0.82 0.89 0.91 0.98 0.96

关键发现

  1. MAC-AMP 在抗菌活性、毒性和结构可靠性上全面超越基线
  2. E. coli 设计的 AMP 在革兰氏阴性菌上泛化优异(共享外膜结构)
  3. 对 E. faecium(革兰氏阳性菌)也展现出强泛化能力
  4. 训练成本:47.61 GPU 小时,853 API 调用,API 费用 $36.56

亮点与洞察

  1. 首创闭环多智能体系统:将自然语言评审共识转化为可执行的 RL 奖励信号,打破了输出格式与训练信号之间的鸿沟
  2. 全链路可解释性:通过透明日志、重放轨迹和共识感知决策跟踪,克服了黑盒局限
  3. 跨领域迁移能力:在英语表到文本生成任务上也验证了框架的通用性
  4. 多目标平衡:通过结构化智能体共识而非手动静态权重实现多目标优化

局限性

  • 生成的肽段尚未进行体外实验验证
  • API 调用成本可能限制大规模应用
  • 同行评审模块依赖特定商业 LLM,可复现性受限
  • 阶段数(15 epochs)和迭代次数(3 次)为超参数,可能需要针对不同任务调整

相关工作

  • AMP 生成:AMPGAN v2, Diff-AMP, AMP Designer
  • LLM 多智能体协作:Virtual Lab, CAMEL, AutoGen, ReviewAgents
  • LLM 增强 RL:RLAIF, Eureka

评分

  • 新颖性:⭐⭐⭐⭐ — 首个将闭环多智能体协作用于分子设计的框架
  • 技术深度:⭐⭐⭐⭐ — 模块化设计精细,多层次验证充分
  • 实验完整性:⭐⭐⭐⭐ — 五种细菌目标、四个基线、多维消融
  • 实用价值:⭐⭐⭐⭐ — 可扩展至其他分子设计任务