MAC-AMP: A Closed-Loop Multi-Agent Collaboration System for Multi-Objective Antimicrobial Peptide Design¶
会议: ICLR 2026
arXiv: 2602.14926
代码: GitHub
领域: 图像生成
关键词: 抗菌肽设计, 多智能体协作, 闭环强化学习, 多目标优化, LLM agent
一句话总结¶
提出 MAC-AMP,首个闭环多智能体协作系统,将抗菌肽(AMP)设计重构为协调多智能体优化问题,通过 AI 模拟同行评审和自适应奖励设计实现多目标优化。
研究背景与动机¶
- 抗菌素耐药性(AMR)危机:2021 年直接导致约 114 万人死亡,预计 2025-2050 年间将直接导致超 3900 万人死亡
- 现有 AMP 设计模型的局限:
- 大多数仅优化抗菌活性,忽略毒性、稳定性和新颖性
- 多目标优化不稳定,静态权重容易导致 reward hacking 或多样性崩溃
- 输出为分散的分数或文本,难以转换为可复现的学习信号
- 现有多智能体系统的不足:
- 输出多为自然语言,缺乏可训练的优化信号
- 大多是开环系统,依赖人工干预
方法详解¶
整体框架¶
MAC-AMP 包含六个互连模块:输入模块 → 属性预测 → AI 模拟同行评审 → RL 精炼 → 肽段生成 → 输出模块。用户只需提供目标细菌名称和示例数据集。
1. 属性预测模块(Property Prediction)¶
评估 AMP 的多种属性并分为两类: - 显式奖励信号 \(S\):抗菌活性分数 \(S_a\)(基于 ProtBERT 微调的 MIC 预测器)、AMP 似然分数 \(S_b\)(Macrel 1.5) - 辅助证据 \(V\):毒性分数 \(V_a\)(ToxinPred 3.0)、结构可靠性 \(V_b\)(OmegaFold)、理化性质 \(V_c\)(ProtParam)、模板相似性 \(V_d\)(Foldseek)
2. AI 模拟同行评审模块¶
- 三个独立审稿人智能体(GPT-5, Gemini 2.5, Perplexity),从效率、安全性、发育结构和原创性四个维度评估
- 每个维度关联加权词典子表,使用 Tag 格式 \(\text{ID}(\text{State}, \text{Weight})\) 进行结构化标注
- Area Chair 智能体:聚合评审结果,解决语义冲突,计算维度级元评分,输出元评审文本 \(T\) 和平均元分数 \(S_c\)
3. RL 精炼模块¶
- CS 基础奖励设计智能体:基于可观测信号和数学属性优化奖励函数
- 生物医学奖励对齐智能体:分析元评审文本,提出基于领域知识的修订建议
- 候选奖励通过规则验证器过滤 → 沙箱短期训练 → Pareto 优化选择最佳奖励函数
- 阶段自适应优化:每 15 个 epoch 重新设计奖励函数,共迭代 3 次
4. PPO 优化¶
标准化优势:\(A = \text{norm}(R - \bar{V}_\phi)\)
裁剪代理损失:
\[L_{policy}(\theta) = \mathbb{E}[\min(r(\theta)A, \text{clip}(r(\theta), 1-\epsilon, 1+\epsilon)A)]\]
总损失函数:
\[L = L_{policy} + c_v L_{value} - c_e L_{ent}\]
其中 \(L_{value}\) 为值回归损失,\(L_{ent}\) 为熵正则化项。
实验关键数据¶
主实验:目标特异性 AMP 测试¶
| 模型 | 抗菌活性 (↑) | AMP 似然 (↑) | 毒性 (↓) | 结构可靠性 (↑) |
|---|---|---|---|---|
| MAC-AMP | 0.943±0.008 | 0.797±0.012 | 0.154±0.008 | 0.873±0.009 |
| AMP-Designer | 0.807±0.021 | 0.811±0.011 | 0.251±0.024 | 0.817±0.017 |
| BroadAMP-GPT | 0.831±0.025 | 0.821±0.018 | 0.246±0.033 | 0.763±0.023 |
| PepGAN | 0.823±0.023 | 0.572±0.035 | 0.247±0.064 | 0.637±0.026 |
| Diff-AMP | 0.822±0.006 | 0.554±0.036 | 0.235±0.072 | 0.752±0.020 |
E. coli 目标结果
广谱活性测试¶
| 模型 | E. coli | S. aureus | P. aeruginosa | K. pneumoniae | E. faecium |
|---|---|---|---|---|---|
| MAC-AMP | 0.94 | 0.81 | 0.94 | 0.98 | 0.95 |
| AMP-Designer | 0.81 | 0.81 | 0.85 | 0.96 | 0.96 |
| PepGAN | 0.82 | 0.89 | 0.91 | 0.98 | 0.96 |
关键发现¶
- MAC-AMP 在抗菌活性、毒性和结构可靠性上全面超越基线
- E. coli 设计的 AMP 在革兰氏阴性菌上泛化优异(共享外膜结构)
- 对 E. faecium(革兰氏阳性菌)也展现出强泛化能力
- 训练成本:47.61 GPU 小时,853 API 调用,API 费用 $36.56
亮点与洞察¶
- 首创闭环多智能体系统:将自然语言评审共识转化为可执行的 RL 奖励信号,打破了输出格式与训练信号之间的鸿沟
- 全链路可解释性:通过透明日志、重放轨迹和共识感知决策跟踪,克服了黑盒局限
- 跨领域迁移能力:在英语表到文本生成任务上也验证了框架的通用性
- 多目标平衡:通过结构化智能体共识而非手动静态权重实现多目标优化
局限性¶
- 生成的肽段尚未进行体外实验验证
- API 调用成本可能限制大规模应用
- 同行评审模块依赖特定商业 LLM,可复现性受限
- 阶段数(15 epochs)和迭代次数(3 次)为超参数,可能需要针对不同任务调整
相关工作¶
- AMP 生成:AMPGAN v2, Diff-AMP, AMP Designer
- LLM 多智能体协作:Virtual Lab, CAMEL, AutoGen, ReviewAgents
- LLM 增强 RL:RLAIF, Eureka
评分¶
- 新颖性:⭐⭐⭐⭐ — 首个将闭环多智能体协作用于分子设计的框架
- 技术深度:⭐⭐⭐⭐ — 模块化设计精细,多层次验证充分
- 实验完整性:⭐⭐⭐⭐ — 五种细菌目标、四个基线、多维消融
- 实用价值:⭐⭐⭐⭐ — 可扩展至其他分子设计任务