MAC-AMP: A Closed-Loop Multi-Agent Collaboration System for Multi-Objective Antimicrobial Peptide Design¶

会议: ICLR 2026
arXiv: 2602.14926
代码: GitHub
领域: 图像生成
关键词: 抗菌肽设计, 多智能体协作, 闭环强化学习, 多目标优化, LLM agent

一句话总结¶

提出 MAC-AMP，首个闭环多智能体协作系统，将抗菌肽（AMP）设计重构为协调多智能体优化问题，通过 AI 模拟同行评审和自适应奖励设计实现多目标优化。

研究背景与动机¶

抗菌素耐药性（AMR）危机：2021 年直接导致约 114 万人死亡，预计 2025-2050 年间将直接导致超 3900 万人死亡
现有 AMP 设计模型的局限：
- 大多数仅优化抗菌活性，忽略毒性、稳定性和新颖性
- 多目标优化不稳定，静态权重容易导致 reward hacking 或多样性崩溃
- 输出为分散的分数或文本，难以转换为可复现的学习信号
现有多智能体系统的不足：
- 输出多为自然语言，缺乏可训练的优化信号
- 大多是开环系统，依赖人工干预

方法详解¶

整体框架¶

MAC-AMP 包含六个互连模块：输入模块 → 属性预测 → AI 模拟同行评审 → RL 精炼 → 肽段生成 → 输出模块。用户只需提供目标细菌名称和示例数据集。

1. 属性预测模块（Property Prediction）¶

评估 AMP 的多种属性并分为两类： - 显式奖励信号 $S$：抗菌活性分数 $S_a$（基于 ProtBERT 微调的 MIC 预测器）、AMP 似然分数 $S_b$（Macrel 1.5） - 辅助证据 $V$：毒性分数 $V_a$（ToxinPred 3.0）、结构可靠性 $V_b$（OmegaFold）、理化性质 $V_c$（ProtParam）、模板相似性 $V_d$（Foldseek）

2. AI 模拟同行评审模块¶

三个独立审稿人智能体（GPT-5, Gemini 2.5, Perplexity），从效率、安全性、发育结构和原创性四个维度评估
每个维度关联加权词典子表，使用 Tag 格式 $\text{ID}(\text{State}, \text{Weight})$ 进行结构化标注
Area Chair 智能体：聚合评审结果，解决语义冲突，计算维度级元评分，输出元评审文本 $T$ 和平均元分数 $S_c$

3. RL 精炼模块¶

CS 基础奖励设计智能体：基于可观测信号和数学属性优化奖励函数
生物医学奖励对齐智能体：分析元评审文本，提出基于领域知识的修订建议
候选奖励通过规则验证器过滤 → 沙箱短期训练 → Pareto 优化选择最佳奖励函数
阶段自适应优化：每 15 个 epoch 重新设计奖励函数，共迭代 3 次

4. PPO 优化¶

标准化优势：$A = \text{norm}(R - \bar{V}_\phi)$

裁剪代理损失：

\[L_{policy}(\theta) = \mathbb{E}[\min(r(\theta)A, \text{clip}(r(\theta), 1-\epsilon, 1+\epsilon)A)]\]

总损失函数：

\[L = L_{policy} + c_v L_{value} - c_e L_{ent}\]

其中 $L_{value}$ 为值回归损失，$L_{ent}$ 为熵正则化项。

实验关键数据¶

主实验：目标特异性 AMP 测试¶

模型	抗菌活性 (↑)	AMP 似然 (↑)	毒性 (↓)	结构可靠性 (↑)
MAC-AMP	0.943±0.008	0.797±0.012	0.154±0.008	0.873±0.009
AMP-Designer	0.807±0.021	0.811±0.011	0.251±0.024	0.817±0.017
BroadAMP-GPT	0.831±0.025	0.821±0.018	0.246±0.033	0.763±0.023
PepGAN	0.823±0.023	0.572±0.035	0.247±0.064	0.637±0.026
Diff-AMP	0.822±0.006	0.554±0.036	0.235±0.072	0.752±0.020

E. coli 目标结果

广谱活性测试¶

模型	E. coli	S. aureus	P. aeruginosa	K. pneumoniae	E. faecium
MAC-AMP	0.94	0.81	0.94	0.98	0.95
AMP-Designer	0.81	0.81	0.85	0.96	0.96
PepGAN	0.82	0.89	0.91	0.98	0.96

关键发现¶

MAC-AMP 在抗菌活性、毒性和结构可靠性上全面超越基线
E. coli 设计的 AMP 在革兰氏阴性菌上泛化优异（共享外膜结构）
对 E. faecium（革兰氏阳性菌）也展现出强泛化能力
训练成本：47.61 GPU 小时，853 API 调用，API 费用 $36.56

亮点与洞察¶

首创闭环多智能体系统：将自然语言评审共识转化为可执行的 RL 奖励信号，打破了输出格式与训练信号之间的鸿沟
全链路可解释性：通过透明日志、重放轨迹和共识感知决策跟踪，克服了黑盒局限
跨领域迁移能力：在英语表到文本生成任务上也验证了框架的通用性
多目标平衡：通过结构化智能体共识而非手动静态权重实现多目标优化

局限性¶

生成的肽段尚未进行体外实验验证
API 调用成本可能限制大规模应用
同行评审模块依赖特定商业 LLM，可复现性受限
阶段数（15 epochs）和迭代次数（3 次）为超参数，可能需要针对不同任务调整

评分¶

新颖性：⭐⭐⭐⭐ — 首个将闭环多智能体协作用于分子设计的框架
技术深度：⭐⭐⭐⭐ — 模块化设计精细，多层次验证充分
实验完整性：⭐⭐⭐⭐ — 五种细菌目标、四个基线、多维消融
实用价值：⭐⭐⭐⭐ — 可扩展至其他分子设计任务