Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=S3kSOFhs5m
项目页: https://qcai.jiarui.li/
代码: 待确认
领域: 计算生物学 / 可解释AI / Transformer
关键词: TCR-pMHC 结合, 跨注意力, 后验可解释性, 编码器-解码器, 免疫学

一句话总结¶

针对 TCR-pMHC 结合预测模型普遍采用「编码器-解码器」架构、而现有可解释方法只会处理自注意力的盲区，本文提出 QCAI：把解码器里非对称的跨注意力矩阵拆解成 query 和 key 两侧残基的重要性分数，并配套构建了带结构真值的 TCR-XAI 基准，在可解释性和预测一致性上都取得 SOTA。

研究背景与动机¶

领域现状：T 细胞通过表面受体 TCR 识别由 MHC 分子递呈的抗原肽（合称 pMHC），这一结合的特异性是适应性免疫的核心，对疫苗设计和个性化癌症疗法都至关重要。近年来 TULIP、Cross-TCR-Interpreter、TCR-BERT 等 Transformer 模型把 TCR-pMHC 结合预测推到了很高的精度，其中 SOTA 模型（如 TULIP）采用编码器-解码器结构，用解码器里的跨注意力来建模 CDR3α、CDR3β、肽三条序列之间的相互作用。

现有痛点：这些模型是黑箱，只给结合/不结合的预测，却说不清「到底是哪些残基在起作用」。而免疫学研究真正想知道的恰恰是机制——哪个残基插进了哪个口袋、为什么这个 TCR 亲和力更高。现有的后验可解释方法（AttnLRP、TokenTM、AttCAT 等）几乎都是为纯编码器、自注意力模型设计的，无法解释解码器的跨注意力。

核心矛盾：自注意力的注意力矩阵是方阵 \(A \in \mathbb{R}^{N\times N}\)，Q、K、V 同源，可以直接把行/列当作 token 重要性来读；但跨注意力里 Q 来自一个模态、K/V 来自另一个模态，注意力矩阵变成非方阵 \(A \in \mathbb{R}^{N\times N'}\)，融合了两个模态的信息，无法直接归因到某一侧的 query token。这种不对称性正是现有方法绕不过去的坎。

本文目标：① 设计一个能解释任意编码器-解码器 Transformer 跨注意力的后验方法；② 解决 XAI 在免疫学场景「没有定量真值、只能凭直觉评判」的难题。

切入角度：作者借鉴 GradCAM 的「梯度×激活」思路定位重要的注意力项，再用矩阵伪逆把非方阵注意力的贡献「反解」回 query/key 两侧；同时利用实验测定的晶体结构，把「残基间物理距离」当作结合重要性的客观真值。

核心 idea：用梯度加权的跨注意力图，加上伪逆驱动的 query/key 解耦，把不对称的跨注意力定量拆回到每条输入序列的残基级重要性。

方法详解¶

整体框架¶

QCAI 是一个后验（post-hoc）解释方法，不改动也不重训目标模型，只在一次前向+反向传播后，从解码器的跨注意力里抽取残基重要性。整条流水线是：把 CDR3α/β 与肽序列喂进编码器-解码器模型（实验用 TULIP），针对目标类别 \(c\) 的损失 \(L_c\) 做反传拿到梯度；先用「梯度×注意力」算出跨注意力重要性图，再把这张非方阵的图沿 query 和 key 两个方向分别拆解成 token 级分数，最后沿模型层逐层聚合，得到每个输入残基的重要性向量；这套分数最终在自建的 TCR-XAI 基准上用结构距离做真值来评测。

%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
    A["输入：CDR3α/β + 肽序列"] --> B["编码器-解码器模型<br/>(如 TULIP) 前向 + 反传 ∂Lc"]
    B --> C["跨注意力重要性图<br/>梯度×注意力 (GradCAM 式)"]
    C --> D["Query/Key 不对称分解<br/>伪逆消去 K"]
    D --> E["跨层聚合<br/>注意力流 + 逐元素 max"]
    E --> F["残基级重要性分数"]
    F --> G["TCR-XAI 基准 + BRHR<br/>结构距离作 ground truth"]

关键设计¶

1. 跨注意力重要性图：用梯度×注意力锁定关键注意力项

直接读跨注意力矩阵不靠谱，因为高注意力权重未必对预测有贡献。受 GradCAM 启发，QCAI 用「类别损失对注意力矩阵的梯度」来加权注意力本身，定义重要性图

\[S(A_l) = \mathbb{E}_H\!\left[\mathrm{ReLU}\!\left(\frac{\partial L_c}{\partial A_l} \odot A_l\right)\right] + I \in \mathbb{R}^{N\times N'},\]

其中 \(\mathbb{E}_H\) 是对所有注意力头取平均，\(\odot\) 是逐元素乘，\(I\) 是为残差连接补的单位阵。这样只有「权重高且对类别损失贡献大」的注意力项才会被高亮，避免了「权重大但对预测无关」的误判。ReLU 保证只保留正向贡献。这一步给出的是注意力矩阵层面的重要性，下一步要把它拆回到输入 token。

2. Query/Key 不对称分解：用伪逆把非方阵注意力反解回两侧残基

这是 QCAI 的技术核心，专门对付跨注意力非方阵、无法直接归因的难题。作者把每一侧的重要性都拆成两部分：内在重要性和注意力调制后的重要性。

对 query 侧，内在重要性同样用 GradCAM 式 \(S(Q_l)=\mathrm{ReLU}(\frac{\partial L_c}{\partial Q_l}\odot Q_l)\)，再沿特征维取列最大得到 token 级分数 \(\omega_l^Q\)。但内在分数没体现 Q 在注意力里如何被调制，于是定义注意力调制重要性 \(S(Q_l;A_l)\propto \frac{\partial L_c}{\partial A_l}\cdot Q_l\)。由于 \(A_l = Q_l K_l^\top\)，要从 \(S(A_l)\) 里隔离出 \(Q_l\) 的影响就得「消掉 \(K_l^\top\)」，而 \(K_l\) 通常既非方阵也不可逆，作者用 Moore-Penrose 伪逆：

\[\frac{\partial L_c}{\partial A_l}\cdot Q_l = S(A_l)\cdot K_l\,(K_l^\top K_l)^{-1}\in\mathbb{R}^{N\times d}.\]

取列最大得 \(\omega_l^A\)，最后逐元素取两者最大 \(S(Q_l;A_l)=\max(\omega_l^A,\omega_l^Q)\)，以兼顾「Q 还受其他层影响」的保守估计。key 侧同理拆成 \(S(K_l)\) 与注意力派生的 \(\omega_l^{A\prime}\)，但因为注意力本就把 query 显式映射进 key 空间，key 侧不需要伪逆，可直接在注意力矩阵上跨所有 query 与注意力头取最大，再 \(S(K_l;A_l)=\max(\omega_l^{A\prime},\omega_l^K)\)。这种「内在 + 注意力调制取 max」的保守组合，比单看其中一项更鲁棒。

3. 跨层聚合：沿注意力流把重要性回传到输入残基

单层的重要性还不够，要把它从输出端逐层回传到原始输入。借鉴 attention flow，QCAI 从输出层往回遍历：设 \(k\) 是回溯时遇到的第一个带跨注意力的解码器层，比它更靠前的层都按自注意力处理。聚合按递推式进行：\(\tilde S_k = S(Q_k;A_k)\cdot \tilde S_{k+1}\)（query 路）与 \(S(K_k;A_k)\cdot \tilde S_{k+1}\)（key 路）。当模型有多个含跨注意力的解码器块、重要性会在不同点发散又汇合时，作者改用逐元素取最大 \(\tilde S_k=\max(S(\cdot;A_k),\tilde S_{k+1})\) 的保守策略，保留最强的归因信号。这样只要解释路径里出现过任意一个跨注意力解码器块，QCAI 最终就能输出一个 token 级重要性向量，标明每个输入残基对预测的贡献。

4. TCR-XAI 基准与 BRHR 指标：用晶体结构距离给可解释性定量真值

免疫学场景的 XAI 一直缺客观评测——「解释符不符合直觉」很难量化。作者收集了 274 个实验测定的 TCR-pMHC 晶体结构（来自 STCRDab 与 TCR3d 2.0，其中 MHC-I 占 77.7%、MHC-II 占 22.3%），只保留 TCR α/β 链完整、肽序列与 CDR3 区完整的样本，构成 TCR-XAI 基准。对每个样本计算残基级最近原子距离，距离越小代表相互作用越强，以此作为结合重要性的真值（依据是稳定的蛋白-蛋白界面有明确的距离阈值，越过则界面不稳定）。在此之上提出 BRHR（Binding Region Hit Rate，结合区命中率）：选一个百分位阈值 \(t\in(0,1]\)，取重要性最高的前 \(t\) 比例残基，若其相互作用距离也落在前 \(t\) 比例则记为命中，对每条序列求命中率再在全基准取均值。BRHR 直接衡量「解释挑出来的残基有多少真的是物理结合残基」，让跨注意力解释第一次能被定量评判。

实验关键数据¶

实验在 SOTA 的 TULIP 模型上展开（编码器-解码器、并行处理 CDR3α/CDR3β/肽三模态），对比 AttnLRP、TokenTM、AttCAT、Rollout、GradCAM、LRP、RawAttn 等后验方法；这些对比方法不支持跨注意力，只能作用在自注意力层。

主实验：扰动实验（Table 1）¶

扰动实验把重要性最高的前 \(k\) 个 token 替换成 <PAD>（CDR3α/β 取 \(k=4\)、肽取 \(k=7\)，对齐平均结合残基数），用 LOdds（越负越好，表示扰动重要残基后置信度掉得越多）和 AOPC（越大越好）衡量。

方法	CDR3a LOdds	CDR3b LOdds	Peptide LOdds	Peptide AOPC
QCAI (本文)	-3.328	-3.498	-1.470	0.013
AttnLRP	-2.481	-2.662	-0.017	0.000
GradCAM	-2.700	-3.112	-1.004	0.009
LRP	-2.938	-3.127	-1.167	0.011
RawAttn	-2.734	-3.250	-0.691	0.010

QCAI 在 CDR3b 和肽链上取得最负的 LOdds 与最高的 AOPC；尤其在肽链上，其他方法的 LOdds 几乎接近 0（如 AttnLRP 仅 -0.017），说明它们根本没抓到肽侧的关键残基，而 QCAI 达到 -1.470，差距明显。

ROC 与命中率分析¶

链	QCAI ROC-AUC
CDR3a	0.5492
CDR3b	0.5489
Peptide	0.6024

在 3–6 Å 的结合距离阈值区间内，QCAI 的 ROC-AUC 在所有链、所有阈值上都超过对比方法，肽链上更突破 0.6，说明其重要性分数与底层结构结合关系高度一致。BRHR 曲线（Figure 3）上 QCAI 在实用区间全面领先；肽链在 50 百分位前持续最优，50 百分位后其他方法看似反超但伴随高假阳率（与 ROC 结论吻合），作者归因于它们只能用编码器自注意力、拿不到跨注意力的调控信息。

关键发现¶

跨注意力信息是涨点关键：对比方法被剥掉跨注意力后，在肽链等跨模态相互作用最强的位置表现最差，证明解码器跨注意力承载了 TCR↔肽的核心交互。
case study 验证机制：在流感免疫显性肽（1OGA/5TEZ）案例中，QCAI 找到了插进 HLA-A2 凹槽的 CDR3b 关键残基（R98/W99）及其侧翼位点，并通过 5TEZ 更长、约束更弱的 CDR3a 解释了它比 1OGA 低 25 倍的亲和力；类风湿关节炎自抗原（8TRR/8TRQ）案例中也定位到 CDR3a 发夹区，且 AttnLRP/TokenTM 在这些位置给出的分数明显偏弱甚至失效。
对微小序列变化敏感：在仅差两个氨基酸的 2PXY/2Z31 复合物上，QCAI 对肽给出相似分数、对 CDR3b 给出不同模式，能检出细微变化带来的接触位点差异。

亮点与洞察¶

伪逆解非方阵注意力是最巧妙的一招：用 Moore-Penrose 伪逆 \(K_l(K_l^\top K_l)^{-1}\) 消掉非方阵、不可逆的 \(K_l^\top\)，把「无法归因」的跨注意力硬生生反解回 query 空间——这个数学技巧可直接迁移到任意带跨注意力的视觉/NLP 解码器解释。
「内在 + 注意力调制」逐元素取 max 的保守组合，承认单一来源可能漏掉信号，是个简单但鲁棒的工程取舍。
把物理距离当 XAI 真值：TCR-XAI 用晶体结构距离把「解释好不好」从主观直觉变成可量化指标（ROC-AUC、BRHR），为免疫学 XAI 立了一个可复用的评测范式。
方法是纯后验的，不碰原模型权重，可即插即用到 TULIP、MixTCRpred 等任意编码器-解码器结合预测器。

局限性 / 可改进方向¶

ROC-AUC 绝对值偏低（CDR3a/b 仅约 0.55），说明即便 SOTA，跨注意力解释与真实结合位点的吻合度仍有限，距离「可直接指导实验」尚远。
真值仅用「最近原子距离」作代理，忽略了疏水接触、离子键、构象熵等非距离因素；作者也承认未来想引入 REF15 等能量函数做更精细的真值。
BRHR 在高百分位区间会被假阳率高的方法「反超」，指标本身对阈值选择敏感。
解释质量对序列微小变化敏感（2PXY/2Z31 案例），鲁棒性有待加强；目前主要在 TULIP 上验证，跨模型/跨任务泛化性还需更多实验。

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首个面向编码器-解码器跨注意力的后验解释方法，伪逆解非方阵注意力是真正的新点。
实验充分度: ⭐⭐⭐⭐ 多指标（LOdds/AOPC/ROC/BRHR）+ 多 case study 验证，但主要绑定 TULIP 单一模型。
写作质量: ⭐⭐⭐⭐ 公式推导清晰、动机扎实；部分推导步骤（伪逆、聚合）略密集。
价值: ⭐⭐⭐⭐⭐ 既补上跨注意力可解释的方法空白，又留下 TCR-XAI 这一可复用的免疫学 XAI 基准。