跳转至

Auditing Sybil: Explaining Deep Lung Cancer Risk Prediction Through Generative Interventional Attributions

会议: ICML 2026
arXiv: 2602.02560
代码: 暂未公开
领域: 医学图像 / 可解释 AI / 因果归因
关键词: 肺癌筛查, Sybil, 反事实解释, 扩散桥, Shapley 交互, 干预审计

一句话总结

本文提出 S(H)NAP——基于 3D 扩散桥的「移除 + 插入」生成式干预框架,把 Sybil 这一前沿肺癌风险预测模型的决策反向拆解为「肺结节主效应 + 两两交互 + 背景」的 LMPI(线性+二阶交互模型),首次以因果而非相关的方式审计出它对 ECG 电极、衣物金属扣等院内伪影的依赖以及对外周肺结节的「径向不敏感」严重失败模式。

研究背景与动机

领域现状:肺癌仍是全球癌症死亡首因,LDCT 筛查是主流手段;Sybil(Mikhael 2023)作为一款基于单次 CT 预测 6 年风险的深度模型,已在 NLST 等多中心做了观察性临床验证。目前对 Sybil 的"信任"几乎完全建立在 AUC、亚组校准这种纯观察性指标上。

现有痛点:观察指标只能告诉你"模型在数据上好不好",无法告诉你"它为什么好"或"它什么时候会失败"。在高风险医疗部署里,这是一种致命的盲区——它可能依赖了 ECG 电极、扫描床等伪影,可能系统性低估某个解剖位置的结节,但 AUC 数字毫无显示。

核心矛盾:传统归因方法(SHAP/IG/Grad-CAM)要么停留在像素级、违反数据流形,要么是相关性而非因果;视觉反事实(VCE)虽然站在 Pearl 因果阶梯顶端,却只能告诉你"改了什么",不能拆解"每一处具体改动各自贡献多少",无法回答"是哪一个结节驱动了风险"这种临床问题。

本文目标:构造一种生成式干预归因,既保持在 LDCT 数据流形上、又能精确拆解出每个肺结节的主效应和成对交互效应,同时也能探测模型对任意空间位置的敏感性偏置。

切入角度:作者把临床共识当成结构先验——「肺结节才是肺癌风险预测的主要影像生物标志物」——并由此提出 Hypothesis 1:Sybil 的决策可以被一个 LMPI 良好近似,由背景项 \(\mu_\mathbf{x}\) + 结节主效应 + 结节两两交互组成。一旦这条假设站住,"反事实"就等价于"开关某些结节",与扩散桥的可控修复天然合拍。

核心 idea:用 System-Embedded Diffusion Bridges(SDB)对 3D CT 子体做高保真的「结节移除」与「结节插入」干预,把每一种结节联盟都生成出来作为 Sybil 的输入,再用 n-Shapley Values(n=2)回归出 LMPI 系数,从而得到首个针对 Sybil 的因果级审计框架。

方法详解

整体框架

S(H)NAP = SHNAP(解释性归因) + SNAP(敏感性探针)。两条路线共享同一个底层 SDB 干预引擎。SHNAP 走「移除路径」:给定一个真实 CT,把 \(N\) 个肺结节的所有 \(2^N\) 个子集生成出来(被保留的留下、被移除的换成健康组织),对每个生成样本喂给 Sybil 得到风险 logit,最后用 n-SV 把 logit 回归到主效应 \(\phi_i\) 与交互 \(\phi_{ij}\)。SNAP 走「插入路径」:把一个已知性质的结节插到 CT 任意位置,记录预测 logit 的变化 \(\psi_\mathbf{c}=f(y_0\mid\mathbf{x}_{\mathbf{c}\leftarrow\mathbf{r}})-f(y_0\mid\mathbf{x})\),从而生成高分辨率的"空间敏感性"热图。

关键设计

  1. 基于扩散桥的结节移除/插入(SDB-driven In-distribution Intervention):

    • 功能:在保持周围解剖结构原样不动的前提下,分别把目标结节"换成健康肺组织"或"在任意位置生成一个真实结节"。
    • 核心思路:SDB 把扩散过程的终点从纯噪声推广为线性测量 \(\mathbf{x}'=\mathbf{A}\mathbf{x}+\Sigma^{1/2}\varepsilon\),当 \(\mathbf{A}\) 是二值掩码、\(\Sigma=0\) 时退化为专用 inpainting;反向采样只在 mask 区内更新,保证 mask 外严格不变。理论上依靠 Verdú 2009 的"失配估计"定理,得分模型 \(\mathbf{s}_\xi\) 在足够长的扩散时间后会把任意"复制粘贴"或"挖空"输入与训练分布拉到不可区分。移除时 prior 充当健康组织生成器(因结节占肺体积 <0.1%),插入时则把异源结节先粘进 mask、再正向扩散到时刻 \(\tau\)(实验取 0.3)、再反向去噪让它与新背景融合。
    • 设计动机:传统反事实要么用 GAN 一次性翻转标签(损失局部性)、要么粗暴用零/均值填充(脱离流形导致 SHAP 不稳定)。SDB 把"局部修复 + 流形保真"打包成一个数学严谨的操作,且双盲专家研究中放射科医师区分真实组织 vs SDB 移除已与随机猜测无统计差异(point estimate 0.57),证明干预在临床意义上"无痕"。
  2. n-Shapley 回归得到 LMPI 系数(SHNAP):

    • 功能:把 Sybil 在 \(2^N\) 个结节联盟上的 logit 响应拆成 baseline + 每个结节主效应 + 每对结节交互效应。
    • 核心思路:构建数据集 \(D=\{(S,v_\mathbf{x}(S))\}_{\mathbf{x}_S\in\mathcal{X}}\),其中 \(v_\mathbf{x}(S)=f(y_0\mid \mathbf{x}_S)\),再用 SHAP-IQ 在 \(n=2\) 截断的 n-Shapley 公式上回归得到 \(\phi_\emptyset,\phi_i,\phi_{ij}\)。用 \(R^2=1-\sum(v-\hat v_{\text{nSV}})^2/\sum(v-\bar v)^2\) 度量拟合质量;典型 \(N\) 是个位数(每个病人通常只有少量结节),\(2^N\) 评估在临床场景下计算可承受。
    • 设计动机:n-SV 是 LMPI 的唯一最小二乘投影,天然继承 SHAP 的 local accuracy / consistency 公理,让"每个结节贡献多少风险"这一临床问题第一次有了带误差棒、可解读的数字答案。实证显示 \(R^2\) 中位数 \(\approx 1\),证实 Hypothesis 1。
  3. 基于插入的空间敏感性探针(SNAP)+ gSHNAP:

    • 功能:SNAP 在同一例 CT 上把同一颗已知结节插入数千个位置,绘制空间敏感性热图;gSHNAP 把"结节指示符"换成"任意 ROI 指示符",可以审计 Sybil attention 关注的任何非结节区域。
    • 核心思路:SNAP 用 log-odds 差 \(\psi_\mathbf{c}\) 作每点归因;在 240 patient-nodule 组合 × ≈900 插入点上做两路 ANOVA,发现 lobe 主效应显著(\(p<0.001\))而 patient×lobe 交互不显著,证明 lobar bias 是模型的全局特性;进一步用距离-胸膜的线性回归量化"径向衰减"。gSHNAP 则把 attention map 二值化得到 ROI 集合,用同一 SDB-移除流程审查每个 attention 关注区。
    • 设计动机:移除式 SHNAP 只能解释"现有结节",无法发现"模型在没结节的地方依赖了什么"——而真实失败模式恰恰来自院内伪影、扫描架、ECG 电极等"模型不该看的东西"。SNAP/gSHNAP 把审计从"现有 feature"扩展到"任意空间/任意区域",把审计扩展到了反事实空间,能发现传统观察性研究永远看不见的 shortcut。

损失函数 / 训练策略

SDB 走的是 Schrödinger Bridge 离散变体,1000 步、64³ cube、metaballs 程序化生成训练 mask,骨干在 NLST 28K 训练扫描上学得健康组织先验。Sybil 本身保持冻结,整套审计完全 model-agnostic:只用输入-输出对,意味着同款流水线可以直接套到 Optellum 等闭源商业模型上。移除/插入推理各 100 NFE。

实验关键数据

主实验

S(H)NAP 在三组数据上系统审计 Sybil。

数据集 规模 关键发现 临床含义
NLST 28K 训练 / 6K 测试 放射科医师区分真实 vs SDB-移除的健康组织 acc=0.57,统计不可区分 SDB 干预是 in-distribution
LUNA25 4,069 扫描 LMPI 主效应即可达 \(R^2\approx 1\) Hypothesis 1 成立,Sybil 真的是 LMPI
iLDCT 243 OOD 扫描 重症样本中 Sybil 更聚焦结节,但伪影依赖也变明显 失败模式与样本严重度耦合

消融实验

配置 主要观测 解读
SHNAP 主效应(一阶) 多数样本 \(R^2\)\(\approx 1\) Sybil 决策大多被结节独立项就能解释
+ 二阶交互 outlier 几乎完全消除 少数复杂样本存在结节间交互效应
naive 扰动(zero-fill)替代 SDB 归因方差极大、不稳定 OOD 输入会让 SHAP 退化为对抗性噪声
随机肺内 ROI 上的 gSHNAP 重要性分布集中于 0 影响区域是稀疏的,Sybil 并非"对任何扰动都反应"

关键发现

  • 结节径向衰减:用 distance-to-pleura 预测 SNAP 归因得到显著正系数 (\(p<0.001\)),加入结节身份交互后 \(R^2\) 从 0.071 升到 0.455 ——malignant 结节越靠近胸膜被压得越狠,benign 反而无所谓,作者怀疑根源是 3D conv 的 zero-padding;这正好命中 adenocarcinoma 这一肺癌最常见亚型常发生在外周的临床盲区。
  • lobar bias:post-hoc Tukey HSD 显示上肺叶归因显著高于中/下叶 (\(p\le 0.009\)),与 PanCan/Mayo 临床先验吻合;并且 Sybil 正确忽略左右差异。
  • 危险的伪影依赖:gSHNAP 在阴性病例上发现 50% 的预测风险来自胸壁外两枚对称的 ECG 电极,相当于把"做了心电监测"误读为"高风险",类似经典的"hospital tag" shortcut。
  • "对了但理由错":有恶性病例 Sybil 把真实结节归为"反向证据",靠背景特征+结节交互项相互抵消恰好得到正确高风险预测——AUC 看不见的双重失败。

亮点与洞察

  • 把"是否相信一个深度医学模型"的标准从观察性指标提升到 Pearl 因果阶梯顶端的反事实层级,且整套流程 model-agnostic,可平移到任何 CT 风险预测器。
  • 利用临床先验(结节才是主要 biomarker)把通常 \(2^d\) 不可解的 Shapley 问题压缩到 \(2^N\)\(N\) 通常很小),让 LMPI 成为可计算且严谨的"白盒近似"。
  • 用 SNAP 的几十万次插入构造高分辨率空间敏感性图,第一次让"模型在哪儿瞎、在哪儿过敏"变成可视化、可统计检验的实体;这套设计可直接迁移到乳腺癌、皮肤癌等任何病灶驱动型任务。

局限与展望

  • 依赖部分合成数据,虽有专家盲评,仍存生成式伪影风险;理想上需要可证明鲁棒的反事实(作者也提到 Zaher 2026 这个方向)。
  • LMPI 假设在罕见、超大、形态特殊的结节上失效(SDB 重建变差),需要更大体素训练或多尺度 SDB。
  • SNAP 一次插入只能针对单颗结节,多结节 emergent interaction 尚未刻画;同时 SDB 仅在 LDCT 单模态训练,对 PET/MRI 跨模态审计需重训练 prior。

相关工作与启发

  • vs 经典 SHAP / IG:那些方法把 baseline 设成黑色像素或均值图像,违反数据流形导致归因不稳;SHNAP 把 baseline 换成 SDB 生成的"健康肺",让 Shapley 真正落在 in-distribution 上。
  • vs 视觉反事实(DiME、Jeanneret 系列):VCE 只给"翻转后的图",无法解读每个结构贡献;SHNAP 在 VCE 之上叠了 LMPI + n-SV 回归,把"反事实图"升级为"因果归因系数"。
  • vs Mind-the-Pad(Alsallakh 2021):那篇工作从结构上指出 3D conv 的 padding 会造成边界激活衰减;S(H)NAP 用 SNAP 在临床数据上实证了它在 Sybil 上演化成"外周肺癌系统性漏报",把架构缺陷与临床后果连成证据链。

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 首次把生成式扩散桥 + Shapley 交互模型组合用于临床高风险模型审计
  • 实验充分度: ⭐⭐⭐⭐⭐ 三数据集、双盲专家研究、ANOVA、Tukey HSD 全覆盖,统计严谨
  • 写作质量: ⭐⭐⭐⭐ 理论铺垫与实证发现结合紧密,但 SDB 部分对非扩散背景读者门槛偏高
  • 价值: ⭐⭐⭐⭐⭐ 直接揭示 Sybil 部署风险,方法学可平移到其它医学 AI 上线前审计