HyCAS:用混合卷积与注意力随机性,同时打通认证鲁棒与经验鲁棒¶
会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=sYk9GaFHEf
代码: https://github.com/misti1203/HyCAS
领域: AI 安全 / 对抗鲁棒性
关键词: 认证鲁棒性, 随机平滑, Lipschitz 约束, 谱归一化, 经验鲁棒性, 医学影像
一句话总结¶
HyCAS 把确定性的 1-Lipschitz 谱归一化卷积,和两类架构内部随机性(谱归一化随机投影 + 随机注意力噪声)耦合成一个全局 ≤2-Lipschitz 的随机化网络,从而在同一个模型里同时拿到可证明的 ℓ₂ 认证半径,和对强 ℓ∞ 攻击(APGD/AutoAttack)的经验鲁棒性。
研究背景与动机¶
对抗鲁棒性长期分裂成两条互不相通的路线:经验防御(以对抗训练为代表)能扛住 ℓ∞ 大扰动攻击,但给不出任何理论保证,常被精心设计的自适应攻击一击即破,陷入"猫鼠游戏";认证防御(确定性 Lipschitz 约束、随机平滑 RS)能给出"半径 r 内预测不变"的可证明保证,但代价高昂——随机平滑要么用大噪声预算换大半径却牺牲干净精度,要么用小噪声只能认证很窄的 ℓ₂ 半径,且其保证只针对 ℓ₂ 范数,对 ℓ∞ 攻击形同虚设。
核心矛盾在于:确定性 Lipschitz 网络虽然鲁棒,却暴露了一个固定的梯度场,攻击者可以稳定地沿它寻找对抗样本;而纯输入噪声的随机平滑又被自适应攻击通过"对内部噪声求平均"绕过。更糟的是,大多数随机化防御只在自然图像上验证,几乎没人在医学影像这类高风险分布上、用 SOTA 经验攻击同时考核认证与经验两侧。
本文目标是造一个单一架构,既保留随机平滑的形式化认证,又能扛强 ℓ∞ 攻击,还能跨多种成像基准泛化。核心 idea:把随机性注入到架构内部而非只在输入端——用确定性的 1-Lipschitz 骨干保证最坏情况界,再叠两层数据无关的随机平滑模块,让攻击者每次前向看到的梯度场都在变,整体仍被严格控制在 ≤2-Lipschitz,从而推出一个简单的基于 margin 的 ℓ₂ 证书。
方法详解¶
整体框架¶
HyCAS 把标准 CNN 骨干里的每个卷积层替换成三条并行的 Lipschitz 受限随机流:FDPAN(频率感知确定性投影 + 注意力噪声)、SNCAN(谱归一化卷积 + 注意力噪声)、RPFAN(随机投影滤波 + 注意力噪声)。每条流都由"确定性 1-Lipschitz 核 + 随机注意力残差(RANI)"构成,单独 ≤2-Lipschitz;三条流再经一个数据无关的逐通道凸门 \(\alpha_{b,c}\) 融合,凸组合是非扩张映射,所以融合后以及堆叠后的整网仍 ≤2-Lipschitz。最终模型在内部随机性 \(\Omega=(\xi,\psi,M_\omega)\) 和输入高斯噪声 \(\varepsilon\sim\mathcal N(0,\sigma^2 I)\) 上取期望,得到平滑分类器 \(g_\theta(x)=\arg\max_c P_{\varepsilon,\Omega}[f_\theta(x+\varepsilon;\Omega)=c]\)。
flowchart LR
X[输入 x + 高斯噪声 ε] --> F[FDPAN<br/>频率截断+正交Jacobian]
X --> S[SNCAN<br/>谱归一化卷积]
X --> R[RPFAN<br/>谱归一化随机投影]
F --> RA1[RANI 注意力噪声]
S --> RA2[RANI 注意力噪声]
R --> RA3[RANI 注意力噪声]
RA1 --> G[逐通道凸门 α 融合<br/>≤2-Lipschitz]
RA2 --> G
RA3 --> G
G --> RA4[融合后再注一次 RANI]
RA4 --> C[margin 证书 r₂=Δ/4]
关键设计¶
1. RANI:把确定性梯度场"搅浑"的随机注意力噪声残差。 这是贯穿三条流的核心随机化原语,专治"1-Lipschitz 网络梯度场固定可被利用"的痛点。给定确定性特征 \(h\in\mathbb R^{H\times W\times C}\),RANI 每次前向都独立采一份噪声 \(\omega\sim\mathcal N(0,I)\),生成一个与特征无关、取值落在 \([0,1]^d\) 的有界注意力掩码 \(M_\omega\),再做 Hadamard 调制 \(\hat h = h\odot M_\omega\)。因为对角矩阵 \(D_\omega=\mathrm{diag}(M_\omega)\) 的每个元素都在 \([0,1]\),有 \(\|D_\omega\|_2\le1\),于是残差映射 \(I+D_\omega\) 的谱范数 \(\le2\)——这恰好把一个 1-Lipschitz 的确定性块抬成 2-Lipschitz 的随机化块(Lemma 1)。关键在于噪声是每次前向重采、且在训练和推理都注入,攻击者无法通过对噪声求期望来还原一个稳定梯度,这正是经验鲁棒性提升的来源。
2. 三流分工:频率、谱、随机投影各防一类漏洞。 SNCAN 最直接,把每个卷积换成谱归一化卷积(SNC,\(\|K_e\|_{op}\le1\))再叠 RANI,输出 \(G_{\text{SNCAN}}=(I+D_\omega)C_{K_e}(x)\),在保住 1-Lipschitz 最坏界的同时引入梯度扰动。FDPAN 针对"对抗扰动藏在高频 DCT 系数 + 跨模型通用的通道梯度规律":它是四级级联——低通 DCT 掩码(切掉脆弱高频)→ 正交 Jacobian \(1\times1\) 矩阵打乱通道梯度 → SNC 控谱 → RANI 注噪,确定性核写成 \(H(x)=C_{K_e}(U\Phi^\top(\Lambda\odot\Phi x))\)(\(\Phi\) 是正交 DCT,\(\Lambda\) 是低通掩码,\(U\) 是正交通道混合),再叠两段独立 RANI 仍 ≤2-Lipschitz。RPFAN 继承随机投影滤波(RPF)的 Johnson–Lindenstrauss 嵌入保证,加了"能量守恒通道预混(正交 \(U\) 让各通道等能量进入投影空间)"和"逐样本两步幂迭代谱归一化"两个创新让投影严格 1-Lipschitz,再叠 RANI——于是同时获得来自随机投影本身和来自 RANI 的双重随机性。三条流互补,共同覆盖频域、谱域、投影域的攻击面。
3. 凸门融合 + margin 证书:把"≤2-Lipschitz"翻译成可证半径。 三流输出由可学习、数据无关的 logit \(\lambda_{b,c}\) 经 softmax 得到凸权 \(\alpha_{b,c}=\frac{\exp(\lambda_{b,c})}{\sum_{b'}\exp(\lambda_{b',c})}\)(满足 \(\sum_b\alpha_{b,c}=1,\alpha_{b,c}\ge0\))融合。凸组合非扩张,故 \(\mathrm{Lip}(x\mapsto z(x))\le\max_b\mathrm{Lip}(G_b)\le2\)(Prop. 4),且对 \(\Omega\) 取期望不改变 Lipschitz 常数(Lemma 2),所以期望 logit 映射 \(Z(x)=\mathbb E_\Omega[s_\theta(x;\Omega)]\) 仍 ≤2-Lipschitz。由此推出 HyCAS 的逐点 ℓ₂ 证书(Corollary 1):设 top-2 logit 间隔 \(\Delta(x)=Z^{(1)}(x)-Z^{(2)}(x)\),则 \(r_2(x)=\frac{\Delta(x)}{4}\) 是有效认证半径——任何 \(\|\delta\|_2<r_2(x)\) 都不会改变预测。门是数据无关的,会自动下调高敏感流的权重,进一步削弱朴素攻击。整网用 \(\mathcal L_{\text{HyCAS}}=\zeta\odot\mathcal L_{\text{FDPAN}}+\varphi\odot\mathcal L_{\text{SNCAN}}+\nu\odot\mathcal L_{\text{RPFAN}}+\kappa\odot\mathcal L_{\text{RANI}}\)(各系数可学习)联合优化。
实验关键数据¶
主实验:认证鲁棒(ℓ₂ 在预设半径 r 的认证精度 %)¶
CIFAR-10 与 ImageNet(节选 σ=0.50):
| 方法 | 数据集 | r=0.0 | r=0.75 | r=1.5 | r=2.0 |
|---|---|---|---|---|---|
| RS | CIFAR-10 | 65.2 | 32.4 | 9.34 | 0 |
| ARS | CIFAR-10 | 78.4 | 38.9 | 19.7 | 8.47 |
| HyCAS | CIFAR-10 | 80.7 | 44.3 | 23.4 | 12.5 |
| ARS | ImageNet | 68.1 | 43.4 | 30.6 | 22.4 |
| HyCAS | ImageNet | 69.2 | 45.6 | 32.7 | 24.8 |
医学/人脸数据(r=1.0 认证精度):CelebA 36.9%、HAM10000 38.5%、NIH-CXR 41.4%,在 NIH-CXR 上比最强基线 ARS 高 +3.5–7.3%,干净精度也持平或更高。
主实验:经验鲁棒(ℓ∞ 攻击下 robust accuracy %,节选 ε=16/255)¶
| 方法 | NIH-CXR APGD-20 | NIH-CXR AA-20 | HAM10000 APGD-20 | EyePACS APGD-20 |
|---|---|---|---|---|
| AT | 66.9 | 64.1 | 46.5 | 50.1 |
| CTRW | 73.1 | 72.6 | 52.8 | 57.7 |
| HyCAS | 77.3 | 74.4 | 55.3 | 60.5 |
HyCAS 比次优经验防御 CTRW 高约 +1.5–4.2%,比认证防御 ARS/DRS 在强扰动下领先 +12% 以上。
关键发现¶
- 噪声级 σ 是可调旋钮:σ 从 0.25→0.50,CIFAR-10 在 r=0.75 几乎不变(44.3%),但 r=2.0 从 8.52%→12.5%;ImageNet 在 r=2.0 从 5.42%→24.8%——给出可控而非固定的精度-鲁棒前沿。
- 抗强攻击不崩:在 CIFAR-10/100 上随 APGD 扰动从 ε=0.01→0.08、迭代从 10→100 步增强,所有基线(含 TRADES、HR)单调退化,HyCAS 始终在最优包络,100 步时仍领先最近竞争者 7–12%。
- 认证-经验 Pareto 前沿揭示两个固有现象:小扰动区经验曲线明显高于认证曲线(证书天然保守),大半径区差距进一步拉大(ℓ₂ 保证难转 ℓ∞ 的"范数错配尾隙")。
亮点与洞察¶
- 把随机性"搬进架构内部"是关键转折:传统随机平滑只在输入端注噪,确定性 Lipschitz 防御内部又完全确定;RANI 在每个谱归一化块后、以及融合输出处都注入数据无关随机注意力,既保住形式化证书又打散了攻击者依赖的固定梯度场。
- "确定性核 + 随机残差"是个优雅的 Lipschitz 记账法:1-Lipschitz 核加上谱范数 ≤1 的残差,三角不等式直接给出 ≤2 的整体界,证明简单且模块可堆叠,凸门融合不增加常数。
- 真正在医学影像上验证:CelebA/HAM10000/NIH-CXR/NCT-CRC-HE-100K/EyePACS 等高风险分布上同时考核认证与经验鲁棒,补上了该领域长期缺失的评测。
局限与展望¶
- 证书是 ℓ₂ 的,而强经验攻击是 ℓ∞,论文自己的 Pareto 图就显示存在"范数错配尾隙"——ℓ₂ 保证无法直接翻译成 ℓ∞ 性能,未来需要更紧的 ℓ∞ 证书。
- 全局界只到 ≤2-Lipschitz,相比纯 1-Lipschitz 确定性防御放松了一倍,认证半径 \(r_2=\Delta/4\) 的分母也因此更大、半径偏保守。
- 三流并行 + 每层 RANI 重采样 + 随机平滑推理多次采样,计算/认证开销不小,作者也把"更轻量的认证采样器"列为未来工作。
- 干净精度有"小幅但一致"的下降作为代价,在极致干净精度场景需权衡。
相关工作与启发¶
- 确定性认证:谱归一化/正交参数化(Miyato 2018)、LOT(Xu 2022)、SLL(Araujo 2023)——HyCAS 继承其 1-Lipschitz 骨干,但用随机分支补回精度损失。
- 随机平滑系:RS(Cohen 2019)、Dual RS、Incremental RS、Adaptive RS——HyCAS 不再只对输入噪声平滑,而是注入内部双重随机性同时保住 ≤2-Lipschitz 证书。
- 经验随机化防御:PNI(He 2019)、Learn2Perturb、CTRW、RPF(Dong & Xu 2023)——这些无认证保证且常被"对内部噪声求平均"的自适应攻击绕过;HyCAS 的启发在于用 Lipschitz 约束把随机化"锚定"住,使其既随机又可证。
评分¶
- 新颖性: ⭐⭐⭐⭐ — "确定性 1-Lipschitz 核 + 内部随机注意力残差"统一认证与经验两条路线的思路清晰,RANI 把固定梯度场搅浑的动机扎实;但各组件(谱归一化、随机投影、DCT 截断、RS)多为已有积木的组合。
- 实验充分度: ⭐⭐⭐⭐ — 8 个基准(含 5 个医学/人脸)、认证与经验双侧、APGD/AutoAttack 多强度、5 seeds 带方差,覆盖很全;缺更紧的 ℓ∞ 认证与开销分析。
- 写作质量: ⭐⭐⭐⭐ — 定理-推论链条完整、图 1 总览清晰、动机递进流畅;个别公式排版(如 Prop.1 的"4-Lipschitz"笔误)略有瑕疵。
- 价值: ⭐⭐⭐⭐ — 给安全攸关(尤其医学)部署提供了一个可调"认证↔经验"旋钮的实用防御,弥合了长期割裂的两条路线,落地意义明确。