Robust Spiking Neural Networks by Temporal Mutual Information¶

会议: CVPR 2026
论文: CVF Open Access
代码: https://github.com/zju-bmilab/SNN_TMI_code
领域: 脉冲神经网络 / 对抗鲁棒性
关键词: 脉冲神经网络, 对抗鲁棒性, 互信息, 信息瓶颈, 时间特性

一句话总结¶

本文从信息论角度证明深度网络的鲁棒误差上界由「输入与隐表示之间的互信息」决定，并指出 SNN 独有的时间特性（累积发放 + 脉冲时序依赖）天然让这一互信息更小，据此提出沿时间维度直接最小化互信息的 TMI 正则项，在 CIFAR/ImageNet 等多个数据集和多种攻击下稳定提升 SNN 的内在鲁棒性。

研究背景与动机¶

领域现状：脉冲神经网络（SNN）因事件驱动、低功耗的时间动力学而受关注，但随着部署增多，它在对抗扰动下的鲁棒性成为重要问题。现有提升 SNN 鲁棒性的工作分两路：一路照搬 ANN 的空间特征手段（对抗训练 AT、输入扰动、权重正则），另一路利用 SNN 的时间动力学（频域编码、基于时序的梯度计算）。

现有痛点：第一路把 SNN 当成静态网络，完全忽略其时间特性，效果受限；而且对抗训练依赖外部对抗样本、不提供内在鲁棒性，换一种攻击就可能失效。第二路虽然建模了时间信息，却几乎没人去回答为什么、以及在多大程度上时间特性会影响鲁棒性——缺一个能解释「时间特性 → 鲁棒性」的理论桥梁。

核心矛盾：鲁棒性的根因到底落在哪个量上没人说清。如果只看空间特征，在推理阶段网络是确定性的一一映射，给定隐表示 \(Z\) 就能反推输入 \(X\)，条件熵 \(H(X|Z)=0\)，互信息被算得偏大且松，无法刻画鲁棒性。

本文目标：(1) 把模型鲁棒误差和某个可优化的量建立严格联系；(2) 证明 SNN 的时间特性能让这个量天然更优；(3) 给出可落地的估计与正则方法。

切入角度：作者借信息瓶颈（IB）原理，把网络看作马尔可夫链 \(X\to Z\to Y\)，用 Shamir 等人的泛化误差界，把「鲁棒误差」转写成关于互信息 \(I(X;Z)\) 的上界——互信息越紧（越小），鲁棒误差界越紧。再观察到 SNN 的脉冲发放是多对一映射，给定脉冲无法唯一恢复膜电位，于是 \(H(X|Z)>0\)，互信息天然比空间特征更小。

核心 idea：用「沿时间维直接最小化输入与隐表示的互信息」代替「照搬 ANN 的空间防御」，把 SNN 时间特性带来的紧互信息这一内在优势显式地用作鲁棒性正则。

方法详解¶

整体框架¶

方法的目标是给 SNN 训练加一个时间维互信息正则项，让网络在不依赖对抗样本的前提下获得内在鲁棒性。整条链路是：先在理论上把鲁棒误差界归结到 \(I(X;Z)\)；再论证 SNN 的时间特性让 \(I(X;Z)\) 天然更紧；最后在工程上把第一层输入特征 \(X\) 与最后一个脉冲神经元层的隐表示 \(Z\) 各自压成一维「脉冲发放率序列」，用核密度估计（KDE）拟合连续分布并算出 \(I(X;Z)\)，把它加进常规分类损失一起优化。

整体可以分为「理论侧（为什么该最小化 \(I(X;Z)\)）」和「实现侧（怎么估计并最小化）」两段。实现侧是一条清晰的前向 pipeline：

%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
    A["输入特征 X<br/>(第一层)"] --> B["脉冲神经元前向<br/>得到隐表示 Z<br/>(最后脉冲层)"]
    B --> C["鲁棒误差上界=互信息<br/>把鲁棒误差归到 I(X;Z)"]
    C --> D["时间特性压紧互信息<br/>多对一映射 H(X|Z)>0"]
    D --> E["KDE 时间互信息估计<br/>发放率序列→KDE→I(X;Z)"]
    E --> F["TMI 正则项<br/>L=L_base+λ·I(X;Z)"]
    F -->|联合优化| A

关键设计¶

1. 鲁棒误差上界 = 输入-隐表示互信息：给鲁棒性找一个可优化的「锚」

第一路对抗训练的问题是治标不治本——它靠外部对抗样本硬记，换攻击就废，本质上没刻画出鲁棒性由什么决定。作者把网络看成信息流 \(X\to Z\to Y\)，并对对抗样本 \(X+\epsilon\) 引入对应的隐表示 \(Z+\epsilon'\)，注意到鲁棒模型里 \(Z+\epsilon'\) 相对 \(Z\) 只是多了冗余噪声，信息流可写成 \(X+\epsilon \to Z+\epsilon' \to Z \to Y\)。推理阶段参数固定、给定 \(Z\) 时 \(Y\) 无不确定性，故 \(\hat H(Y|Z)=\hat H(Y|Z+\epsilon')=0\)，于是 \(\hat I(Z+\epsilon';Y)=\hat I(Z;Y)\)。代入 Shamir 等人的泛化误差界，鲁棒误差被界定为：

\[|I(Z;Y)-\hat I(Z+\epsilon';Y)| \le C\big(c_1\log(m)\sqrt{|Z|}\,I(X;Z) + c_2|Z|^{3/4}I(X;Z)^{1/4} + c_3\hat I(X;Z)\big)\]

这把抽象的「鲁棒误差」变成了一个单调依赖 \(I(X;Z)\) 的上界：\(I(X;Z)\) 越小，界越紧，模型内在越鲁棒。这一步是全文的理论地基，让「最小化互信息」成为有依据的优化目标，而不是经验技巧。⚠️ 界中各常数 \(c_1,c_2,c_3,C\) 的具体形式以原文为准。

2. 时间特性让互信息天然更紧：多对一映射使 \(H(X|Z)>0\)

要让上界更紧就得让 \(I(X;Z)=H(X)-H(X|Z)\) 更小；\(X\) 给定时 \(H(X)\) 固定，关键看条件熵 \(H(X|Z)\) 是否大。作者对比了两种特征。空间特征下，ANN 推理是确定性一一映射 \(Z_S=\sigma(WX_S+b)\)，给定 \(Z_S\) 可唯一反推 \(X_S\)，所以 \(H(X_S|Z_S)=0\)，互信息偏大且松。时间特性下，SNN 的脉冲传递是多对一，原因有二：其一是累积发放机制——膜电位累积到阈值才发一个脉冲，给定脉冲 \(Z\) 无法恢复具体膜电位（图中 \(X_1\)、\(X_2\) 不同却映到同一脉冲），故 \(H(X|Z)>0\)；其二是脉冲间时序依赖——当前时刻脉冲 \(z_t\) 受当前及之前所有输入 \(x_i\,(i\le t)\) 影响，已知 \(z_t\) 也定不出 \(x_t\)，不确定性持续存在。两点合起来给出 \(H(X|Z)>H(X_S|Z_S)=0\)，从而 \(I(X;Z)<I(X_S;Z_S)\)。这正是 SNN 比 ANN 更适合做这类内在鲁棒正则的根本原因：时间维本身就是一个免费的信息压缩器。

3. KDE 时间互信息估计：把脉冲序列变成可微的连续分布

直接在 SNN 上算互信息有两个坑：已有的直方图分桶法（AIMIE）忽略脉冲间的连续信息，且 SNN 为省算力时间步 \(T\) 很小，几个直方图桶根本给不出有判别力的分布。作者改用发放率序列 + 核密度估计（KDE）。先把时间特性沿通道维求平均（\(\hat X_{input}=\frac{1}{C_i}\sum_j x_i[:,j,:,:]\)）、再沿高宽维求平均，得到一维发放率序列 \(X\in\mathbb{R}^T\)（隐表示 \(Z\) 同理）——通道平均一方面去掉空间噪声，另一方面比直接 max-pooling 保留更多连续信息。然后对长度为 \(T\) 的序列用高斯核 KDE 估计概率密度，例如 \(\text{PDF}_X=\frac{1}{T}\sum_{i=1}^{T}\exp\!\big(-\frac{(x_i-\hat b_{x_j})^2}{2\sigma^2}\big)\)，进而得到边缘与联合分布，按 \(I(X;Z)=\sum_{i}\sum_{j}p(\hat b_{x_i},\hat b_{z_j})\log\frac{p(\hat b_{x_i},\hat b_{z_j})}{p(\hat b_{x_i})p(\hat b_{z_j})}\) 计算互信息。KDE 比直方图更平滑、收敛更快，在小 \(T\) 下仍能给出可用的连续分布估计。

4. TMI 正则项与层选择：把互信息当损失加进训练

有了可微的 \(I(X;Z)\)，作者把它作为正则项叠到任意常规损失上：

\[L = L_{base}(Y,Y_{target}) + \lambda\, I(X;Z)\]

其中 \(L_{base}\) 可以是 SNN 常用的交叉熵，\(\lambda\) 为固定缩放系数（实验取 0.05）。一个关键工程选择是「在哪两层之间算 \(I\)」。由数据处理不等式，浅层 \(Z'\) 满足 \(I(X;Z)\le I(X;Z')\)；若选浅层，过高的 \(I(X;Z')\) 反而说明该层提取能力差、会拖累最终特征。因此 TMI 取第一层输入 \(X\) 与最后一个脉冲神经元层（分类层之前）的隐表示 \(Z\) 来算互信息——既覆盖整条信息流，又把正则压在最具代表性的深层表示上。这一设计让正则真正作用在「决定输出的那段表示」上，消融也证明深层 \(Z\) 比浅层 \(Z'\) 在 PGD/FGSM 上各高约 3%。

损失函数 / 训练策略¶

最终目标即上式 \(L=L_{base}+\lambda I(X;Z)\)。KDE 中固定带宽 \(\sigma=0.4\)、在 \([0,255]\) 范围取 256 个均匀 bin，\(\lambda=0.05\)。该正则可叠加到任意训练范式（STBP、TET、SNN-RAT 等）之上，对各种攻击类型通用，因为它增强的是「内在鲁棒性」而非针对某一种对抗样本。

实验关键数据¶

数据集：CIFAR-10/100、DVS-CIFAR10、Tiny-ImageNet、ImageNet；网络：VGG11、AlexNet、VGGSNN；攻击：FGSM、PGD、BIM、RGA（SNN 专用）、AutoAttack、高斯噪声（白盒 \(\epsilon=4/255\)，部分 \(8/255\)）。

主实验（CIFAR-100，VGGSNN/AlexNet，PGD/FGSM 攻击下测试精度 %）¶

网络	方法	Natural	FGSM	PGD	说明
VGGSNN	STBP	68.11	13.51	2.05	基线
VGGSNN	STBP-H（输出熵）	68.62	12.14	1.69	替代正则
VGGSNN	STBP-AIMIE（直方图 MI）	67.98	12.54	1.47	替代正则
VGGSNN	STBP-TMI（本文）	68.12	15.20	2.45	FGSM +1.7%，PGD +0.4%
VGGSNN	TET	72.66	15.19	2.25	基线
VGGSNN	TET-TMI（本文）	72.32	17.29	4.63	PGD 翻倍
AlexNet	STBP	66.33	13.11	2.40	基线
AlexNet	STBP-TMI（本文）	66.44	15.20	5.02	PGD 大幅提升

TMI 在几乎不损 Natural 精度的前提下，对各种攻击稳定提点，且优于输出熵正则（-H）和直方图互信息（-AIMIE）。叠加到 SOTA 鲁棒方法上也有效：CIFAR-100/VGG11、FGSM 下 SNN-RAT 把鲁棒精度从 vanilla 的 4.30% 提到 25.86%，再加 TMI 进一步到 27.32%。

消融实验（CIFAR-100，FGSM/PGD）¶

配置	FGSM	PGD	说明
TMI（通道平均 + 深层 \(Z\)）	25.80	4.36	完整方法
max-pooling 替代平均	12.23	—	通道维改 max-pool，掉一半
浅层 \(Z'\) 替代深层 \(Z\)	~22.8	~1.4	比深层各低约 3%

另有 TASA（时间平均脉冲活跃度）分析（Table 2，CIFAR-10/AlexNet/PGD）：不加 TMI 时 AlexNet 各层的原始图与对抗图的 TASA 差异逐层放大，第 5 层达 0.1661；加 TMI 后第 5 层降到 0.0802，说明模型对原始/对抗图学到了更相似的时间特征。

关键发现¶

通道平均比 max-pooling 关键得多：max-pool 把离散脉冲硬压成单值、丢失连续信息，FGSM 鲁棒精度从 25.80% 暴跌到 12.23%；连续化（平均 + KDE）是 TMI 有效的前提。
深层 \(Z\) 优于浅层 \(Z'\)：互信息越小越能准确表征「输入信息被提取的程度」，把正则压在分类层前的深层表示上比浅层各高约 3%。
时间特性才是鲁棒性的有效刻画量：用 SNN 空间特征算的互信息（MINE）与鲁棒性无稳定单调关系，而时间特性互信息呈现「互信息越高越脆弱」的清晰趋势——这也是「为什么要沿时间维做正则」的实证支撑。

亮点与洞察¶

把「鲁棒性」翻译成「互信息」再翻译成「时间特性」：两级归约（鲁棒误差界 ← \(I(X;Z)\) ← SNN 多对一映射）让一个原本经验化的目标变得可优化、可解释，这是全文最漂亮的地方。
SNN 的「缺点」被用成了优点：脉冲发放不可逆、膜电位不可恢复，本来被视为信息丢失，这里恰恰提供了 \(H(X|Z)>0\) 的免费压缩，成为内在鲁棒性的来源。
KDE 代替直方图估计互信息这一 trick 可迁移到任何「小样本/短序列下估计分布」的场景，比直方图更平滑、收敛更快。
正则即插即用：TMI 不依赖对抗样本、可叠加到 STBP/TET/SNN-RAT 上，作为内在鲁棒性增强器，比对抗训练更通用。

局限与展望¶

绝对鲁棒精度仍偏低：CIFAR-100/PGD 下即便最好也只有个位数（如 4–5%），TMI 是「相对提升」而非把鲁棒性做到可用水平。
理论界依赖一系列假设（IB 马尔可夫链、推理期确定性、\(\hat H(Y|Z)=0\) 等），且常数项较多；界的紧致程度与实际增益之间的定量关系未充分量化。⚠️ 部分推导细节以原文为准。
互信息只在「第一层 ↔ 最后脉冲层」之间算，是否对所有架构都是最优层选择、对很深网络是否仍稳健，文中未充分展开。
改进方向：把 TMI 与对抗训练显式结合、或扩展到多层互信息约束；在神经形态硬件上验证其能耗-鲁棒性权衡。

评分¶

新颖性: ⭐⭐⭐⭐⭐ 把鲁棒误差界归约到时间维互信息，并指出 SNN 多对一映射天然压紧互信息，视角新且自洽。
实验充分度: ⭐⭐⭐⭐ 覆盖 5 个数据集、3 种网络、多种攻击，含 TASA 与互信息-鲁棒性趋势分析；但绝对鲁棒精度低、部分结果放在附录。
写作质量: ⭐⭐⭐⭐ 理论推导清晰、动机层层递进；常数项偏多、个别符号需对照原文。
价值: ⭐⭐⭐⭐ 为 SNN 鲁棒性提供了可解释的理论框架与即插即用正则，对神经形态/低功耗鲁棒部署有参考价值。