SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models¶

会议: ICLR 2026
arXiv: 2503.07392
代码: GitHub
领域: 扩散模型 / 安全 / 遗忘
关键词: 概念擦除, 零空间约束, 模型编辑, 先验保持, 多概念擦除

一句话总结¶

SPEED 提出基于零空间（null space）约束的闭式模型编辑方法，通过影响力先验过滤（IPF）、定向先验增强（DPA）和不变等式约束（IEC）三种互补技术精化保留集，实现可扩展（5 秒内擦除 100 个概念）、精确（非目标概念语义零损失）且高效的概念擦除。

研究背景与动机¶

领域现状：T2I 扩散模型的概念擦除分为两大范式——训练式（fine-tuning，如 ESD、MACE）和编辑式（closed-form，如 UCE、RECE）。编辑式方法因不需要额外训练而天然适合多概念场景。

现有痛点：编辑式方法（如 UCE）使用加权最小二乘同时优化擦除误差 \(e_1\) 和保留误差 \(e_0\)，但 \(e_0\) 存在可证明的非零下界。随着擦除概念增多，\(e_0\) 累积导致非目标概念语义退化。

核心矛盾：零空间方法（如 AlphaEdit）可以将 \(e_0\) 强制为零，但保留集增大会使特征矩阵趋近满秩，零空间维度 \(\dim = d_0 - \text{rank}(\mathbf{C}_0\mathbf{C}_0^\top)\) 萎缩，必须使用近似零空间，又引回语义退化。

本文目标 在多概念擦除中同时保证：(a) 擦除有效性、(b) 非目标概念零损失、(c) 运行效率。

切入角度：不是简单扩大保留集，而是策略性精化（refine）保留集——过滤掉影响小的概念防止满秩，增强影响大的概念提升覆盖度。

核心 idea：通过先验知识精化使零空间约束在大规模擦除中保持准确，实现 \(e_0 = 0\) 的无损先验保持。

方法详解¶

整体框架¶

输入为三个概念集合：擦除集 \(\mathbf{E}\)（目标概念）、锚定集 \(\mathbf{A}\)（替代概念，如 Snoopy→Dog）、保留集 \(\mathbf{R}\)（非目标概念）。方法对交叉注意力层的投影权重 \(\mathbf{W}\) 计算闭式更新 \(\bm{\Delta}\mathbf{P}\)，其中 \(\mathbf{P}\) 是保留集 \(\mathbf{R}_{\text{refine}}\) 对应的零空间投影矩阵。

关键设计¶

影响力先验过滤（IPF）：
- 功能：量化每个非目标概念受擦除的影响程度，过滤掉影响小的概念
- 核心思路：先求仅含擦除项 \(e_1\) 的闭式更新 \(\bm{\Delta}_{\text{erase}}\)，对每个保留概念计算 prior shift \(\|\bm{\Delta}_{\text{erase}} \bm{c}_0\|^2\)，仅保留高于均值的概念
- 设计动机：减少保留集规模，防止相关矩阵趋近满秩，保住零空间精度
定向先验增强（DPA）：
- 功能：用定向噪声扩充过滤后的保留集
- 核心思路：对参数矩阵 \(\mathbf{W}\) 做 SVD 取最小奇异方向构建投影 \(\mathbf{P}_{\text{min}}\)，将随机噪声投影到该方向再加到概念 embedding 上：\(\bm{c}_0' = \bm{c}_0 + \bm{\epsilon} \cdot \mathbf{P}_{\text{min}}\)
- 设计动机：相比随机噪声增强，定向噪声在 \(\mathbf{W}\) 映射后语义距离更小，避免引入无意义 embedding 导致秩空间浪费
不变等式约束（IEC）：
- 功能：强制 [SOT] token 和 null-text embedding 在擦除前后输出不变
- 核心思路：在闭式优化中加入等式约束 \((\bm{\Delta}\mathbf{P})\mathbf{C}_2 = \mathbf{0}\)，用拉格朗日乘子法求解
- 设计动机：这些 invariant embedding 在所有生成中都参与，保护它们可天然保持先验知识

损失函数 / 训练策略¶

最终闭式解：

\[(\bm{\Delta}\mathbf{P})_{\text{Ours}} = \mathbf{W}(\mathbf{C}_*\mathbf{C}_1^\top - \mathbf{C}_1\mathbf{C}_1^\top)\mathbf{P}\mathbf{Q}\mathbf{M}\]

其中 \(\mathbf{M} = (\mathbf{C}_1\mathbf{C}_1^\top\mathbf{P} + \mathbf{I})^{-1}\)，\(\mathbf{Q} = \mathbf{I} - \mathbf{M}\mathbf{C}_2(\mathbf{C}_2^\top\mathbf{P}\mathbf{M}\mathbf{C}_2)^{-1}\mathbf{C}_2^\top\mathbf{P}\)。整个过程无需训练，直接矩阵运算。

实验关键数据¶

多概念擦除（名人）¶

擦除数	指标	UCE	MACE	RECE	SPEED
10	\(\text{Acc}_r\)↑ / \(H_o\)↑	71.19 / 83.10	87.73 / 92.75	67.43 / 80.44	89.09 / 93.42
50	\(\text{Acc}_r\)↑ / \(H_o\)↑	31.94 / 48.41	84.31 / 90.03	19.77 / 32.95	88.48 / 92.34
100	\(\text{Acc}_r\)↑ / \(H_o\)↑	20.92 / 34.60	80.20 / 87.06	23.71 / 38.16	85.54 / 89.63
100	Runtime(s)	2.1	1736	11.0	5.0

消融实验¶

配置	目标 CS↓	非目标 FID↓	MS-COCO FID↓
基线（Eq.3，无精化）	27.20	50.43	26.33
+IEC	27.20	48.17	24.95
+IEC+IPF	26.68	38.02	20.57
+IEC+IPF+DPA (SPEED)	26.29	29.35	20.36

关键发现¶

IPF 贡献最大：非目标 FID 从 48.17 降到 38.02，说明过滤错误概念避免满秩是核心
DPA 比随机增强（RPA）更优：定向噪声保持语义一致性，非目标 FID 从 32.62 降到 29.35
SPEED 对 MACE 的速度优势为 350×（5s vs 1736s），且先验保持更好
可迁移到 SDXL、SDv3（DiT 架构），支持知识编辑（修改 anchor concept）

亮点与洞察¶

零空间约束 + 精化 = 可证明 \(e_0=0\)：不是近似保持而是精确保持，这在概念数增多时优势尤其明显
IPF 的 prior shift 指标：用闭式擦除更新量化影响，简洁优雅且计算高效（无需训练）
DPA 的定向噪声设计：将噪声投影到 \(\mathbf{W}\) 最小奇异方向是一个巧妙的 trick，可迁移到其他模型编辑任务

局限与展望¶

仅修改交叉注意力层权重，对不经过交叉注意力的内部表征（如 self-attention）影响有限
闭式解依赖线性假设，对高度非线性的概念交互可能不完美
保留集仍需预定义，对完全未知的非目标概念无法保证
擦除效果在部分场景下不如最激进的训练式方法（但换来了速度和保持）

评分¶

新颖性: ⭐⭐⭐⭐ 零空间约束 + 先验精化的组合是核心创新，IPF/DPA/IEC 设计合理
实验充分度: ⭐⭐⭐⭐⭐ few/multi/implicit concept 三种任务，消融充分，跨架构验证
写作质量: ⭐⭐⭐⭐ 公式推导清晰，图表说明性强
价值: ⭐⭐⭐⭐⭐ 5 秒擦除 100 概念且先验保持最优，实用价值极高