Understanding and Enforcing Weight Disentanglement in Task Arithmetic¶

会议: CVPR 2026
arXiv: 2604.17078
代码: GitHub
领域: 模型压缩
关键词: 任务算术, 模型合并, 权重解耦, 正交正则化, 任务向量

一句话总结¶

本文提出任务特征专业化（TFS）作为权重解耦的充分条件，揭示其几何结果是权重向量正交性，并基于此提出 OrthoReg 正则化方法，通过在微调时强制权重更新矩阵的列向量正交来促进任务向量解耦，显著提升各种任务算术方法的性能。

研究背景与动机¶

领域现状：任务算术（Task Arithmetic）是一种高效的无训练模型编辑范式，通过计算任务向量 \(\tau_t = \theta_t^* - \theta_0\)（微调权重与预训练权重之差）并进行代数运算（加法、减法）来组合、移除或类比不同技能。
现有痛点：虽然任务算术在实践中有效，但缺乏根本性的理论解释。现有的"权重解耦"概念（TTA 提出）描述了理想结果——不同任务向量的效果互不干扰——但没有揭示其根本原因。具体来说，预训练模型 \(\theta_0\) 或任务向量 \(\tau_t\) 需要什么内在属性才能实现解耦，这一问题未被充分探索。
核心矛盾：权重解耦是现象描述而非因果解释。现有方法要么计算开销大（如 TTA 需要计算 Jacobian），要么缺乏理论保证，无法可靠地生成高质量任务向量。
本文目标：回答两个核心问题：(1) 预训练模型的什么属性使其适合任务算术？(2) 如何构造能主动促进权重解耦的任务向量？
切入角度：从模型的内部特征分配机制入手，发现"任务特征专业化"是解耦的充分条件，而权重向量正交性是其可观测的几何结果。
核心 idea：TFS 是抽象不可直接强制执行的，但其几何结果——正交性——是具体可操作的。通过在微调时强制权重更新矩阵的内部正交结构，可以间接促进权重解耦。

方法详解¶

整体框架¶

这篇论文想回答任务算术为什么有效，并据此设计一个能主动提升解耦质量的微调方法。整条链路是：先在理论上找出权重解耦的根本原因（任务特征专业化 TFS），再把这个抽象原因翻译成一个可观测、可优化的几何量（权重向量正交性），最后落到一个即插即用的正则项 OrthoReg 上。实际操作时，对每个下游任务单独微调，在标准任务损失之外加一项约束权重更新矩阵 \(\Delta W\) 列向量互相正交的正则项；各任务微调完成后，仍用标准任务算术 \(\theta_{MT} = \theta_0 + \sum_t \alpha_t \tau_t\) 把任务向量加起来，得到一个多任务模型。换句话说，OrthoReg 只改微调阶段，合并阶段和推理流程完全不动。

关键设计¶

1. 任务特征专业化（TFS）：先把"解耦"归因到一个内部机制上

此前"权重解耦"只是对理想现象的描述——不同任务向量的效果互不干扰——却没人说清模型究竟具备什么内在属性才会出现这种现象。本文给出的答案是任务特征专业化：模型能为不同任务分配各自的内部特征（即权重矩阵中不同的列向量）。形式化地，任务 \(t\) 的专业特征集 \(I_t\) 是那些使模型输出对相应激活 \(z_k\) 敏感的特征索引集合，TFS 要求不同任务的特征集互不相交，即 \(I_t \cap I_j = \emptyset\)。在 NTK 线性化假设下，这种不相交直接保证了干扰项 \(\tau_j^\top J(x) = 0\) 对所有 \(x \in \mathcal{D}_t\) 成立——也就是说，任务 \(j\) 的向量落在任务 \(t\) 的样本上不产生任何影响，这正是权重解耦的定义。因此 TFS 是权重解耦的充分条件。更关键的是，作者进一步证明 TFS 会自然导致权重矩阵的块正交结构，从而把一个"看不见摸不着"的功能属性，和一个能直接度量的几何属性（正交性）挂上了钩。

2. OrthoReg：强制不了 TFS，那就强制它的几何后果

TFS 虽然解释了原因，但它本身没法直接当训练目标——实际网络里不同任务的特征集几乎一定会重叠，无法硬性切开。本文的思路是绕过 TFS、直接去逼它的几何结果：既然专业化会带来正交，那就在微调时把"正交"写成损失项强加上去。具体是在任务损失上叠加一项 \(\mathcal{L} = \mathcal{L}_{\text{task}}(\theta_0 + \Delta\theta) + \lambda \cdot \mathcal{L}_{\text{ortho}}(\Delta\theta)\)，其中

\[\mathcal{L}_{\text{ortho}} = \sum_l \big\|(\Delta W^{(l)})^\top \Delta W^{(l)} - I\big\|_F^2\]

它惩罚每层更新矩阵的 Gram 矩阵 \((\Delta W)^\top \Delta W\) 偏离单位阵的程度，等价于同时要求 \(\Delta W\) 的各列互相正交、且范数趋近 1。理论上这一项通过两个旋钮促进解耦：一是范数控制，约束 \(\|\tau_j\|_2\) 不让某个任务向量过大压过别人；二是角度控制，把不同任务向量之间的夹角推向 90°。它的好处是足够轻——不改架构、不碰推理，一行正则项就能挂到任何微调方法（含 LoRA 这类 PEFT）上。

3. 与 TTA 的统一：两种看似不同的方法其实在做同一件事

最后作者用这套正交视角回看已有的 TTA（Tangent Task Arithmetic），指出它和 OrthoReg 殊途同归——两者最终都在把任务向量之间的内积压到接近零（\(\langle \tau_t, \tau_j \rangle \approx 0\)）。区别只在实现路径：TTA 靠在模型切线空间做线性化、借 NTK 几何隐式地逼出正交，代价是内存翻倍、训练时间 2-3 倍；OrthoReg 则把同一个目标显式写成正则项，更直接也更省。这条统一不只是事后解释，它也反过来印证了"正交性是解耦关键"这一主张：一个用几何隐式得到、一个用正则显式得到，落点一致，说明正交确实是它们共同奏效的底层机制。

损失函数 / 训练策略¶

总损失 \(\mathcal{L} = \mathcal{L}_{\text{task}} + \lambda \cdot \mathcal{L}_{\text{ortho}}\)，其中 \(\lambda\) 在 \([0.1, 100]\) 范围内按验证集挑选。微调时冻结文本编码器、只更新图像编码器；合并阶段用统一缩放系数 \(\alpha\)，在 \(\{0.0, 0.05, \dots, 1.0\}\) 上网格搜索。

实验关键数据¶

主实验¶

任务加法（8 个任务，ViT-L-14）：

方法	绝对准确率	归一化准确率	提升
Non-lin. FT	84.07%	89.19%	—
Non-lin. FT + OrthoReg	88.23%	100.08%	+4.16
TTA	86.19%	93.14%	—
TTA + OrthoReg	87.52%	96.44%	+1.33
ATT-FT	87.81%	93.59%	—
ATT-FT + OrthoReg	90.41%	100.05%	+2.60

任务否定（遗忘目标任务，ViT-L-14）：

方法	目标准确率↓	控制准确率↑	遗忘提升
ATT-FT	24.85%	76.42%	—
ATT-FT + OrthoReg	14.67%	75.40%	-10.18

消融实验¶

配置	绝对准确率	说明
ATT-FT + OrthoReg (ViT-L-14)	90.41%	完整方法
ATT-FT (无正则)	87.81%	去掉 OrthoReg 后降 2.6%
LoRA-ATT + OrthoReg	89.16%	PEFT 方法也有效
LoRA-ATT (无正则)	87.02%	去掉后降 2.14%

关键发现¶

归一化准确率超过 100%：Non-lin. FT + OrthoReg 在 ViT-L-14 上达到 100.08%，意味着合并后的多任务模型性能等同甚至超过 8 个独立微调模型，实现了近乎理想的权重解耦
任务向量余弦相似度显著降低：OrthoReg 使不同任务向量的余弦相似度接近 0，直接验证了理论预测的"角度控制"机制
对超参数不敏感：性能随 \(\lambda\) 增加稳步提升，且在宽范围的 \(\alpha\) 值上一致优于基线

亮点与洞察¶

TFS → WVO → WD 的因果链非常优雅：识别出"任务特征专业化"是连接功能属性和几何属性的共同原因，为从抽象性质到可操作约束的桥梁提供了范式。这种"找不到直接原因就强制其结果"的思路可广泛迁移。
归一化准确率超 100% 是最令人印象深刻的结果：证明正交约束不仅减少了任务间干扰，甚至让合并模型超越了独立模型，暗示某种正则化效应带来了额外收益。
OrthoReg 的简洁性令人赞赏：仅需一个正则项 \(\|(\Delta W)^\top \Delta W - I\|_F^2\)，无需修改架构或推理流程，可直接嵌入任何微调 pipeline。

局限与展望¶

理论依赖 NTK 线性化假设，对深度非线性网络的适用性有待进一步验证
目前仅在 CLIP-based ViT 上验证，缺乏对其他预训练范式（如 MAE、DINOv2）的实验
仅考虑了 8 个分类任务，未验证在更多任务（如 20+）或异构任务类型（检测、分割）上的表现
正交约束在列数 \(d\) 远大于行数 \(m\) 时可能过强，限制了表达能力
未来可探索自适应正交约束（根据任务相似度调整约束强度）

评分¶

新颖性: ⭐⭐⭐⭐⭐ TFS→正交性→解耦的理论链条新颖且完整，OrthoReg 设计简洁有力
实验充分度: ⭐⭐⭐⭐ 三个模型规模、多种基线方法的全面对比，但任务类型单一
写作质量: ⭐⭐⭐⭐⭐ 理论与方法的推导逻辑清晰，从原理到方法到实验一气呵成
价值: ⭐⭐⭐⭐⭐ 为任务算术提供了深刻的理论基础，OrthoReg 即插即用的实用性很强