Plug-and-Play Incomplete Multi-View Clustering via Janus-Faced Affinity Learning with Topology Harmonization¶
会议: CVPR 2026
论文: CVF Open Access
代码: 无
领域: 不完整多视图聚类
关键词: 不完整多视图聚类, 锚点图, 双面亲和学习, 拓扑校准, 无超参
一句话总结¶
PJFTH 提出一个无任何正则超参的即插即用不完整多视图聚类框架:用「双面(Janus-faced)亲和学习」把每个视图的私有杂质显式剥离出来再融合共识图,用「拓扑校准」把跨视图错乱的锚点顺序对齐,整套目标六步交替优化、复杂度对样本数 \(n\) 线性,在 6 个含缺失率数据集上达到有竞争力的聚类效果。
研究背景与动机¶
领域现状:多视图数据(多模态 / 多源)在现实中很常见,但传感器故障、传输错误、采集遗漏会导致某些视图样本缺失,由此产生不完整多视图聚类(IMVC)。近年主流路线是用「锚点(anchor)—样本」的二部亲和图代替 \(n\times n\) 自表达矩阵,先学一个共识亲和图 \(H\),再对其谱划分得到聚类。
现有痛点:作者指出现有 IMVC 方法有三个共性短板。其一,学习共识表示时忽略了视图私有杂质(view-exclusive artifacts)的干扰——每个视图都带有与共识语义无关的偏置(如缺失诱导的偏差、视图独有噪声),直接融合会污染相似度度量。其二,跨视图的锚点顺序不一致:聚类无监督,各视图独立采样得到的锚点排列没有对齐,导致图结构里的语义对应被打乱,破坏聚类性能。其三,多数方法依赖精心调过的正则超参 \(\eta\),部署时调参成本高、实用性差。
核心矛盾:要在「融合多视图信息」与「抑制缺失/私有杂质带来的负面效应」之间取得真正的分离,而不是让杂质混进共识图;同时锚点表示本身的顺序自由度让跨视图融合失去了语义对齐基础。
本文目标:在一个统一框架里同时解决——(a) 显式建模并剥离视图私有杂质;(b) 同步跨视图锚点顺序;(c) 去掉所有正则超参,做到即插即用。
切入角度:作者观察到杂质干扰来自「私有信息混入共识学习」,于是给每个视图单独学一张私有图 \(H_v\),再用一个平衡因子 \(\theta_v\) 决定共识图 \(H\) 和私有图 \(H_v\) 各占多少——像两面神 Janus 一样一面朝共识、一面朝私有,从而把杂质显式吸出去。
核心 idea:用「共识图 + 视图私有杂质图」的双面分解显式排除干扰,用「带 unary 编码约束的置换矩阵」对齐锚点拓扑,全程不引入任何正则超参,六步交替优化保证线性复杂度。
方法详解¶
整体框架¶
PJFTH 的输入是带缺失的多视图数据集 \(\{D_v\in\mathbb{R}^{d_v\times n}\}_{v=1}^V\) 和指示缺失的索引向量 \(\{m_v\}\),输出是对共识亲和图 \(H\) 做谱划分得到的聚类结果。整条 pipeline 在锚点二部图框架上叠两层修补:先把每个视图的私有杂质用 \(H_v\) 吸出去(双面亲和学习),再用置换矩阵 \(Q_v\) 把锚点顺序对齐(拓扑校准),最后用视图权重 \(\beta_v\) 把各视图加权进一个无超参的统一目标,六步交替迭代直到收敛。
先交代基线。IMVC 的全尺寸自表达写法 \(\min_{W_v,W}\sum_v\|D_vE_v-D_vE_vW_v\|_F^2+\eta\psi(W,\cdot)\) 至少是立方复杂度,且融合会带来结构畸变。于是改用锚点共识学习:用一组锚点 \(C_v\in\mathbb{R}^{d_v\times m}\)(\(m\ll n\))表示原数据,直接学共识亲和 \(H\in\mathbb{R}^{m\times n}\):
这里 \(E_v\in\mathbb{R}^{n\times n_v}\) 是把观测样本映射回全尺寸的指示矩阵。二部图把开销降下来、也缓解了融合畸变,但它没处理杂质干扰、也没对齐锚点顺序——这正是 PJFTH 要补的两块。
%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
A["不完整多视图数据<br/>D_v + 缺失索引 E_v"] --> B["锚点二部图基线<br/>学共识亲和 H"]
B --> C["双面亲和学习<br/>私有图 H_v + 平衡因子 θ_v<br/>显式剥离视图杂质"]
C --> D["拓扑校准<br/>置换矩阵 Q_v 对齐锚点顺序"]
D --> E["无超参统一目标<br/>视图权重 β_v 自适应加权"]
E -->|六步交替优化·线性复杂度| F["共识图 H 谱划分<br/>聚类结果"]
关键设计¶
1. 双面亲和学习:给每个视图配一张私有杂质图,把干扰显式吸出去
针对「融合时杂质污染共识图」这个痛点,作者不再让 \(H\) 独自承担所有信息,而是给每个视图额外学一张视图私有杂质矩阵 \(H_v\in\mathbb{R}^{m\times n}\),专门捕获只属于该视图的干扰(缺失诱导偏差、与共识语义无关的信号等),并用一个平衡因子 \(\theta_v\in[0,1]\) 在共识与私有之间分配:
约束为 \(0\le\theta_v\le1\)、\(H^\top\mathbf{1}_m=\mathbf{1}_n\)、\(H\ge0\)、\(H_v^\top\mathbf{1}_m=\mathbf{1}_n\)、\(H_v\ge0\)。直觉是:重构 \(D_vE_v\) 时,能用共识结构解释的部分交给 \(\theta_v C_v H\),剩下解释不了的私有杂质交给 \((\theta_v-1)C_v H_v\) 这一项去吸收。\(\theta_v\) 越接近 1,说明该视图越「干净」、越靠共识;越接近 0 则更多依赖私有图去消化杂质。这种「一面朝共识、一面朝私有」的双面(Janus-faced)建模,使得共识图 \(H\) 学到的是被净化过的、更鲁棒的相似度——这是和以往直接融合 \(\{W_v\}\) 的方法最本质的区别:杂质不再隐式混进共识,而是被显式建模、显式排除。
2. 拓扑校准:用 0/1 置换矩阵对齐跨视图锚点顺序,只换位不改值
针对「锚点顺序跨视图错乱、破坏图结构」这个痛点,作者在锚点和共识图之间插入一个置换变换矩阵 \(Q_v\in\{0,1\}^{m\times m}\),把第 \(v\) 个视图的锚点拓扑重排到统一顺序后再参与相似度融合:
双随机 + 0/1 的 unary 编码约束让 \(Q_v\) 恰好是一个置换矩阵:每行每列只有一个 1,因此它只重排锚点顺序、不改变锚点取值。这一步把「锚点顺序的对齐」前置到相似度整合之前,恢复了跨视图的语义对应——既保留了原始学到的锚点属性,又消除了无监督下采样带来的排列歧义。这是该方法相对纯锚点共识学习的第二处关键修补。
3. 无超参统一目标 + 视图自适应加权:把两处修补和视图重要性合进一个目标,彻底去掉正则项
针对「依赖正则超参 \(\eta\)」这个痛点,作者把双面学习(式 3)和拓扑校准(式 4)合并,再给每个视图配一个权重系数 \(\beta_v\) 动态校准其贡献,写出统一目标:
约束为 \(\beta\ge0,\ \beta^\top\mathbf{1}=1,\ 0\le\theta_v\le1,\ C_v^\top C_v=I_m\),以及 \(H,H_v,Q_v\) 各自的归一化/置换约束,变量集合 \(\Omega=\{C_v,Q_v,H,H_v,\theta_v,\beta_v\}\)。值得注意的是,这个目标里没有任何 \(\eta\) 类正则超参——杂质抑制由 \(\theta_v\) 自适应学习、视图重要性由 \(\beta_v\) 自动分配,全部从数据里解出来。\(\beta_v\) 甚至有闭式解 \(\beta_v = \frac{1/q_v}{\sum_{v}1/q_v}\)(\(q_v\) 为该视图的重构残差),自然给残差小(更可信)的视图更大权重。无超参正是「即插即用」承诺的来源:换个数据集不用重新调参。
4. 六步交替优化 + 对角化技巧:把每个子问题压到线性复杂度
整套目标用交替最小化求解,每轮按 \(C_v\!\to\!Q_v\!\to\!H\!\to\!H_v\!\to\!\theta_v\!\to\!\beta_v\) 六步更新。难点在于朴素实现里很多中间项(如 \(D_vE_v(\cdot)^\top\)、\(Q_vHE_vE_v^\top\))会逼近 \(O(n^2)\) 甚至更高。作者反复利用一个关键观察:\(E_vE_v^\top\) 是对角阵(每列只有一个 1),从而 \(D_vE_vE_v^\top\) 可等价写成逐元素积 \(D_v\odot B_v\)(\(B_v\) 由各行观测计数构成),\(HE_vE_v^\top\) 写成 \(H\odot G_v\)。靠这个对角化技巧,每个子问题都被改写成线性开销:更新 \(C_v\) 用 SVD(\(C_v=UV^\top\))为 \(O(m^2n+d_vnm+d_vm^2)\),\(Q_v\) 经向量化变成可被现成求解器处理的二值规划且降到 \(O(n)\),\(H\) 与 \(H_v\) 逐列闭式解(如 \(H_{:,j}=\max(\frac{1-\mathbf{1}^\top s_j}{m}\mathbf{1}+s_j,0)\))为 \(O(n)\),\(\theta_v\) 是带裁剪的二次最优解 \(O(n)\),\(\beta_v\) 闭式 \(O(n)\)。最终整体时间/空间复杂度对 \(n\) 线性(Remark 8/9),这是它能跑到 10 万级样本(YOUBESEL,101499 样本)而许多对手直接 OOM 的原因。
损失函数 / 训练策略¶
整个方法只有式 (5) 这一个统一目标,无额外正则项、无超参。优化是六步交替迭代(Algorithm 1)直到目标收敛,最后对共识图 \(H\) 做谱聚类输出标签。\(C_v\) 还带正交约束 \(C_v^\top C_v=I_m\) 以提升锚点判别性。
实验关键数据¶
主实验¶
6 个数据集(230~101499 样本,2~5 视图),与 12 个 IMVC 方法在 30%/60%/80% 三档缺失率下比 ACC/PUR/FSC。表中「NH」为该方法所需超参个数,PJFTH 为 0。下面摘取 60% 缺失率的代表性结果:
| 数据集 (60% 缺失) | 指标 | PJFTH (Ours) | 次优方法 | 对比 |
|---|---|---|---|---|
| ORLR | ACC | 52.31 | IVCBG 43.70 | +8.6 |
| ORLR | FSC | 35.84 | IVCBG 34.67 | +1.2 |
| WASHING | FSC | 49.31 | HCLGL 47.11 | +2.2 |
| NUJECTEN | FSC | 23.66 | USETL 18.76 | +4.9 |
| YOUBESEL | FSC | 14.53 | OSIMC 10.59 | +3.9 |
关键点:PJFTH 在多数场景(尤其 ORLR、YOUBESEL)取得最优,并且是表中唯一能在全部 6 个数据集上都跑出结果的方法——HCMSC/LSIVC/LRIVC/AGIMC/GRIMC/UIMC/USETL 在最大的 NUSWDBJ、YOUBESEL 上直接缺结果(表中为「-」),印证了线性复杂度带来的可扩展性。
消融实验¶
OVAL = 去掉双面亲和学习(VAL),OTH = 去掉拓扑校准(TH),均在 60% 缺失率下:
| 配置 | ORLR ACC | NUJECTEN ACC | YOUBESEL ACC | 说明 |
|---|---|---|---|---|
| OVAL(无双面学习) | 51.45 | 23.22 | 17.96 | 杂质未剥离 |
| OTH(无拓扑校准) | 51.59 | 23.68 | 18.21 | 锚点顺序未对齐 |
| Ours(完整) | 52.31 | 24.33 | 18.67 | 两块都加 |
关键发现¶
- 两个模块都正向有效:去掉 VAL 或 TH 任一都掉点,完整模型最优,说明「剥杂质」和「对齐锚点顺序」是两个互补的修补,而非冗余。
- 可扩展性是硬优势:资源对比(Fig. 2/3)显示 PJFTH 多数情况下运行时间更短、内存更省(受益于二部图方案),且能覆盖对手跑不动的大数据集。
- 次优情形的诚实归因:作者指出部分场景非最优,可能源于「先求谱嵌入再划分」的两阶段流程,而非直接解离散标签——这也写进了局限。
亮点与洞察¶
- Janus 双面分解是核心巧思:用一个 \(\theta_v\in[0,1]\) 把「共识」与「视图私有杂质」显式拆成两项重构同一个 \(D_vE_v\),让杂质有专门的容器 \(H_v\) 去吸收,而不是隐式污染共识图——这个「给干扰一个出口」的思路可迁移到任何需要分离公共/私有成分的多源融合任务。
- 无超参 = 真正即插即用:杂质强度(\(\theta_v\))和视图权重(\(\beta_v\))全部从数据闭式/自适应解出,省掉了 IMVC 里最烦的 \(\eta\) 调参,换数据集即用。
- 对角化加速可复用:反复利用 \(E_vE_v^\top\) 对角、把矩阵乘改写成 Hadamard 积(\(D_v\odot B_v\)、\(H\odot G_v\)),把多个子问题从 \(O(n^2)\) 压到 \(O(n)\),是处理「指示矩阵 × 大矩阵」的通用技巧。
局限与展望¶
- 正交锚点约束的副作用:作者承认 \(C_v^\top C_v=I_m\) 虽提升锚点判别性,但可能让锚点偏离原数据的空间分布;让锚点分布更贴近原数据有望进一步提升效果。
- 两阶段聚类放大方差:先建亲和图再谱划分的两阶段管线会加剧聚类方差;直接从原数据生成簇指示器是更稳的方向。
- ⚠️ 个人观察:消融只对比了「全去掉某模块」,没有单独验证置换矩阵 \(Q_v\) 的 unary 约束相对软对齐(如双随机松弛)的增益;\(\theta_v\) 学到的数值在干净/脏视图上的分布也未可视化,双面机制的可解释性还可再挖。
相关工作与启发¶
- vs 子空间/核方法(LSIVC, AGIMC, GRIMC):它们用全尺寸自表达或核学习解 IMVC,复杂度高、大数据上跑不动;PJFTH 用锚点二部图把复杂度压到线性,作者的实验也显示 anchor 策略在结果上更优。
- vs 普通锚点共识方法(如 PIMVC, OSIMC):同样用锚点,但它们既没显式处理视图私有杂质、也没对齐锚点顺序,且常带正则超参;PJFTH 在锚点框架上叠了「双面剥杂质 + 拓扑校准」两块修补并去掉超参。
- vs 缺失补全/对比式方法(基于插补、原型对比):那类方法侧重「补回缺失」或「构造正负对」,PJFTH 不做显式补全,而是从「净化共识表示 + 对齐锚点」角度绕开缺失带来的结构畸变。
评分¶
- 新颖性: ⭐⭐⭐⭐ 双面亲和分离杂质 + 置换对齐锚点 + 全程无超参的组合在 IMVC 里有清晰增量
- 实验充分度: ⭐⭐⭐⭐ 6 数据集 × 3 缺失率 × 12 对手,覆盖到 10 万级,消融/时空开销/收敛都给了
- 写作质量: ⭐⭐⭐⭐ 公式推导(六步更新 + 线性复杂度证明)严谨,但符号密集、消融偏简略
- 价值: ⭐⭐⭐⭐ 无超参、线性复杂度、即插即用,对大规模 IMVC 落地实用性强