SCDL: Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation¶

会议: CVPR 2026
arXiv: 2603.05202
代码: github.com/Zyh55555/SCDL
领域: 医学图像分割 / 半监督学习
关键词: 半监督分割, 类不平衡, 分布对齐, 语义锚, 即插即用

一句话总结¶

提出即插即用的语义类分布学习框架 SCDL，通过类分布双向对齐（CDBA）学习结构化类条件特征分布 + 语义锚约束（SAC）引导代理分布对齐真实语义，解决半监督医学分割中的监督偏差和表示不平衡，在少数类分割上取得 SOTA。

研究背景与动机¶

领域现状：半监督医学图像分割（SSMIS）利用无标签数据缓解标注负担。常用策略包括一致性正则化和对比表示学习。

现有痛点：医学分割数据天然存在严重类不平衡（大器官像素远多于小器官）。结合半监督机制产生双重问题：(i) 监督偏差——自生成伪标签和一致性约束进一步强化头部类学习，尾部类训练不足；(ii) 表示不平衡——头部类特征紧凑，尾部类特征漂移到头部类主导区域，模糊类边界。

核心矛盾：现有去偏方法（重加权、输出校准）仅在损失/输出层操作，缺乏对类条件特征分布的直接约束；无标签数据多用于局部一致性正则化，未被利用来显式纠正类条件特征偏斜。

切入角度：在嵌入空间中为每个语义类学习可学习代理分布，通过双向对齐使所有类（包括少数类）都获得一致的学习信号。

核心 idea：将去偏从损失/输出层提升到特征分布层，通过代理分布双向对齐和语义锚约束重塑类条件特征结构。

方法详解¶

整体框架¶

现有分割网络 → 编码器输出嵌入 \(\mathbf{Z} \in \mathbb{R}^{B \times L \times D}\) → CDBA 模块为每类维护可学习代理分布 \(\mathcal{N}(\mu_c, \text{diag}(\sigma_c^2))\) 并执行双向对齐 → 代理采样生成三种先验（分布加权/中心相似/token采样）注入解码器 → SAC 从标注区域提取语义锚对齐代理 → 即插即用，不改变基线训练流程。

关键设计¶

类分布双向对齐 (CDBA)
- 功能：在嵌入空间中学习每类的代理分布，并通过双向对齐使嵌入和代理互相靠近
- 核心思路：每类建模为高斯代理 \(p(u|c) = \mathcal{N}(\mu_c, \text{diag}(\sigma_c^2))\)。软分配 \(P(c|z) = \text{softmax}_c(\cos(z, \mu_c))\) 允许每个嵌入与多类关联。E2P 损失 \(\mathcal{L}_{E2P} = \sum P(c|z) [1 - \cos(z, \mu_c)]\) 拉嵌入向代理，P2E 损失 \(\mathcal{L}_{P2E} = \frac{1}{C}\sum_c \exp(-({\mathcal{E}_c^+ - \mathcal{E}_c^-}))\) 推代理识别自身嵌入
- 设计动机：单向对齐（仅 E2P）使头部类代理主导梯度，少数类嵌入仍被吸引到头部区域；双向约束确保每个代理都主动学习区分自身嵌入，少数类代理也能形成紧凑分布
语义锚约束 (SAC)
- 功能：用标注数据为每个代理提供可靠的语义监督，防止代理偏离真实类语义
- 核心思路：对每类 \(c\)，从标注图像的类特定区域提取编码器嵌入均值作为语义锚 \(\text{anchor}_c = \frac{1}{|\mathcal{Z}_c|}\sum_{z \in \mathcal{Z}_c} z\)（反向传播时 detach 防止梯度回流编码器）。对齐损失 \(\mathcal{L}_{SAC} = \frac{1}{C}\sum_c [1 - \cos(\mu_c, \text{anchor}_c)]\)
- 设计动机：代理随机初始化且主要从无标签数据学习，可能偏离真实语义。标注数据提供的语义锚是唯一可靠的类级别监督信号
代理采样特征增强
- 功能：从学到的代理分布中采样，构造三种互补先验注入解码器各阶段
- 核心思路：(i) 分布加权先验——从代理采样 \(S\) 次计算加权均值 \(\mathbf{r}^{dist}\)，反映分布级结构含方差；(ii) 中心相似先验——直接用代理均值加权 \(\mathbf{r}^{center}\)，忽略方差提供互补信号；(iii) token采样先验——局部扰动采样增强鲁棒性。三者拼接后轻量投影注入解码器
- 设计动机：仅用代理均值忽略分布形状，仅用采样有噪声——三种先验互补，使头尾类都有效贡献到分割

损失函数 / 训练策略¶

总损失 = 基线分割损失 + \(\mathcal{L}_{E2P}\) + \(\mathcal{L}_{P2E}\) + \(\mathcal{L}_{SAC}\)。SCDL 作为即插即用模块集成到 GenericSSL、DHC、GA-CPS、GA-MagicNet 四种基线。权重衰减 1e-4。NVIDIA A40 GPU，batch size 4。

实验关键数据¶

主实验¶

方法	Synapse 20% DSC↑	Synapse ASD↓	AMOS 5% DSC↑	AMOS ASD↓
GenericSSL	55.94	6.14	35.73	45.82
SCDL-GenericSSL	58.90 (+2.96)	5.79	47.35 (+11.62)	22.84
GA-CPS	66.29	5.44	50.90	13.77
SCDL-GA-CPS	67.50 (+1.21)	3.32	61.57 (+10.67)	10.08
GA-MagicNet	66.00	3.42	59.15	8.66
SCDL-GA-MagicNet	66.75 (+0.75)	3.65	62.16 (+3.01)	5.65
DHC	46.16	10.04	40.11	40.65
SCDL-DHC	49.17 (+3.01)	10.59	49.28 (+9.17)	17.47

消融实验（Synapse 逐类 Dice）¶

类别	GA-CPS	SCDL-GA-CPS	变化	类型
胆囊 (Ga)	26.7	25.4	-1.3	尾部
食管 (Es)	40.2	38.7	-1.5	尾部
胰腺 (PA)	45.5	49.4	+3.9	尾部
右肾上腺 (RAG)	44.7	49.2	+4.5	尾部
脾 (Sp)	85.5	88.2	+2.7	头部
肝 (Li)	92.7	93.7	+1.0	头部

关键发现¶

AMOS 5% 标注下提升最显著（DSC 最高 +11.62%），验证标注极稀缺时 SCDL 优势最大
DHC 基线上 ASD 从 40.65 降至 17.47（\(\downarrow 23.18\)），边界误差大幅改善
尾部类（胰腺、肾上腺）提升明显（+3.9/+4.5 Dice），但个别尾部类（胆囊、食管）仍有小幅下降——极小结构的代理学习仍需更多信号
即插即用一致提升四种不同基线，验证框架通用性

亮点与洞察¶

将去偏从损失/输出层提升到特征分布层——概念上更根本：不是让模型"忽略"不平衡，而是显式重塑特征空间使各类分布结构化
双向对齐设计巧妙——E2P 让嵌入找到对的代理，P2E 让代理主动区分自己的嵌入，两个方向的优化目标互补
语义锚 detach 编码器梯度是关键细节——只更新代理，不干扰编码器的表示学习

局限与展望¶

个别极小尾部类（胆囊 Dice 25.4→不升反降）仍未解决——可能需要最小样本数保障
代理分布假设高斯可能过于简化，混合分布或 normalizing flow 可建模更复杂的类条件结构
仅在 CT 多器官分割验证，病理学、眼底等其他模态未测试
代理数量与类别数绑定，对细粒度子类场景可能不够灵活

评分¶

新颖性: ⭐⭐⭐⭐ 分布层面去偏思路新颖，双向对齐 + 语义锚组合优雅
实验充分度: ⭐⭐⭐⭐ 四种基线 × 两数据集全面验证，含逐类分析
写作质量: ⭐⭐⭐⭐ 问题分析清晰，三范式对比图直观
实用价值: ⭐⭐⭐⭐ 即插即用设计实际部署友好