Enhancing Image-Conditional Coverage in Segmentation: Adaptive Thresholding via Differentiable Miscoverage Loss¶
会议: ICLR 2026
代码: bjbbbb/Conditional-Optimization-for-Adaptive-Thresholding
领域: segmentation
关键词: conformal prediction, image-conditional coverage, adaptive thresholding, differentiable miscoverage loss, uncertainty quantification
一句话总结¶
提出 COAT 框架,通过可微的 sigmoid soft TPR 近似作为损失函数,端到端训练图像自适应阈值预测器,在图像分割的 Conformal Risk Control 中大幅缩小逐图像覆盖率偏差(Coverage Gap)。
研究背景与动机¶
领域现状:Conformal Risk Control(CRC)为图像分割提供了边际统计保证,通过在校准集上搜索单一阈值 \(\tau'\) 来控制假阴性率(FNR)。现有痛点:单一全局阈值对不同图像一刀切——"容易"图像过度覆盖而"困难"图像严重欠覆盖,导致 Coverage Gap(逐图像 TPR 与目标覆盖率 \(1-\alpha\) 之差的均值)居高不下;且阈值与覆盖率之间的关系并非单调连续(图 2 所示),无法对覆盖率直接求梯度。核心矛盾:边际保证(平均 FNR ≤ α)≠ 条件保证(每张图的 FNR ≤ α),前者已被 CRC 解决,后者在高风险场景(医疗、自动驾驶)中才是真正需求。本文目标:为每张图像学习一个图像自适应阈值 \(\hat{\tau}(X)\),使其逐图覆盖率尽量贴近目标 \(1-\alpha\)。核心 idea:用 sigmoid 函数将硬阈值二值化替换为软掩码,将 TPR 变成关于 \(\hat{\tau}\) 的可微量,从而定义可端到端优化的 miscoverage loss,绕开预计算最优阈值的繁琐流程。
方法详解¶
整体框架¶
论文提出两个递进方案:AT(有监督回归基线)和 COAT(端到端可微优化)。两者共享同一阈值预测器 \(f_D\),输入为图像 \(X\) 与基础分割模型的概率图 \(\hat{p}(X)\);区别在于训练目标——AT 用预计算的最优硬阈值监督,COAT 用软 TPR 直接优化条件覆盖。训练结束后,两者都在校准集上求一个全局修正量 \(t'\) 来维持边际保证。
flowchart TD
A["输入图像 X"] --> B["基础分割模型\n输出概率图 p̂(X)"]
A --> C["阈值预测器 fD(X, p̂(X))"]
B --> C
C --> D["预测阈值 τ̂(X)"]
D --> E{"COAT训练"}
B --> E
E --> F["软掩码 Msoft = σ((p̂-τ̂)/T)"]
F --> G["软TPR = ΣMsoft·Y / ΣY"]
G --> H["LCOAT = (软TPR - (1-α))²"]
H --> |"梯度回传"| C
D --> I["校准集修正 t'"]
I --> J["最终阈值 τ'i = clip(τ̂i - t', 0, 1)"]
J --> K["预测集 Ĉ(X) = {p̂(X) ≥ τ'i}"]
关键设计¶
1. AT:有监督阈值回归——奠定自适应框架基础
AT 将阈值预测视为监督回归:对训练集中每张图像 \((X_i, Y_i)\),用二分搜索预计算"理想阈值" \(\tau^*(X, Y)\) 使 TPR 恰好等于 \(1-\alpha\),再以 MSE 监督训练 \(f_D\):
AT 直接回归阈值标量,简洁有效,但依赖预计算,且阈值与覆盖率关系非单调时误差较大。
2. COAT:可微 miscoverage loss——直接优化条件覆盖
COAT 的核心洞察:硬阈值二值化 \(\mathbf{1}[\hat{p}_j \geq \hat{\tau}]\) 不可微,用 sigmoid 替换得软掩码:
其中温度参数 \(T > 0\) 控制 sigmoid 的陡峭程度(\(T \to 0\) 趋近硬阈值)。软 TPR 为:
损失函数直接惩罚软 TPR 与目标覆盖率之差:
梯度可从 \(\mathcal{L}_\text{COAT}\) 流经 \(M_\text{soft}\) 回传至 \(f_D\) 参数,无需任何中间监督标签。
3. 后验校准修正——在自适应阈值上叠加边际保证
COAT 训练仅优化条件覆盖,边际保证由校准集补足:在 \(D_\text{cal}\) 上计算全局修正量
其中 \(R(t)\) 为将所有校准图像阈值平移 \(-t\) 后的经验覆盖率。最终测试阈值 \(\tau'_i = \text{clip}(\hat{\tau}_i - t', 0, 1)\)。该步骤赋予 AT/COAT 有限样本边际保证(定理 1,继承自 CRC 理论)。
4. 阈值预测器架构
\(f_D\) 以图像 \(X\) 与概率图 \(\hat{p}(X)\) 通道拼接后的张量为输入,输出单标量 \(\hat{\tau}(X) \in [0,1]\)。架构与基础分割模型无关,可灵活替换(实验中与 DeepLab v3+、UNet、PSPNet、SINet 均兼容)。
实验关键数据¶
主实验¶
以下列出 Polyp 数据集、PSPNet 基础模型、\(\alpha=0.1\) 条件下各方法对比(20 次随机划分均值±标准差):
| 方法 | Marginal Coverage | Coverage Gap ↓ |
|---|---|---|
| CRC | 0.906 (0.019) | 0.150 (0.015) |
| AA-CRC | 0.908 (0.018) | 0.119 (0.016) |
| AT | 0.899 (0.018) | 0.119 (0.014) |
| COAT | 0.894 (0.016) | 0.110 (0.015) |
Polyp+SINet,\(\alpha=0.1\):COAT Coverage Gap 0.102 vs CRC 0.149(降低 31%)。Skin+DeepLab v3+,\(\alpha=0.2\):COAT 0.073 vs CRC 0.107(降低 32%)。COAT 在 3 个数据集(Polyp/Fire/Skin)× 4 个模型(Deeplab/UNet/PSPNet/SINet)× 2 个 \(\alpha\) 值共 24 组实验中一致排名最优 Coverage Gap。
消融实验¶
| 配置 | Coverage Gap(Polyp, PSPNet, α=0.1) | 说明 |
|---|---|---|
| CRC(无自适应) | 0.150 | 全局单阈值基线 |
| AT(有监督回归) | 0.119 | 自适应但依赖硬阈值预计算 |
| COAT(可微损失) | 0.110 | 端到端直接优化条件覆盖 |
温度 \(T\) 的消融(附录 A.5):\(T\) 过小趋近硬阈值梯度消失,\(T\) 过大软化过度偏离目标;中等温度最优。
关键发现¶
- COAT 在全部实验组合中 Coverage Gap 最优,且边际覆盖率依然满足(≈目标 \(1-\alpha\)),两者不冲突。
- COAT 训练损失快速稳定收敛至接近 0,对 4 种不同基础分割模型均如此(图 5)。
- 定性可视化(图 3/4):CRC 在困难图像上 FNR 高达 0.613,COAT 能把几乎所有图像控制在目标 FNR 附近。
- Fire 数据集上提升相对较小(因该数据集图像间难度差异较小),体现方法在高异质数据集上优势更突出。
亮点与洞察¶
- 可微化思路干净:将不可微的指示函数替换为 sigmoid 软掩码这一操作简洁,却赋予整个 TPR 的可微性,让"直接优化覆盖率"从理论可行变为工程可实现。
- 理论保证完整:COAT 不放弃边际保证——用后验校准修正 \(t'\) 恢复 CRC 有限样本理论,实现"条件覆盖优化 + 边际保证叠加"。
- 模型无关性:\(f_D\) 以任意分割模型的概率图为输入,不需要改动基础模型,可作为即插即用后处理模块。
- Coverage Gap 指标引入:用逐图像覆盖率与目标覆盖率之差衡量条件覆盖质量,比边际覆盖率更细粒度,值得借鉴。
局限与展望¶
- \(f_D\) 的训练需要独立的 \(D_2\)(与基础分割模型训练的 \(D_1\) 分离),增加了数据划分复杂度和对数据量的要求。
- 温度 \(T\) 是超参数,需要额外调节;\(T\) 的最优值依赖数据集和模型特性,缺乏自适应确定方案。
- 当前仅针对二值分割(前景/背景),多类别语义分割的条件覆盖扩展有待探索。
- 条件有效性的理论证明(附录 A.1)依赖强分布假设,实际保证强度弱于边际保证。
相关工作与启发¶
- vs CRC(Angelopoulos et al., 2024):CRC 是本文的基础,提供边际保证;COAT 在其之上增加图像级自适应,弥补 CRC 在条件覆盖上的缺口。
- vs AA-CRC(Blot et al., 2025):AA-CRC 也尝试自适应阈值,但未使用可微优化;COAT 通过端到端训练进一步降低 Coverage Gap。
- vs SACP(Bereska et al., 2025):SACP 在空间维度(像素邻域)上自适应,而 COAT 在图像维度(整图阈值)上自适应,两者互补。
- 对分割不确定性估计的启发:软阈值化思路可推广到其他需要可微覆盖控制的任务,如目标检测框的条件覆盖控制。
评分¶
- 新颖性: ⭐⭐⭐⭐ 可微 miscoverage loss 的构造思路新颖,将覆盖率优化从"校准后处理"推进到"训练目标"
- 实验充分度: ⭐⭐⭐⭐ 3 数据集 × 4 模型 × 2 α 共 24 组全面覆盖,定性可视化直观
- 写作质量: ⭐⭐⭐⭐ 问题建模清晰,AT 与 COAT 的递进关系逻辑流畅,算法伪代码完整
- 价值: ⭐⭐⭐⭐ 对医疗/自驾等高风险场景的分割不确定性量化有直接实用价值