Learning a Distance Measure from the Information-Estimation Geometry of Data¶

会议: ICLR 2026
arXiv: 2510.02514
代码: GitHub
领域: 度量学习 / 感知质量评估
关键词: 信息估计度量, 去噪误差, 概率密度几何, 感知距离, 扩散模型

一句话总结¶

提出 Information-Estimation Metric (IEM)，一种由数据概率密度几何诱导的新型距离函数，通过比较不同噪声水平下的 score 向量场来度量信号间距离，无监督训练的 IEM 在预测人类感知判断上可媲美有监督方法。

IEM 建立在 pointwise I-MMSE 公式之上：信号的对数概率可分解为最优去噪器在不同 SNR 水平上的去噪误差。通过比较两个信号周围的 score 向量场来定义距离。

IEM 定义: 比较两点 $\boldsymbol{x}_1, \boldsymbol{x}_2$ 周围模糊密度的 score 向量场差异： $$\text{IEM}(\boldsymbol{x}_1, \boldsymbol{x}_2, \Gamma) = \left(\int_0^\Gamma \mathbb{E}\left[\|\nabla \log p_{\mathbf{y}_\gamma}(\gamma \boldsymbol{x}_1 + \mathbf{w}_\gamma) - \nabla \log p_{\mathbf{y}_\gamma}(\gamma \boldsymbol{x}_2 + \mathbf{w}_\gamma)\|^2\right] d\gamma\right)^{1/2}$$ 其中 $\gamma$ 为信噪比，$\mathbf{w}_\gamma$ 为维纳过程噪声。IEM 可用训练好的去噪器（类似扩散模型）近似计算。
度量性质: 证明 IEM 是合法的距离度量（对称性、非负性、正定性、三角不等式）。对高斯分布，IEM 退化为 Mahalanobis 距离：$\text{IEM} = \sqrt{(\boldsymbol{x}_1 - \boldsymbol{x}_2)^\top \Sigma^{-1} (\boldsymbol{x}_1 - \boldsymbol{x}_2)}$
局部黎曼度量: 二阶展开给出黎曼度量 $\boldsymbol{G}(\boldsymbol{x}, \Gamma)$： $$\boldsymbol{G}(\boldsymbol{x}, \Gamma) = \int_0^\Gamma \gamma^2 \mathbb{E}\left[(\nabla^2 \log p_{\mathbf{y}_\gamma}(\gamma \boldsymbol{x} + \mathbf{w}_\gamma))^2\right] d\gamma$$ 直觉：在 log 密度曲率高的区域和导致概率变化大的扰动方向上更敏感。
广义 IEM: 引入可学习函数 $f$ 调制 score 差异的权重，使 IEM 可适应不同感知任务（如纹理相似性 vs 失真评估）。

方法	是否监督	TID2013	LIVE	CSIQ	TQD(纹理)
PSNR	否	0.69	0.87	0.81	0.34
SSIM	否	0.64	0.91	0.82	0.51
LPIPS	是	0.71	0.94	0.88	0.48
DISTS	是	0.83	0.95	0.93	0.83
TOPIQ	是	0.86	0.97	0.95	0.67
IEM (无监督)	否	0.83	0.96	0.94	0.51
IEM_sq (无监督)	否	0.66	0.82	0.79	0.79
IEM_fω (有监督f)	部分	0.84	0.96	0.94	0.77

操作	IEM 结果	DISTS 结果	说明
最小化度量(PSNR=10dB)	无伪影高质量	明显伪影	IEM作为优化目标更鲁棒
最大化度量(PSNR=10dB)	非结构化噪声	模式化伪影	IEM对偏离数据支撑的扰动最敏感