Deep Learning Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging¶

会议: CVPR2025
arXiv: 2603.12715
代码: 未开源
领域: 医学图像
关键词: 无创血糖估计, 巩膜血管成像, 多视图学习, Transformer 融合, MRFO 特征优化

一句话总结¶

提出 ScleraGluNet，通过五方向巩膜血管图像结合多分支 CNN + MRFO 特征筛选 + Transformer 跨视图融合，实现三分类代谢状态判别（93.8% 准确率）和连续空腹血糖估计（MAE = 6.42 mg/dL），为无创血糖监测提供了新途径。

研究背景与动机¶

糖尿病全球患病人数 2021 年达 5.37 亿，预计 2045 年将达 7.83 亿，长期高血糖引发微/大血管并发症
现有金标准检测（FPG、OGTT、HbA1c）均需抽血，日常监测负担重；CGM 虽减少指尖血，但仍需皮下植入且成本高
眼表微血管（巩膜/结膜）可直接观察，且已有研究证实糖尿病引起结膜血管形态改变（迂曲、密度变化），但缺乏基于深度学习的多视角系统性利用
核心动机：单视角采集丢失了不同巩膜区域的异质性血管信息；需要多方向采集 + 跨视图融合来全面捕获与血糖相关的微血管特征

方法详解¶

整体框架¶

ScleraGluNet 是一个多视图多任务深度学习架构，包含四个核心模块：

图像预处理与血管增强
五路并行 CNN 特征提取
MRFO 特征精炼 + Transformer 跨视图融合
分类/回归双输出

数据采集与预处理¶

数据集：445 名受试者（正常 150 / 控制型糖尿病 140 / 高血糖糖尿病 155），每人五个注视方向（正前、上、下、鼻、颞），共 2,225 张前节段图像
预处理流程：质量控制 → ROI 提取（去除眼睑/睫毛背景）→ 颜色/亮度归一化 → CLAHE 对比度增强 → Frangi 滤波器管状结构增强 → 二值掩码验证

网络设计¶

五路并行 CNN 分支：每个注视方向对应一支独立参数的 CNN，提取方向特异的局部血管特征（口径变化、迂曲度、分支复杂度）
MRFO 特征精炼：Manta Ray Foraging Optimization（蝠鲼觅食优化）算法筛选特征子集，去除冗余/高相关特征，保留最具区分力的血管表征
Transformer 跨视图融合：自注意力机制建模不同巩膜区域间的远距离依赖，识别跨象限的血管模式（如颞-鼻侧不对称重塑）
双输出头：分类头输出三类代谢状态概率；回归头估计连续 FPG（mg/dL）

损失函数¶

复合损失 = 交叉熵损失（分类）+ MSE 损失（回归），多任务联合学习。

训练策略¶

受试者级五折交叉验证（GroupKFold），同一受试者的所有图像仅出现在同一折，避免数据泄露
95% CI 通过受试者级 bootstrap 重采样（1000 次）估计
Adam 优化器，学习率、batch size、epoch 数和任务损失权重通过验证集调优
评估在受试者层面（非图像层面）进行，确保结果反映真实泛化能力

实验关键数据¶

指标	数值
三分类总体准确率	93.8%（五折均值 93.7% ± 0.7%）
正常组召回率	94.0%（141/150）
控制型糖尿病召回率	92.1%（129/140）
高血糖糖尿病召回率	93.5%（145/155）
AUC（正常 / 控制型 / 高血糖）	0.971 / 0.956 / 0.982
FPG 估计 MAE	6.42 mg/dL
FPG 估计 RMSE	7.91 mg/dL
Pearson r / R²	0.983 / 0.966
Bland-Altman 均值偏差	+1.45 mg/dL
95% 一致性界限	-8.33 ~ +11.23 mg/dL

消融实验（分类准确率递增）： - 单视图 CNN baseline < 多视图 CNN（无 MRFO/Transformer）< 多视图 + MRFO < 完整 ScleraGluNet，各模块贡献显著

关键发现： - 误分主要发生在相邻代谢类别之间（控制型 vs 高血糖），符合血糖连续谱的临床特点 - Grad-CAM/Grad-CAM++ 可视化显示模型关注集中在巩膜血管区域，高血糖组呈现跨注视方向一致的强激活 - 五折准确率稳定：各折准确率范围 92.8%~94.6%，标准差仅 0.7%，说明结果不依赖于有利的数据划分 - 代表性案例分析：正常组血管细匀流畅，控制型出现轻度迂曲，高血糖组出现明显的血管扩张、螺旋和不均匀管径变化

亮点¶

多方向采集设计创新：首次系统利用五个注视方向的巩膜图像，捕获空间异质性微血管信息
完整闭环：从图像采集协议到预处理、特征提取、融合、双任务输出的端到端设计
临床可行性：仅需前节段相机（无需散瞳/眼底成像），适合远程医疗和大规模筛查
严谨验证：受试者级分折 + bootstrap CI + Bland-Altman 分析，避免了常见的数据泄露问题
双任务联合学习：分类 + 回归共享特征表示，互相促进性能提升

局限性¶

单中心研究（长沙爱尔眼科），缺乏多中心外部验证，泛化性待考
未控制高血压、吸烟、贫血等可能影响巩膜血管的混杂因素
仅关注空腹血糖，未纳入餐后血糖或纵向监测数据
Grad-CAM 仅提供粗略定位，不能作为血管病理的精确指标
数据集规模有限（445 人），深度学习模型可能存在过拟合风险

评分¶

新颖性: ⭐⭐⭐⭐ (多方向巩膜成像+跨视图融合的无创血糖估计是新颖思路)
实验充分度: ⭐⭐⭐⭐ (五折交叉验证+消融+Bland-Altman+Grad-CAM，但缺外部验证)
写作质量: ⭐⭐⭐ (结构清晰但部分段落冗余，介绍部分有不连贯段落)
价值: ⭐⭐⭐⭐ (临床应用前景好，但需多中心验证才能走向实际部署)