Deep Learning–Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging¶

会议: CVPR 2026
arXiv: 2603.12715
代码: 无
领域: 医学图像分析 / 无创检测
关键词: scleral imaging, noninvasive glucose estimation, multiview learning, transformer fusion, MRFO

一句话总结¶

提出ScleraGluNet多视角深度学习框架，通过五方向巩膜血管成像结合多分支CNN+MRFO特征精炼+Transformer跨视角融合，实现93.8%代谢状态三分类精度和MAE=6.42 mg/dL的空腹血糖连续估计。

研究背景与动机¶

糖尿病监测的痛点：全球糖尿病患者预计到2045年达7.83亿。现有金标准检测（FPG/OGTT/HbA1c）均依赖血液采样，频繁检测不便且有感染风险。CGM虽减少了指尖采血频率，但仍需皮下传感器植入且成本较高。迫切需要非侵入式监测方案。

巩膜血管的独特优势：与需要专业设备的视网膜成像不同，巩膜/结膜微血管可通过低成本前节段相机直接可视化。慢性高血糖导致巩膜微血管重塑（血管口径变化、迂曲度增加、分支模式改变、灌注密度下降），这些改变在OCTA等研究中已被证实。

现有方法的不足：(1) 单视角采集仅覆盖有限巩膜区域，丢失区域特异性血管异常信息；(2) 不同象限的微血管重塑具有非均匀性，需要多方向成像全面捕获；(3) 缺乏同时处理分类和回归的多任务架构。

方法详解¶

整体框架¶

标准化多方向巩膜图像采集（5方向×每人5张）→ ROI提取+CLAHE+Frangi血管增强预处理 → 5个独立参数CNN分支特征提取 → MRFO特征精炼去冗余 → Transformer跨视角自注意力融合 → 分类头(3类softmax) + 回归头(FPG估计)。

关键设计¶

多方向标准化采集协议：
- 功能：从正前方(straight)、上方(superior)、下方(inferior)、鼻侧(nasal)、颞侧(temporal)5个注视方向采集巩膜照片
- 核心思路：不同象限展现不同的糖尿病相关微血管改变——颞侧和鼻侧可能有非对称重塑、上下方有不同灌注特征。多方向采集确保保留区域特异性细节
- 设计动机：先前研究已证实糖尿病引起的结膜/巩膜内微血管病变具有空间非均匀性。单视角必然丢失关键诊断信息
MRFO特征精炼 + Transformer跨视角融合：
- 功能：5个CNN分支输出的特征拼接后，先用蝠鲼觅食优化(MRFO)算法选择最优特征子集消除冗余，再用Transformer自注意力建模跨象限远程血管关联
- 核心思路：MRFO是生物启发式特征选择算法，通过群智能搜索在高维特征空间中识别相关且非冗余的特征子集。Transformer的自注意力捕获多象限间的细微血管模式关联（如跨区域非对称重塑、跨象限一致性退化）
- 设计动机：5分支拼接产生高维冗余特征，直接输入Transformer效率和效果均不佳。MRFO先筛选后Transformer融合的级联设计可理解为"先去噪再关联"
多任务学习的双头输出：
- 功能：同时进行三分类（正常/受控糖尿病/高血糖糖尿病）和连续FPG值回归
- 核心思路：分类头使用softmax输出3类概率，回归头直接输出FPG估计值(mg/dL)。两个任务共享底层特征表示，通过互补学习信号提升整体性能
- 设计动机：分类和回归从不同角度利用血管特征——分类关注类间边界特征，回归关注连续变化趋势。联合训练通过多任务正则化效应防止过拟合

损失函数 / 训练策略¶

复合损失：Cross-Entropy（分类）+ MSE（血糖回归），按经验调优权重
Subject-wise 5-fold交叉验证：同一受试者所有5张图像严格归入同一fold，防止数据泄漏
Adam优化器，超参在每fold验证集上经验调优
Bootstrap重采样1000次计算95%置信区间
排除标准：眼表疾病、活动性感染、近期手术等，确保巩膜成像质量

实验关键数据¶

主实验¶

指标	分类结果	回归结果
总体准确率	93.8% (CI: 91.8-95.4%)	-
正常组准确率	94.0% (141/150)	-
受控组准确率	92.1% (129/140)	-
高血糖组准确率	93.5% (145/155)	-
AUC (正常/受控/高血糖)	0.971 / 0.956 / 0.982	-
MAE	-	6.42 mg/dL
RMSE	-	7.91 mg/dL
相关系数 r	-	0.983
R²	-	0.966
Bland-Altman偏差	-	+1.45 mg/dL (LOA: -8.33~+11.23)

数据集规模：445人×5张=2225张巩膜图像（正常150/受控140/高血糖155）。

消融实验¶

配置	分类准确率	MAE (mg/dL)
单视角CNN	较低	较高
多视角CNN (无MRFO/Transformer)	提升	下降
+ MRFO特征精炼	进一步提升	进一步下降
+ Transformer融合 (完整)	93.8%	6.42

关键发现¶

多方向采集对分类和回归均有显著提升，验证了巩膜血管异常的区域异质性假设
误分类主要发生在相邻代谢状态之间（正常↔受控），符合血糖水平的连续谱特征
5-fold各fold准确率范围92.8%-94.6%，稳定性良好
Bland-Altman分析显示与实验室测量有较好一致性，95%点在±11 mg/dL内

亮点与洞察¶

新颖的无创检测途径：利用巩膜微血管（而非视网膜）进行代谢状态评估，成像设备要求低，有远程医疗潜力
多方向采集协议的设计有生理学依据——不同象限的巩膜血管对高血糖的响应确实不同
MRFO+Transformer的级联"去冗余→建关联"设计在多视角融合场景中很有参考价值

局限与展望¶

单中心数据集（长沙爱尔眼科），445人样本量有限，泛化性存疑
排除了眼表疾病患者，但实际临床中糖尿病患者常伴随眼表异常
未与现有无创方法（PPG、热成像）做直接对比
采集标准化依赖手动ROI提取，自动化程度不够
分类为三类的粒度较粗，更细粒度的血糖分段可能更有临床价值

评分¶

新颖性: ⭐⭐⭐ 巩膜多方向血管成像估血糖的思路新颖，但架构创新有限
实验充分度: ⭐⭐⭐ 有详细的分类/回归/Bland-Altman分析，但单中心小样本且缺少与其他无创方法对比
写作质量: ⭐⭐⭐ 临床背景阐述充分，但方法描述部分行文冗余
价值: ⭐⭐⭐ 概念验证阶段，需多中心验证和自动化改进才有临床转化可能