Deep Learning Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging¶
会议: CVPR2025
arXiv: 2603.12715
代码: 未开源
领域: 医学图像
关键词: 无创血糖估计, 巩膜血管成像, 多视图学习, Transformer 融合, MRFO 特征优化
一句话总结¶
提出 ScleraGluNet,通过五方向巩膜血管图像结合多分支 CNN + MRFO 特征筛选 + Transformer 跨视图融合,实现三分类代谢状态判别(93.8% 准确率)和连续空腹血糖估计(MAE = 6.42 mg/dL),为无创血糖监测提供了新途径。
研究背景与动机¶
- 糖尿病全球患病人数 2021 年达 5.37 亿,预计 2045 年将达 7.83 亿,长期高血糖引发微/大血管并发症
- 现有金标准检测(FPG、OGTT、HbA1c)均需抽血,日常监测负担重;CGM 虽减少指尖血,但仍需皮下植入且成本高
- 眼表微血管(巩膜/结膜)可直接观察,且已有研究证实糖尿病引起结膜血管形态改变(迂曲、密度变化),但缺乏基于深度学习的多视角系统性利用
- 核心动机:单视角采集丢失了不同巩膜区域的异质性血管信息;需要多方向采集 + 跨视图融合来全面捕获与血糖相关的微血管特征
方法详解¶
整体框架¶
ScleraGluNet 是一个多视图多任务深度学习架构,包含四个核心模块:
- 图像预处理与血管增强
- 五路并行 CNN 特征提取
- MRFO 特征精炼 + Transformer 跨视图融合
- 分类/回归双输出
数据采集与预处理¶
- 数据集:445 名受试者(正常 150 / 控制型糖尿病 140 / 高血糖糖尿病 155),每人五个注视方向(正前、上、下、鼻、颞),共 2,225 张前节段图像
- 预处理流程:质量控制 → ROI 提取(去除眼睑/睫毛背景)→ 颜色/亮度归一化 → CLAHE 对比度增强 → Frangi 滤波器管状结构增强 → 二值掩码验证
网络设计¶
- 五路并行 CNN 分支:每个注视方向对应一支独立参数的 CNN,提取方向特异的局部血管特征(口径变化、迂曲度、分支复杂度)
- MRFO 特征精炼:Manta Ray Foraging Optimization(蝠鲼觅食优化)算法筛选特征子集,去除冗余/高相关特征,保留最具区分力的血管表征
- Transformer 跨视图融合:自注意力机制建模不同巩膜区域间的远距离依赖,识别跨象限的血管模式(如颞-鼻侧不对称重塑)
- 双输出头:分类头输出三类代谢状态概率;回归头估计连续 FPG(mg/dL)
损失函数¶
复合损失 = 交叉熵损失(分类)+ MSE 损失(回归),多任务联合学习。
训练策略¶
- 受试者级五折交叉验证(GroupKFold),同一受试者的所有图像仅出现在同一折,避免数据泄露
- 95% CI 通过受试者级 bootstrap 重采样(1000 次)估计
- Adam 优化器,学习率、batch size、epoch 数和任务损失权重通过验证集调优
- 评估在受试者层面(非图像层面)进行,确保结果反映真实泛化能力
实验关键数据¶
| 指标 | 数值 |
|---|---|
| 三分类总体准确率 | 93.8%(五折均值 93.7% ± 0.7%) |
| 正常组召回率 | 94.0%(141/150) |
| 控制型糖尿病召回率 | 92.1%(129/140) |
| 高血糖糖尿病召回率 | 93.5%(145/155) |
| AUC(正常 / 控制型 / 高血糖) | 0.971 / 0.956 / 0.982 |
| FPG 估计 MAE | 6.42 mg/dL |
| FPG 估计 RMSE | 7.91 mg/dL |
| Pearson r / R² | 0.983 / 0.966 |
| Bland-Altman 均值偏差 | +1.45 mg/dL |
| 95% 一致性界限 | -8.33 ~ +11.23 mg/dL |
消融实验(分类准确率递增): - 单视图 CNN baseline < 多视图 CNN(无 MRFO/Transformer)< 多视图 + MRFO < 完整 ScleraGluNet,各模块贡献显著
关键发现: - 误分主要发生在相邻代谢类别之间(控制型 vs 高血糖),符合血糖连续谱的临床特点 - Grad-CAM/Grad-CAM++ 可视化显示模型关注集中在巩膜血管区域,高血糖组呈现跨注视方向一致的强激活 - 五折准确率稳定:各折准确率范围 92.8%~94.6%,标准差仅 0.7%,说明结果不依赖于有利的数据划分 - 代表性案例分析:正常组血管细匀流畅,控制型出现轻度迂曲,高血糖组出现明显的血管扩张、螺旋和不均匀管径变化
亮点¶
- 多方向采集设计创新:首次系统利用五个注视方向的巩膜图像,捕获空间异质性微血管信息
- 完整闭环:从图像采集协议到预处理、特征提取、融合、双任务输出的端到端设计
- 临床可行性:仅需前节段相机(无需散瞳/眼底成像),适合远程医疗和大规模筛查
- 严谨验证:受试者级分折 + bootstrap CI + Bland-Altman 分析,避免了常见的数据泄露问题
- 双任务联合学习:分类 + 回归共享特征表示,互相促进性能提升
局限性¶
- 单中心研究(长沙爱尔眼科),缺乏多中心外部验证,泛化性待考
- 未控制高血压、吸烟、贫血等可能影响巩膜血管的混杂因素
- 仅关注空腹血糖,未纳入餐后血糖或纵向监测数据
- Grad-CAM 仅提供粗略定位,不能作为血管病理的精确指标
- 数据集规模有限(445 人),深度学习模型可能存在过拟合风险
相关工作¶
- 视网膜成像:已有深度学习系统通过视网膜图像预测心代谢状态和 HbA1c,但需昂贵的眼底照相机
- 结膜微循环:先前研究用 OCTA 和红色无反射成像记录了糖尿病相关的结膜血管改变,但未建立端到端DL系统
- PPG/热成像:消费级设备估计血糖,但对运动/光照敏感,生理耦合弱
- MRFO-INEYENET:本团队前作仅用单角度眼部图像 + MRFO 优化,ScleraGluNet 在此基础上引入多方向 + Transformer 融合
- 巩膜/结膜血管与代谢的关联:多项 OCTA 研究证实糖尿病患者巩膜微血管变化,为本文提供了生理学基础
- 多视图学习:多角度获取可提升模型鲁棒性和泛化能力,已在多个计算机视觉领域得到验证
评分¶
- 新颖性: ⭐⭐⭐⭐ (多方向巩膜成像+跨视图融合的无创血糖估计是新颖思路)
- 实验充分度: ⭐⭐⭐⭐ (五折交叉验证+消融+Bland-Altman+Grad-CAM,但缺外部验证)
- 写作质量: ⭐⭐⭐ (结构清晰但部分段落冗余,介绍部分有不连贯段落)
- 价值: ⭐⭐⭐⭐ (临床应用前景好,但需多中心验证才能走向实际部署)