Deep Learning–Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging¶
会议: CVPR 2026
arXiv: 2603.12715
代码: 无
领域: 医学图像分析 / 无创检测
关键词: scleral imaging, noninvasive glucose estimation, multiview learning, transformer fusion, MRFO
一句话总结¶
提出ScleraGluNet多视角深度学习框架,通过五方向巩膜血管成像结合多分支CNN+MRFO特征精炼+Transformer跨视角融合,实现93.8%代谢状态三分类精度和MAE=6.42 mg/dL的空腹血糖连续估计。
研究背景与动机¶
糖尿病监测的痛点:全球糖尿病患者预计到2045年达7.83亿。现有金标准检测(FPG/OGTT/HbA1c)均依赖血液采样,频繁检测不便且有感染风险。CGM虽减少了指尖采血频率,但仍需皮下传感器植入且成本较高。迫切需要非侵入式监测方案。
巩膜血管的独特优势:与需要专业设备的视网膜成像不同,巩膜/结膜微血管可通过低成本前节段相机直接可视化。慢性高血糖导致巩膜微血管重塑(血管口径变化、迂曲度增加、分支模式改变、灌注密度下降),这些改变在OCTA等研究中已被证实。
现有方法的不足:(1) 单视角采集仅覆盖有限巩膜区域,丢失区域特异性血管异常信息;(2) 不同象限的微血管重塑具有非均匀性,需要多方向成像全面捕获;(3) 缺乏同时处理分类和回归的多任务架构。
方法详解¶
整体框架¶
标准化多方向巩膜图像采集(5方向×每人5张)→ ROI提取+CLAHE+Frangi血管增强预处理 → 5个独立参数CNN分支特征提取 → MRFO特征精炼去冗余 → Transformer跨视角自注意力融合 → 分类头(3类softmax) + 回归头(FPG估计)。
关键设计¶
-
多方向标准化采集协议:
- 功能:从正前方(straight)、上方(superior)、下方(inferior)、鼻侧(nasal)、颞侧(temporal)5个注视方向采集巩膜照片
- 核心思路:不同象限展现不同的糖尿病相关微血管改变——颞侧和鼻侧可能有非对称重塑、上下方有不同灌注特征。多方向采集确保保留区域特异性细节
- 设计动机:先前研究已证实糖尿病引起的结膜/巩膜内微血管病变具有空间非均匀性。单视角必然丢失关键诊断信息
-
MRFO特征精炼 + Transformer跨视角融合:
- 功能:5个CNN分支输出的特征拼接后,先用蝠鲼觅食优化(MRFO)算法选择最优特征子集消除冗余,再用Transformer自注意力建模跨象限远程血管关联
- 核心思路:MRFO是生物启发式特征选择算法,通过群智能搜索在高维特征空间中识别相关且非冗余的特征子集。Transformer的自注意力捕获多象限间的细微血管模式关联(如跨区域非对称重塑、跨象限一致性退化)
- 设计动机:5分支拼接产生高维冗余特征,直接输入Transformer效率和效果均不佳。MRFO先筛选后Transformer融合的级联设计可理解为"先去噪再关联"
-
多任务学习的双头输出:
- 功能:同时进行三分类(正常/受控糖尿病/高血糖糖尿病)和连续FPG值回归
- 核心思路:分类头使用softmax输出3类概率,回归头直接输出FPG估计值(mg/dL)。两个任务共享底层特征表示,通过互补学习信号提升整体性能
- 设计动机:分类和回归从不同角度利用血管特征——分类关注类间边界特征,回归关注连续变化趋势。联合训练通过多任务正则化效应防止过拟合
损失函数 / 训练策略¶
- 复合损失:Cross-Entropy(分类)+ MSE(血糖回归),按经验调优权重
- Subject-wise 5-fold交叉验证:同一受试者所有5张图像严格归入同一fold,防止数据泄漏
- Adam优化器,超参在每fold验证集上经验调优
- Bootstrap重采样1000次计算95%置信区间
- 排除标准:眼表疾病、活动性感染、近期手术等,确保巩膜成像质量
实验关键数据¶
主实验¶
| 指标 | 分类结果 | 回归结果 |
|---|---|---|
| 总体准确率 | 93.8% (CI: 91.8-95.4%) | - |
| 正常组准确率 | 94.0% (141/150) | - |
| 受控组准确率 | 92.1% (129/140) | - |
| 高血糖组准确率 | 93.5% (145/155) | - |
| AUC (正常/受控/高血糖) | 0.971 / 0.956 / 0.982 | - |
| MAE | - | 6.42 mg/dL |
| RMSE | - | 7.91 mg/dL |
| 相关系数 r | - | 0.983 |
| R² | - | 0.966 |
| Bland-Altman偏差 | - | +1.45 mg/dL (LOA: -8.33~+11.23) |
数据集规模:445人×5张=2225张巩膜图像(正常150/受控140/高血糖155)。
消融实验¶
| 配置 | 分类准确率 | MAE (mg/dL) |
|---|---|---|
| 单视角CNN | 较低 | 较高 |
| 多视角CNN (无MRFO/Transformer) | 提升 | 下降 |
| + MRFO特征精炼 | 进一步提升 | 进一步下降 |
| + Transformer融合 (完整) | 93.8% | 6.42 |
关键发现¶
- 多方向采集对分类和回归均有显著提升,验证了巩膜血管异常的区域异质性假设
- 误分类主要发生在相邻代谢状态之间(正常↔受控),符合血糖水平的连续谱特征
- 5-fold各fold准确率范围92.8%-94.6%,稳定性良好
- Bland-Altman分析显示与实验室测量有较好一致性,95%点在±11 mg/dL内
亮点与洞察¶
- 新颖的无创检测途径:利用巩膜微血管(而非视网膜)进行代谢状态评估,成像设备要求低,有远程医疗潜力
- 多方向采集协议的设计有生理学依据——不同象限的巩膜血管对高血糖的响应确实不同
- MRFO+Transformer的级联"去冗余→建关联"设计在多视角融合场景中很有参考价值
局限与展望¶
- 单中心数据集(长沙爱尔眼科),445人样本量有限,泛化性存疑
- 排除了眼表疾病患者,但实际临床中糖尿病患者常伴随眼表异常
- 未与现有无创方法(PPG、热成像)做直接对比
- 采集标准化依赖手动ROI提取,自动化程度不够
- 分类为三类的粒度较粗,更细粒度的血糖分段可能更有临床价值
相关工作与启发¶
- 视网膜成像的糖尿病AI:大量工作通过眼底图像预测心血管代谢状态和HbA1c,本文将类似思路扩展到更易获取的巩膜血管
- MRFO算法:蝠鲼觅食优化在生物医学特征选择中的应用日增,本文验证了其在多视角特征去冗余中的有效性
- 启发:眼前节成像结合AI可能开辟低成本、无创、即时的代谢监测新赛道
评分¶
- 新颖性: ⭐⭐⭐ 巩膜多方向血管成像估血糖的思路新颖,但架构创新有限
- 实验充分度: ⭐⭐⭐ 有详细的分类/回归/Bland-Altman分析,但单中心小样本且缺少与其他无创方法对比
- 写作质量: ⭐⭐⭐ 临床背景阐述充分,但方法描述部分行文冗余
- 价值: ⭐⭐⭐ 概念验证阶段,需多中心验证和自动化改进才有临床转化可能