跳转至

Learning Patient-Specific Disease Dynamics with Latent Flow Matching for Longitudinal Imaging Generation

会议: ICLR 2026
arXiv: 2512.09185
代码: 无
领域: 医学影像 / 疾病进展建模
关键词: disease progression, flow matching, patient-specific, longitudinal MRI, ArcRank loss

一句话总结

提出 Δ-LFM 框架:用 ArcRank 损失在潜在空间构建患者特异性时间对齐轨迹(角度一致 + 幅度单调递增),将流匹配时间范围从 [0,1] 扩展到 [0,T] 实际时间间隔实现任意时间点预测,在三个阿尔茨海默纵向 MRI 基准上全面超越 8 种基线方法,并提出进展专用指标 Δ-RMAE。

研究背景与动机

领域现状:疾病进展建模对早期诊断和个性化治疗至关重要。GAN → 扩散模型的演进带来了更高保真度的纵向医学影像生成,但多数方法仅捕捉群体趋势。

现有痛点:1)多数模型忽略个体异质性——同一疾病不同患者进展速率差异巨大;2)扩散模型的随机去噪过程打断时间连续性;3)自编码器的潜在空间跨患者不对齐、与临床严重度指标不相关;4)传统图像质量指标(PSNR/SSIM)在纵向场景中虚高——同一患者不同时间点天然高相似度,微小的疾病变化被正常解剖淹没。

核心矛盾:纵向影像生成需要同时满足高保真度(图像质量)和高准确度(进展方向正确),现有方法偏重前者忽略后者。

本文目标 构建患者特异性的生成框架,使潜在空间语义有意义+ 任意时间点可预测 + 进展方向正确。

切入角度:疾病进展在潜在空间可建模为速度场——流匹配(Flow Matching)天然学习从源到目标的速度场,与疾病动力学概念完美对应。

核心 idea:ArcRank 约束让每个患者的潜在轨迹"一条线走到底"(方向恒定、幅度递增),Δ-LFM 沿这条线以真实时间步长推进。

方法详解

整体框架

两阶段框架。阶段 1:VAE + ArcRank 损失构建患者特异性潜在空间;阶段 2:3D U-Net 学习潜在空间内的速度场(流匹配),结合 AdaLN 注入条件信号。

关键设计

  1. ArcRank 损失——患者轨迹潜在对齐

    • 功能:强制同一患者不同时间点的潜在表示沿特定方向排列,幅度随时间单调递增
    • 核心思路:对潜在向量 \(\mathbf{z}\) 做 SVD 分解 \(U\Sigma V^\top = \text{SVD}(\mathbf{z})\),其中 \(U\) 编码方向(角度),\(\Sigma\) 编码幅度(严重度)。ArcRank 损失: $\(\mathcal{L}_{\text{ArcRank}} = \lambda_{\text{arc}} \sum_{i<j} |U_i - U_j| + \lambda_{\text{rank}} \sum_{i<j} \max(0, m - (\Sigma_j - \Sigma_i)), \quad t_i < t_j\)$ 外加 pull 项 \(\mathcal{L}_{\text{Pull}} = |\Sigma_j - \Sigma_i|\) 防止相邻时间点过度分离
    • 设计动机:SVD 统一处理方向和幅度,比 cosine similarity + 绝对值分开处理更稳定;stop-gradient 稳定训练
  2. Δ-LFM——时间语义化的流匹配

    • 功能:学习潜在空间中患者特异性的连续时间速度场,支持任意未来时间点预测
    • 核心思路:将标准流匹配的 [0,1] 时间范围扩展到 [0,T],\(T = t_j - t_i\) 为实际年数。目标速度 \(v^*(i,j) = (\mathbf{z}_j - \mathbf{z}_i)/(t_j - t_i)\),推理时以步长 \(\text{d}t = 0.01\) 逐步积分:\(\mathbf{z}_{i+\text{d}t} = \mathbf{z}_i + \text{d}t \cdot v_\theta(\mathbf{z}_i, t_i)\)
    • 设计动机:[0,1] 范围归一化丢失了实际时间语义;[0,T] 让"预测 3 年后的 MRI"直接可行
  3. Δ-RMAE 评估指标

    • 功能:评估生成影像的进展方向准确度而非绝对图像质量
    • 核心思路:残差指标 \(\Delta\text{-RMAE} = \frac{|\Delta_{\text{gt}} - \Delta_{\text{gen}}|}{(\frac{1}{2}(|\Delta_{\text{gt}}| + |\Delta_{\text{gen}}|))} \in [0, 2]\),其中 \(\Delta = \mathbf{x}_T - \mathbf{x}_0\)
    • 设计动机:传统 PSNR/SSIM 在纵向场景虚高(同一患者天然高相似度),Δ-RMAE 专聚焦于疾病引起的变化

损失函数 / 训练策略

阶段 1(AE):重建损失 + ArcRank,\(\lambda_{\text{arc}}=0.005\), \(\lambda_{\text{rank}}=0.01\), \(m\) 为 margin。AdamW, lr=\(10^{-3}\), batch=2, 300 epochs。阶段 2(FM):\(\mathcal{L}_{\text{LFM}} = \sum_{i<j} |v_\theta(i,j) - v^*(i,j)|^2\)。3D U-Net, AdamW, lr=\(3 \times 10^{-5}\), batch=4, 200 epochs。条件信号(年龄/性别/临床状态)通过 AdaLN 注入。

实验关键数据

主实验——影像质量(3 个纵向 MRI 基准,mean±std)

方法 ADNI PSNR↑ ADNI SSIM↑ AIBL PSNR↑ OASIS PSNR↑
CardiacAging 27.78±1.49 92.04 28.41 26.23
DiffuseMorph 29.56±1.63 93.57 29.17 28.13
SADM 26.94±2.28 85.15 27.97 26.74
BrLP 28.51±1.77 91.52 28.96 27.98
MambaControl 29.72±1.04 93.60 29.86 28.24
Δ-LFM 30.59±0.89 94.62 30.52 29.01

主实验——进展准确度(Region MAE + Δ-RMAE)

方法 ADNI Δ-RMAE↓ AIBL Δ-RMAE↓ OASIS Δ-RMAE↓
DiffuseMorph 0.516 0.482 0.503
BrLP 0.630 0.594 0.622
MambaControl 0.554 0.525 0.561
Δ-LFM 0.436 0.417 0.473

Δ-RMAE 相比 MambaControl 相对误差降低 ~21%/21%/16%。

消融实验(3 数据集均值)

配置 PSNR↑ Δ-RMAE↓ 说明
LFM Baseline (无条件, [0,1]) 27.59 0.552 最差
+ 条件信息 28.46 0.486 条件信号重要
+ [0,T] 时间采样 28.78 0.472 时间语义化有效
+ Arc Loss only 29.52 0.457 方向约束最重要
+ Rank Loss only 28.36 0.474 单独排序效果弱
+ ArcRank + [0,T] (完整) 30.04 0.442 组件协同

关键发现

  • ArcRank 潜在空间的 t-SNE 可视化:(1) 同一患者的扫描聚在一起;(2) 诊断状态(CN/MCI/AD)自然分群——虽未用诊断标签训练
  • 长期预测性能随时间衰减但仍合理:1-5 年 PSNR 31-32dB, 10 年 ~28.6dB, 13 年 ~27dB
  • ArcRank 引入 SVD 计算 overhead ~40% 训练时间增加,但使用 full_matrices=False 后从 0.055s→0.009s(6x 加速)

亮点与洞察

  • "疾病 = 速度场"的建模视角:不是生成未来快照,而是学习变化过程的连续动力学——流匹配的速度场概念与疾病进展天然匹配
  • ArcRank 的对偶设计:SVD 统一了方向(patient identity)和幅度(disease severity)两个本质不同的轴——简洁优雅
  • Δ-RMAE 填补评估盲区:常规指标在纵向场景失效("复制基线"也能得高分),Δ-RMAE 迫使模型真正捕捉变化而非保持静态
  • 诊断状态的无监督涌现:ArcRank 仅约束时间顺序和方向一致性,却自然学出了 CN→MCI→AD 的严重度梯度——好的归纳偏置的力量

局限与展望

  • 仅在阿尔茨海默病上验证——脑肿瘤等快速进展/治疗干预的疾病需要不同建模假设
  • 线性轨迹假设(潜在空间中直线进展)可能无法捕捉突发恶化或稳定期的非线性模式
  • 扫描间隔不均匀问题仅通过条件信号部分缓解,未显式建模进展速率变化
  • 数据集异质性(多扫描仪/协议差异)仅依赖预处理缓解,未使用协调技术
  • AE 容量受 GPU 内存限制(48GB A6000),更大 crop 或更深网络可能进一步提升

相关工作与启发

  • vs BrLP (Puglisi et al. 2024):BrLP 用 ControlNet + 体积比条件实现部分个性化,但条件粗糙;Δ-LFM 通过 ArcRank 在潜在空间实现更精细的个体轨迹建模
  • vs TADM (Litrico et al. 2024):TADM 预测残差图像但用扩散去噪→打破时间连续性;Δ-LFM 用流匹配天然保持连续性
  • vs ImageFlowNet (Liu et al. 2025):ImageFlowNet 也用流场但在图像空间操作;Δ-LFM 在潜在空间更高效且支持 ArcRank 轨迹对齐

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 流匹配用于疾病进展 + ArcRank 潜在对齐 + Δ-RMAE 评估指标,三重创新
  • 实验充分度: ⭐⭐⭐⭐ ADNI/AIBL/OASIS 三基准 + 8 种对比方法 + 详细消融 + 长期预测分析
  • 写作质量: ⭐⭐⭐⭐ 动机清晰、公式推导简洁、可视化有说服力
  • 价值: ⭐⭐⭐⭐⭐ 对医学影像生成和疾病进展建模有重要贡献,Δ-RMAE 可能成为领域标准指标