跳转至

StRap: Spatio-Temporal Pattern Retrieval for Out-of-Distribution Generalization

会议: NeurIPS 2025
arXiv: 2505.19547
代码: 无
领域: 时空预测 / 图神经网络
关键词: 时空图神经网络, OOD 泛化, 检索增强学习, 持续学习, 模式库

一句话总结

提出 StRap 框架,通过构建包含空间、时间和时空三维键值对的模式库,在推理时检索与当前输入最相似的历史模式并自适应融合,有效应对流式时空数据中的分布偏移(STOOD)问题。

研究背景与动机

领域现状

领域现状:时空图神经网络(STGNN)在交通预测、气候预测等领域取得成功,但在流式数据中面临严重泛化挑战

现有痛点

现有痛点:STOOD 问题**(时空分布外)包含三类偏移:空间结构变化(节点增删)、时间动态变化(趋势漂移)、时空联合变化

核心矛盾

核心矛盾:现有方法的局限:

解决思路

解决思路:Backbone 方法(直接应用/重训练):灾难性遗忘

补充说明

补充说明:架构方法(TrafficStream 等):稳定性-可塑性权衡困难

补充说明

补充说明:正则化方法(EWC):过度约束适应性

补充说明

补充说明:回放方法:无法区分相关和无关历史知识

补充说明

补充说明:根本问题**:如何识别历史知识中对当前预测最有价值的部分?

方法详解

整体框架

StRap 遵循"显式存储 + 检索融合"的范式:

  1. 子图分块:将原始时空图分解为空间子图 \(\mathcal{G}_S\)、时间子图 \(\mathcal{G}_T\) 和时空子图 \(\mathcal{G}_{ST}\)
  2. 多维模式库构建:为每类子图建立键值对库 \(\mathcal{B}_S, \mathcal{B}_T, \mathcal{B}_{ST}\)
  3. 相似性检索 + 自适应融合:推理时匹配当前输入与库中模式,自适应融合到当前表征

关键设计

  1. 多维模式键生成:

    • 功能:为空间、时间、时空三类子图分别设计特征化的键
    • 核心思路:
      • 空间键 \(\mathbf{k}_S\):节点度统计 + 聚类系数 + 最短路径统计 + Forman-Ricci 曲率
      • 时间键 \(\mathbf{k}_T\):统计矩 + 频谱成分 + 小波变换 + 自相关 + 熵
      • 时空键:空间键和时间键的交互特征
    • 设计动机:键需要足够判别性且对分布偏移鲁棒,几何/拓扑特征比学习特征更稳定
  2. 自适应融合与知识平衡训练:

    • 功能:检索到的模式值通过 plug-and-play 的 prompting 机制注入模型
    • 核心思路:引入知识平衡目标,动态校准历史模式与当前观测的影响权重
    • 设计动机:过度依赖历史模式会导致过拟合历史案例;过度依赖当前观测则失去历史信息增益

损失函数 / 训练策略

  • 训练阶段:构建和优化模式库,基于检索值更新模式库中的键值对
  • 推理阶段:基于相似性检索最相关模式,通过 prompting 融合到 STGNN backbone
  • 知识平衡目标:协调新信息与检索知识,防止灾难性遗忘
  • StRap 是 plug-and-play 框架,可与任意 STGNN backbone 结合

实验关键数据

主实验(表格)

方法 数据集 MAE RMSE 相对改进
Pretrain 流式交通 基线 基线 -
TrafficStream 流式交通 - - +5-8%
EWC 流式交通 - - +3-5%
StRap 流式交通 最优 最优 +10-15%

消融实验

  • 去除空间模式库:空间分布偏移时性能下降明显
  • 去除时间模式库:时间分布偏移时退化最严重
  • 去除知识平衡目标:在连续多段数据上出现灾难性遗忘
  • 不同 backbone(GCN、GAT、STGCN)上 StRap 均带来一致提升

关键发现

  • StRap 在所有测试的流式图数据集上一致优于 SOTA 基线
  • 显式模式存储比隐式参数记忆能保留更多历史信息
  • 即使在不进行任务特定微调的情况下也能泛化

亮点与洞察

  • 检索增强 + 时空学习的新颖结合:首次将 RAG 思想系统性地引入 STGNN 持续学习
  • 三维子图分块设计巧妙地解耦了空间、时间和时空三种类型的分布偏移
  • Plug-and-play 设计使得 StRap 可作为通用增强模块附加到现有 STGNN 上
  • 理论分析证明了模式提取和检索机制在分布偏移下的有效性

局限与展望

  • 模式库大小会随数据积累增长,需要剪枝或压缩策略
  • 键提取涉及图拓扑计算(如最短路径、曲率),对大图可能有效率瓶颈
  • 未探索模式库的跨数据集/跨域迁移能力
  • 小波变换等时间键特征的超参数选择可能需要领域知识

相关工作与启发

  • RAFT(检索增强时间序列预测)只处理时间维度,StRap 扩展到时空联合
  • TrafficStream 使用回放策略,但不区分有用和无用历史样本
  • 宏观上是将 LLM 领域的 RAG 思想迁移到时空预测领域

评分

  • 理论创新:⭐⭐⭐⭐
  • 实验验证:⭐⭐⭐⭐
  • 实用价值:⭐⭐⭐⭐
  • 写作质量:⭐⭐⭐⭐
  • 综合评分:⭐⭐⭐⭐