TSGDiff: Rethinking Synthetic Time Series Generation from a Pure Graph Perspective¶

会议: AAAI 2026
arXiv: 2511.12174
代码: TSGDiff
领域: 时间序列
关键词: 时间序列生成, 图神经网络, 扩散模型, 傅里叶变换, 拓扑结构忠实度

一句话总结¶

提出 TSGDiff，首次从纯图的视角重新审视时间序列生成任务，将时间序列表示为基于傅里叶频谱特征构建的动态图，在图的潜在空间中进行扩散建模，并提出 Topo-FID 指标评估生成时间序列的结构忠实度。

研究背景与动机¶

领域现状: 多变量时间序列生成在能源管理、金融预测、医疗监测等领域有广泛需求。现有方法包括 GAN 系列（TimeGAN）、VAE 系列（TimeVAE）和扩散模型系列（Diffusion-TS、CSDI）。
现有痛点: (a) 传统生成模型难以有效捕获变量间复杂的时空依赖关系；(b) 它们基于欧几里得空间假设，无法表示时间序列数据固有的拓扑和结构特征；(c) 如 Diffusion-TS 使用 encoder-decoder transformer 分别处理空间和时间信息，限制了对复杂变量间依赖的建模；(d) 图方法在预测任务中表现出色，但在生成任务中几乎未被探索。
核心矛盾: 时间序列具有丰富的时间依赖结构（短期/中期/长期周期性），但现有生成方法仅在原始数据域操作，未能从结构角度建模这些依赖关系。
本文目标: 从图的视角统一建模时间序列中的时间依赖和结构关系，实现高保真的合成时间序列生成。
切入角度: 将时间步视为图的节点，利用傅里叶频谱特征构建边来编码周期性依赖，在图的潜在空间中进行扩散建模。
核心 idea: 用傅里叶变换发现时间序列的周期性规律来构建图结构，在图的潜在表示空间中进行扩散生成，同时用拓扑结构忠实度指标衡量生成质量。

方法详解¶

整体框架¶

TSGDiff 分为三个阶段：(1) 图构建与编码——对时间序列进行滑动窗口分割和实例归一化后，利用傅里叶变换提取周期信息构建动态图，再用 GNN 编码器得到潜在表示；(2) 潜在扩散建模——在潜在图空间中执行扩散-去噪过程；(3) 图解码——将去噪后的潜在表示解码回合成时间序列。

关键设计¶

Fourier-based Graph Construction（基于傅里叶的图构建）:
- 功能：将时间序列转换为能编码周期性依赖的图结构
- 核心思路：对每个窗口段 $\tilde{X}_i$ 做离散傅里叶变换 $\tilde{X}_i^{(p)} = \sum_{n=0}^{w-1} \tilde{x}_{i+n} \cdot e^{-j\frac{2\pi}{w}pn}$，检测幅值最高的 top-3 频率并转换为对应周期。节点 = 时间步，边 = 相邻时间步 + 周期邻居。邻接矩阵 $\mathbf{A}_{ij}=1$ 表示存在时序或周期连接
- 设计动机：傅里叶频谱自然揭示了时间序列的周期性结构，用周期来定义边连接能同时编码短期、中期和长期依赖模式
Graph VAE Encoder-Decoder（图变分自编码器）:
- 功能：将图结构编码为潜在空间表示，并能从潜在向量解码恢复
- 核心思路：编码器堆叠多层 GCN（图卷积 $y' = \text{Mish}(\text{BN}((W\mathbf{A}\tilde{X}+b)^T)^T)$ + 残差连接），经均值池化后输出 $\mu$ 和 $\log\sigma$，通过重参数化技巧采样潜在向量 $z = \mu + \epsilon \odot \exp(\log\sigma / 2)$。解码器用全连接层+Tanh 恢复节点特征。KL 散度损失 $\mathcal{L}_{KL}$ 约束潜在分布接近标准正态
- 设计动机：GCN 能天然利用邻接矩阵定义的图结构进行信息聚合，VAE 框架提供正则化的潜在空间
Latent Diffusion + Topo-FID Metric（潜在扩散 + 拓扑结构忠实度指标）:
- 功能：在潜在图空间进行生成建模；评估生成时间序列的结构保真度
- 核心思路：前向过程逐步加噪 $z_k = \sqrt{\alpha_k} \cdot z + \sqrt{1-\alpha_k} \cdot \epsilon$；反向过程用 MLP 网络预测去噪，输入为 $\text{concat}(z_k, t_{emb})$。Topo-FID 定义为 $\alpha \cdot S_{edit} + (1-\alpha) \cdot S_{entropy}$，其中 $S_{edit}$ 比较邻接矩阵差异，$S_{entropy}$ 比较节点度分布的结构熵差异
- 设计动机：在潜在空间做扩散比原始数据空间更高效且能保持结构一致性；传统指标无法捕获时间序列的结构特征，Topo-FID 从图的角度补充了这一缺失

损失函数 / 训练策略¶

总损失函数： $$\mathcal{L} = \mathcal{L}_{recon} + \beta \mathcal{L}_{KL} + \gamma \mathcal{L}_{denoising} + \delta \mathcal{L}_{Fourier}$$

$\mathcal{L}_{recon}$：输入与解码器输出的 MSE 重建损失
$\mathcal{L}_{KL}$：KL 散度正则化（$\beta=0.2$）
$\mathcal{L}_{denoising}$：扩散去噪损失 $\|epsilon - \epsilon_\theta(z_k, k)\|^2$（$\gamma=1$）
$\mathcal{L}_{Fourier}$：频域一致性损失 $\|\text{FFT}(x_0) - \text{FFT}(\hat{x}_0)\|^2$（$\delta=1$）

训练配置：batch size 128，lr 0.01，500 epochs，滑窗大小 48，步长 1。

实验关键数据¶

主实验¶

数据集	指标	TSGDiff	Diffusion-TS	TimeGAN	提升
ETTh	Topo-FID↑	0.986	0.864	0.798	+12.2%
Weather	Context-FID↓	0.353	1.161	2.420	-69.6%
EEG	Discriminative↓	0.301	0.492	0.391	-23.0%
ETTh	Predictive↓	0.020	0.026	0.030	-23.1%
Stocks	Correlational↓	0.026	0.027	0.061	-3.7%
Wind	Topo-FID↑	0.869	0.819	0.824	+5.0%

在 6 个数据集上平均 Discriminative score 提升 50%。

消融实验¶

配置	Topo-FID↑	Context-FID↓	Discriminative↓	说明
w/o KL	0.787	44.467	0.500	潜在空间无约束，崩塌
w/o Denoising	0.908	3.922	0.432	生成能力受限
w/o Fourier	0.883	0.407	0.061	频域信息丢失
Full (TSGDiff)	0.986	0.224	0.056	所有组件协同最优

关键发现¶

KL 散度损失对模型至关重要——去除后 Context-FID 从 0.224 飙升至 44.467，潜在空间完全退化
Fourier 损失对 Topo-FID 有显著影响（0.986→0.883），说明频域约束对保持结构忠实性很重要
核密度估计可视化显示 TSGDiff 生成的分布比 Diffusion-TS 更接近真实数据分布

亮点与洞察¶

视角创新：首次从纯图的视角看待时间序列生成问题，将时间依赖关系建模为图的边，这是一种有意义的范式转换
Fourier + Graph 的自然结合：用傅里叶频谱发现周期性来构建图边，比手动定义或全连接图更有物理意义
Topo-FID 新指标：传统指标（FID、Discriminative score 等）无法评估时间序列的结构特性，Topo-FID 填补了这一空白
统一框架：图构建 + 图 VAE + 潜在扩散的三阶段设计，将结构建模与生成过程统一在同一框架中

局限与展望¶

图构建仅考虑了 top-3 频率的周期性，可能遗漏重要的非周期性或非线性依赖关系
每个变量独立做傅里叶变换构建边，但不同变量之间的交叉依赖关系未被显式建模（节点 = 时间步而非变量）
潜在扩散网络使用简单的 MLP，可能限制了对复杂潜在分布的建模能力
Topo-FID 仍然依赖与真实数据的成对比较，对于评估多样性可能不够全面
滑窗大小固定为 48，不同时间尺度的序列可能需要不同的窗口设置

评分¶

新颖性: ⭐⭐⭐⭐ 图视角看时间序列生成是新颖的，Topo-FID 指标也是有价值的贡献
实验充分度: ⭐⭐⭐⭐ 6个数据集、5类指标、4个基线、消融实验+可视化完整
写作质量: ⭐⭐⭐⭐ 框架图清晰、数学符号规范、但部分公式推导可以更详细
价值: ⭐⭐⭐⭐ 为时间序列生成提供了新的建模范式和评估指标，有较好的启发性