跳转至

UnCLe: Towards Scalable Dynamic Causal Discovery in Non-Linear Temporal Systems

会议: NeurIPS 2025
arXiv: 2511.03168
代码: GitHub
领域: Causal Discovery / Time Series Analysis
关键词: 动态因果发现, 时间序列, Granger 因果, 时序扰动, 非线性系统

一句话总结

提出 UnCLe,一种基于 TCN 自编码器解耦和自回归依赖矩阵的可扩展动态因果发现方法,通过时序扰动后逐数据点预测误差增量推断时变因果关系,在静态和动态因果发现基准上均达到 SOTA。

研究背景与动机

从观测时间序列中发现因果关系是理解复杂系统的基础问题。现实世界中的系统通常具有动态因果性——因果关系随时间演化:

捕食者-猎物关系随季节改变

基因调控网络在发育阶段间变化

人体生物力学在运动不同阶段(起跳→腾空→着地)关节间因果关系不同

然而,主流时序因果发现方法几乎都只推断静态因果图(时间平均的依赖关系),忽略了因果关系的演化特性。

现有方法的具体局限: - NeuralGC / GVAR / TCDF:逐分量设计,参数量 O(N²),大规模数据不可扩展 - GVAR:虽能生成动态因果图,但精度有限(在 TVSEM 上方向翻转无法被捕获) - JRNGC / CUTS+:通过参数共享解决扩展性,但不支持动态因果发现 - 没有现有方法在动态因果数据集上被严格评估

方法详解

整体框架

UnCLe 分为两个阶段:

  1. 训练阶段:学习时间序列的语义解耦表示 + 变量间自回归依赖关系
  2. 事后分析阶段:通过时序扰动推断动态因果图,或通过依赖矩阵聚合推断静态因果图

关键设计

  1. Uncoupler-Recoupler 网络(语义解耦自编码器)

核心思路:将复杂的多变量时间序列解耦为多通道语义表示,使得变量间的依赖关系可以在隐空间中被线性建模。

- **Uncoupler**:参数共享的 TCN 编码器,将每个单变量时间序列 x_i ∈ R^T 映射为 C 通道隐表示 z_i ∈ R^{T×C}
- **Recoupler**:参数共享的 TCN 解码器,从隐表示重建原始序列 x̃_i
- **参数共享**关键:所有 N 个变量共享同一套 TCN 参数,极大提升学习效率和泛化性(消融显示去掉参数共享性能显著下降)
- TCN 的因果卷积保证信息不从未来泄漏到过去

理论动机:适当的坐标变换(Uncoupler 学习)可以将复杂非线性动力学近似为线性系统,这是 Koopman 理论的核心思想。

  1. 自回归依赖矩阵(Auto-regressive Dependency Matrices)

核心思路:在解耦后的隐空间中,用简单的线性矩阵建模变量间的依赖关系。

- 维护 C 个依赖矩阵 Ψ = {Ψ¹, ..., Ψ^C},每个 Ψ^c ∈ R^{N×N}
- 自回归预测:ẑ^c_{:,t+1} = σ(Ψ^c · z^c_{:,t})
- 预测的隐表示送入 Recoupler 生成原始空间的预测值
- L1 正则化促进依赖矩阵的稀疏性,抑制虚假因果连接
  1. 基于时序扰动的动态 Granger 因果推断

核心思路:如果 x_j 是 x_i 的真实原因,打乱 x_j 的时序结构会显著增加模型对 x_i 的预测误差。

具体流程: - 对第 j 个变量做时序随机置换(保持边缘分布不变但破坏时序信息) - 计算扰动前后每个数据点的预测误差增量:Δε^{∖j}{i,t} = max(0, ε^{∖j}) - 误差增量即为 t 时刻 x_j → x_i 的动态因果强度 - 对所有变量对和所有时间步计算,得到时间分辨的因果图 Ĝ^Pert} - ε_{i,t

为什么选择时序置换而非其他扰动? - 零值掩码会破坏数据分布,导致模型不稳定 - 噪声注入不能完全消除原始信号 - 时序置换既消除了预测性时序信息,又完美保持了变量的边缘分布

  1. 静态因果图的依赖聚合

    • 对依赖矩阵 Ψ 沿通道维度做 L2-norm 聚合:A^{Agg}{l,k} = √(1/C · Σ(Ψ^c)²)
    • 快速获取静态全局因果图,无需事后扰动分析

损失函数 / 训练策略

  • 两阶段训练
  • 预训练阶段:仅优化重建损失 L_Recon(MSE),训练 Uncoupler + Recoupler
  • 完整训练阶段:联合优化 L_Total = L_Recon + α·L_Pred + L_L1
  • L_Recon:重建 MSE 损失
  • L_Pred:预测 MSE 损失(自回归预测下一步)
  • L_L1:依赖矩阵的 L1 正则化,促进稀疏性
  • Dropout 0.2:用于 TCN 训练的额外正则
  • α 为预测任务权重超参数

实验关键数据

主实验

静态因果发现(合成数据集 Lorenz96)

数据集 指标 UnCLe(P) CUTS+ JRNGC NeuralGC
Lorenz#1 (p=20,F=10) AUROC .999 .986 .963 .891
Lorenz#2 (p=20,F=40) AUROC .969 .852 .786 .657
Lorenz#3 (p=100,T=500) AUROC .964 .946 .884 不可扩展

动态因果发现

数据集 指标 UnCLe(P) GVAR Static Best
TVSEM (双变量交替因果) AUROC 1.000 0.733 0.467
TVSEM AUPRC 1.000 0.400 0.300
ND8 (8变量非线性) AUROC .921 .723 .905
ND8 AUPRC .633 .220 .799

人体运动捕捉(MoCap)— 骨骼连接缺失率

方法 Missing Rate ↓
UnCLe .200
GVAR .622
JRNGC .600

消融实验

配置 Lorenz#3 AUROC 说明
完整 UnCLe(P) ~0.96 基准
w/o 参数共享 显著下降 高维场景下参数共享关键
w/o 依赖矩阵 <0.5(随机) 模型完全无法学因果结构
w/o 预测任务 很低 仅重建过于简单,无法建模变量间依赖

扰动策略对比(Lorenz#1)

扰动策略 AUROC AUPRC ACC
时序置换(本文) .999 .996 .994
噪声注入 .981 .946 .978
零值掩码 .974 .932 .969
无扰动 .500 .575 .850

关键发现

  • TVSEM 上达到完美动态因果发现(AUROC=1.0),而 GVAR 只有 0.733,且无法捕获因果方向翻转
  • 人体运动分析中,UnCLe 的动态因果图与生物力学知识高度一致:起跳阶段上肢主导→腾空阶段下肢协调→着地阶段全身参与
  • 骨骼连接缺失率仅 0.200(GVAR/JRNGC 约 0.6),说明 UnCLe 保留了基本解剖结构
  • 依赖矩阵是核心组件——去掉后 AUROC 降至随机水平;参数共享对高维场景至关重要

亮点与洞察

  • 动态因果发现的稀缺工作:绝大多数方法只能推断静态因果图,UnCLe 是少有的能生成时间分辨因果图的方法
  • "解耦+线性化"的优雅设计:TCN Uncoupler 将非线性动力学变换到可线性建模的隐空间,依赖矩阵用简单线性变换捕获变量间关系——类似于 Koopman 算子理论的离散近似
  • 扰动分析的精巧选择:时序置换是最佳扰动策略,因为同时满足"消除时序信息"和"保持边缘分布"两个条件
  • MoCap 案例分析精彩:将动态因果图锚定到人体骨骼结构上,不同运动阶段的因果模式与生物力学文献完全一致
  • 可扩展性优秀:参数共享使模型可处理 100+ 变量,而多数基线方法在此规模下失败或性能骤降

局限与展望

  • 缺乏可辨识性理论保证:作者明确指出这是主要局限——没有证明隐空间的线性化是否保证因果忠实性
  • Granger 因果的固有假设限制:假设无隐含混淆因子,在有未观测变量时可能产生虚假因果
  • 时序扰动需要对每个变量分别做,计算量 O(N) 倍于单次预测
  • 仅处理均匀采样的时间序列,不支持不规则时间序列
  • 动态因果图的评估指标有限——难以定量衡量"因果演化的捕获质量"

相关工作与启发

  • NeuralGC (Tank et al.):经典神经 Granger 因果方法,逐分量设计不可扩展
  • GVAR:唯一能生成动态因果图的先前方法,但精度远不及 UnCLe
  • CUTS+:参数共享的可扩展方法,但只支持静态因果发现
  • Koopman 理论:非线性动力学的线性化思想启发了 Uncoupler 的设计
  • 启发:因果发现可以从"解耦表示+线性建模"的角度思考,参数共享和扰动分析是简洁有效的工程选择

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 动态因果发现是未被充分探索的重要问题,Uncoupler+扰动分析的组合设计新颖
  • 实验充分度: ⭐⭐⭐⭐⭐ 合成+真实数据、静态+动态、可扩展性+消融+扰动策略对比全面
  • 写作质量: ⭐⭐⭐⭐ MoCap 案例分析生动,公式清晰
  • 价值: ⭐⭐⭐⭐⭐ 填补动态因果发现空白,方法简洁实用,开源代码和数据