Mask the Redundancy: Evolving Masking Representation Learning for Multivariate Time-Series Clustering¶

会议: AAAI2026
arXiv: 2511.17008
代码: yueliangy/EMTC
领域: 时间序列
关键词: multivariate time-series clustering, masking, representation learning, contrastive learning

一句话总结¶

提出 EMTC 框架，通过 Importance-aware Variate-wise Masking (IVM) 动态屏蔽冗余时间戳，结合 Multi-Endogenous Views (MEV) 多视图生成与 cluster-guided contrastive learning，在 15 个 MTS 聚类基准上平均 F1 提升 4.85%。

研究背景与动机¶

领域现状¶

领域现状：多变量时间序列 (MTS) 聚类需要发现数据的内在分组模式，但 MTS 中存在大量冗余（如稳态运行记录、零输出时段），削弱了对关键时间戳的关注。

现有方法的问题：

解决思路¶

解决思路：Autoencoder 方法**（DeTSEC、RDDC）：重建目标倾向于保留冗余信息

现有痛点¶

现有痛点：Contrastive learning 方法**（TimesURL、FCACC）：效果依赖数据增强策略的设计，若与聚类分布不匹配则会放大冗余

核心矛盾¶

核心矛盾：Attention 机制**：软加权保留了完整输入结构，且可能被高激活但无信息的模式误导

补充说明¶

补充说明：Static masking**（Ti-MAE、TS-MVP）：固定掩码策略无法随学习过程动态适应聚类任务

核心洞察：masking 策略应与聚类目标协同演化，动态排除聚类无关的冗余时间戳。

方法详解¶

IVM: Importance-aware Variate-wise Masking¶

单变量视图生成：对每个 variate \(d\) 独立生成 embedding \(Z^{(d)} = f_{\theta}^{(d)}(X)\)
Content-aware 重要性评估：通过 attention 机制计算每个时间戳的重要性分数 \(S_i^{(d)}\)
冗余时间戳掩码：阈值 \(\epsilon\) 过滤低重要性时间戳，生成二值掩码 \(M_i^{(d)}(t)\)，对原始输入做 element-wise 乘法得到 masked input \(\widetilde{X}\)
掩码每个 epoch 随学习动态更新（"evolving masking"）

MEV: Multi-Endogenous Views¶

对 masked input 通过 \(V\) 个不同 encoder 生成多个内生视图 \(F^{(v)}\)，提供互补视角并防止 IVM 的 crisp masking 导致过拟合。

双路径学习¶

CRL (Consistency and Reconstruction Learning)：
- Intra-view reconstruction：每个视图重建原始 MTS，保留语义结构
- Inter-view reconstruction：跨视图一致性约束，增强鲁棒性
CMC (Clustering-guided MEV Contrastive Learning)：
- 融合所有视图表示后做 \(k\)-means 聚类
- 用聚类标签构造正负样本对进行对比学习
- 聚类标签每 epoch 动态更新，将聚类目标融入表示学习

总损失¶

\[\mathcal{L}_{total} = \mathcal{L}_{contra} + \alpha \mathcal{L}_{intra} + \beta \mathcal{L}_{inter}\]

实验关键数据¶

设置¶

15 个 UEA 基准数据集，样本量 15–293，序列长度 30–17984，维度 3–1345
8 个 SOTA 对比方法：FEI (AAAI'25)、FCACC、TimesURL (AAAI'24)、UNITS (NeurIPS'24)、USLA (TPAMI'23)、Ti-MAE、MHCCL (AAAI'23)、T-GMRF (TKDE'23)
指标：ACC、F1、NMI、ARI

主要结果¶

EMTC 在 15 个数据集上 F1 平均提升 4.85%（vs 最强基线）
在 DuckDuckGeese 上 F1 达 0.4917（第二名 0.3980），提升显著
Cricket 数据集 F1 达 0.6317，大幅领先第二名 0.5136
在 FingerMovements 等难数据集上也取得最优

消融实验¶

去除 IVM → 性能显著下降，验证动态掩码的必要性
去除 CMC → 聚类效果退化，验证 cluster-guided contrastive 的有效性
去除 MEV → 单视图表现更差，验证多视图互补作用

亮点与洞察¶

Evolving masking 理念新颖：掩码与聚类目标协同演化，而非静态预处理，是 MTS 聚类中首次探索 learnable redundancy masking
IVM-MEV 互补设计：MEV 缓解 crisp masking 的信息损失，IVM 抑制 MEV 放大的冗余，形成良性循环
将聚类目标融入表示学习：通过动态聚类标签引导对比学习，打通了表示学习与下游聚类目标的连接

局限与展望¶

阈值 \(\epsilon\) 为固定超参数，自适应阈值可能进一步提升性能
实验仅基于 UEA 标准数据集，未在大规模工业场景验证
聚类数 \(g\) 需要预先指定，未探讨自动确定聚类数的策略
MEV 融合方式为简单平均，加权或注意力融合可能更优

评分¶

新颖性: ⭐⭐⭐⭐ — evolving masking 与 cluster-guided contrastive 的结合是 MTS 聚类领域的新探索
实验充分度: ⭐⭐⭐⭐ — 15 数据集、8 对比方法、多组消融，覆盖全面
写作质量: ⭐⭐⭐⭐ — 结构清晰，图示直观，公式表达规范
价值: ⭐⭐⭐⭐ — 为 MTS 冗余抑制提供了有效的动态方案