Addressing Mark Imbalance in Integration-free Neural Marked Temporal Point Processes¶
会议: NeurIPS 2025
arXiv: 2510.20414
代码: GitHub
领域: 其他
关键词: 标记时间点过程, 标记不平衡, 阈值方法, 无积分近似, 事件预测
一句话总结¶
本文首次揭示标记时间点过程(MTPP)中标记分布不平衡对预测性能的严重影响,提出先预测标记再预测时间的策略,设计阈值方法调节稀有标记的预测概率,并开发无积分近似的IFNMTPP模型高效支持标记概率估计和时间采样。
研究背景与动机¶
领域现状¶
领域现状:标记时间点过程(MTPP)建模事件流中每个事件的类型(mark)和发生时间,在地震预测、社交媒体转发等场景广泛应用。现有MTPP模型忽略了一个关键问题:标记分布高度不平衡。例如7级地震(稀有但重要)比3级地震(频繁)少得多。
不平衡导致的问题:
现有痛点¶
现有痛点:频繁标记的条件概率 \(p^*(m,t)\) 在大多数时间点上远高于稀有标记
核心矛盾¶
核心矛盾:模型几乎总是预测频繁标记,稀有标记的macro-F1极低(如Retweet数据集上稀有标记仅0.027 vs 频繁标记0.618)
现有方法通常"先预测时间 \(t\),再预测在 \(t\) 时的标记 \(p^*(m|t)\)",但这使阈值方法难以应用(因为标记概率随时间变化,无法为所有时间点学习统一阈值)。
方法详解¶
整体框架¶
- 反转预测顺序:先预测标记 \(p^*(m)\),再预测给定标记的时间 \(p^*(t|m)\)
- 阈值方法:对 \(p^*(m)\) 做先验概率归一化后学习阈值,提升稀有标记预测
- IFNMTPP模型:无需数值积分即可计算 \(p^*(m)\) 和 \(F^*(t|m)\)
关键设计¶
-
标记优先预测 + 阈值方法:
- 功能:先基于 \(p^*(m) = \int_{t_l}^{+\infty} p^*(m,\tau)\,d\tau\) 预测标记,然后预测时间
- 核心思路:计算比率 \(r_m = p^*(m) / \bar{p}^*(m)\)(概率/先验概率),学习阈值 \(\epsilon_m\) 使 \(m_p = \arg\max_m (r_m - \epsilon_m)\)
- 设计动机:\(p^*(m)\) 与时间无关,可以用统一的阈值处理不平衡;稀有标记即使 \(p^*(m)\) 低,\(r_m\) 也可能高,表明该事件相对其自身基准概率更可能发生
- 阈值学习:对每个标记m,通过最大化m vs 其他的F1分数确定最优 \(\epsilon_m\)
-
无积分近似 (IFNMTPP):
- 功能:避免计算两个代价高昂的反常积分来获取 \(p^*(m)\) 和 \(F^*(t|m)\)
- 核心思路:定义 \(\Gamma^*(m,t) = \int_t^{+\infty} p^*(m,\tau)\,d\tau\),将两个积分统一为对 \(\Gamma^*\) 的建模;用神经网络直接参数化 \(\Gamma^*(m,t)\) 而非 \(\lambda^*(m,t)\)
- 设计动机:\(p^*(m) = \Gamma^*(m,t_l)\),\(F^*(t|m) = 1 - \Gamma^*(m,t)/\Gamma^*(m,t_l)\),统一了标记概率和时间CDF的计算
- 关键约束:\(\Gamma^*(m,t)\) 必须关于t单调递减且趋于0,通过网络架构设计保证
损失函数 / 训练策略¶
- 负对数似然损失:\(\mathcal{L} = -\sum_{i} \log p^*(m_i, t_i)\)
- 通过IFNMTPP参数化直接计算 \(p^*(m,t)\),无需数值积分
- 时间预测使用逆变换采样(ITS):从 \(F^*(t|m)\) 高效采样
- 阈值 \(\epsilon_m\) 在训练集上单独优化,不参与梯度反传
实验关键数据¶
主实验(表格)¶
| 方法 | Retweet (macro-F1) | USearthquake (macro-F1) | StackOverflow (macro-F1) |
|---|---|---|---|
| SAHP | 0.236 | 0.045 | 0.141 |
| THP | 0.242 | 0.044 | 0.148 |
| IFNMTPP (ours, 无阈值) | 0.293 | 0.056 | 0.155 |
| IFNMTPP + 阈值 | 0.368 | 0.103 | 0.213 |
阈值方法在所有数据集上显著提升macro-F1,尤其对稀有标记改善巨大。
消融实验¶
- 阈值方法适用于不同基础MTPP模型(SAHP、THP等),均有提升
- 先预测标记再预测时间 vs 先时间再标记:前者与阈值方法配合效果远优
- IFNMTPP的无积分近似精度与数值积分接近但速度快数倍
- 采样数N增大时时间预测精度提升,N=100即可达到良好平衡
关键发现¶
- 标记不平衡在真实数据集中普遍存在且严重影响预测性能
- 现有MTPP模型在稀有标记上的macro-F1极低(接近0)
- 阈值方法的提升主要来自稀有标记的大幅改善,频繁标记性能基本不受影响
- 预测顺序(先标记vs先时间)对不平衡处理方法的可行性有决定性影响
亮点与洞察¶
- 问题发掘重要:首次系统揭示MTPP中不平衡问题的严重性,填补了重要空白
- 方法优雅:通过反转预测顺序使阈值方法自然适用,统一积分简化模型设计
- 实用性强:阈值方法可作为后处理应用于任何MTPP模型
- \(\Gamma^*(m,t)\) 的统一建模是核心技术贡献,同时解决了标记概率和时间采样两个问题
局限与展望¶
- 仅处理分类标记,未扩展到连续标记空间
- 阈值方法假设先验概率在训练集和测试集间一致,分布漂移时可能失效
- IFNMTPP的表达能力受限于 \(\Gamma^*\) 的单调性约束
- 未探索过采样/欠采样等其他不平衡处理方法与阈值方法的结合
相关工作与启发¶
- 受分类任务中不平衡处理方法(重采样、cost-sensitive、阈值调整)启发
- 与传统Hawkes过程和Neural TPP的区别:首次关注标记不平衡
- IFNMTPP的无积分设计可推广到其他需要避免数值积分的概率模型
评分¶
⭐⭐⭐⭐ — 问题重要且被忽视,方法设计精巧(统一积分+反转预测顺序),实验改善显著