Competition-Aware CPC Forecasting with Near-Market Coverage¶

会议: CVPR 2026
arXiv: 2603.13059
代码: 无
领域: 时间序列预测 / 广告竞价
关键词: CPC 预测, 竞争代理, 时序基础模型, 时空图神经网络, 部分可观测性

一句话总结¶

将付费搜索广告中的 CPC（每次点击成本）预测重新定义为部分竞争可观测性问题，通过语义邻域、DTW 行为邻域和地理意图三类竞争代理信号，结合时序基础模型（Chronos-2/TimeGPT/Moirai）和时空 GNN，在 1,811 条关键词序列上实现了中长期预测精度的显著提升。

在付费搜索广告中，CPC 是通过实时拍卖生成的价格，受竞争对手出价、平台质量信号和查询特定条件共同决定。广告商面临的核心困境是部分可观测性：

纯自回归预测方法在中长期（竞争格局变化、需求转移发生时）表现不佳。现有文献在拍卖机制理论上很丰富，但对如何在间接竞争可观测性下进行预测提供的指导有限。本文提出通过可观测信号构建"竞争代理"来近似潜在竞争状态。

本文构建了一个竞争感知预测设计空间，将潜在竞争通过三族代理信号进行操作化，并沿两条路径评估：（1）作为外生协变量直接输入预测模型；（2）作为关系先验通过语义邻接矩阵输入时空图神经网络。预测目标为 \(h \in \{1, 6, 12\}\) 周的周度 CPC。

语义邻域与语义图：使用预训练 Transformer（all-MiniLM-L6-v2）将每个关键词 \(k_i\) 编码为 \(e_i \in \mathbb{R}^{384}\) 的嵌入向量，通过余弦相似度识别语义相关关键词。语义邻域服务双重目的：提供邻域竞争协变量，并定义固定语义关键词图 \(A^{sem} \in \mathbb{R}^{N \times N}\)（\(k=10\) 近邻，行归一化）。
DTW 行为邻域：文本相似性不能穷尽竞争关联性——词汇重叠很弱的关键词可能因共同需求冲击而经历类似 CPC 动态。使用动态时间规整（DTW） 度量 CPC 轨迹相似性（带 Sakoe-Chiba 带约束），构建行为邻域并转化为无泄漏的行为竞争特征。
地理意图代理：在租车市场中，拍卖压力高度地域化。从关键词文本中提取地理意图（大洲、国家、城市层级），每个关键词被分配结构化位置指标。保留多层级地理分辨率而非假设更细粒度总是更好。

本文评估三大类模型：

经典/神经基线：SARIMAX、XGBoost、Random Forest、LightGBM、MLP、LSTM、GRU、TabPFN
协变量增强的时序基础模型：Chronos-2、TimeGPT、Moirai——竞争代理作为外生协变量输入
时空图神经网络（STGNN）：DCRNN（扩散卷积 RNN）、GConvLSTM（图卷积 LSTM）、GraphWaveNet（自适应图结构）——消费语义图 \(A^{sem}\)

STGNN 的输入为时空张量 \(X \in \mathbb{R}^{N \times T \times F}\)，输出多步预测 \(\hat{Y}_{t+h} \in \mathbb{R}^{N}\)，使用 MAE 损失训练（对重尾分布更鲁棒）。

目标变量定义：\(\text{cpc\_week}_{k,t} = \frac{\text{adcost\_sum}_{k,t}}{\text{adclicks\_sum}_{k,t}}\)
严格时间序列划分：最后 20% 数据作为测试集，防止时间泄漏
所有邻域特征使用无泄漏（leakage-free）的历史数据构建
评估指标：sMAPE（主指标）和 RMSE（次指标）

模型族	架构	竞争增强配置	sMAPE (%)	RMSE
统计/ML 基线	SARIMAX	单变量滞后	43.93±23.55	1.660±1.759
统计/ML 基线	XGBoost	核心运营特征	36.64±17.51	1.301±1.119
统计/ML 基线	TabPFN	核心运营特征	35.04±17.77	1.250±1.133
协变量 TSFM	Moirai	无泄漏滞后+日历稳定化	30.14±18.24	1.000±0.970
协变量 TSFM	TimeGPT	日历条件+增长钳制	29.29±17.07	1.002±1.008
协变量 TSFM	Chronos-2	地理意图协变量	27.14±15.04	0.841±0.846
时空 GNN	GraphWaveNet	语义图+搜索组合	30.57±20.57	1.005±0.941
时空 GNN	GConvLSTM	语义图+大洲地理	30.69±20.42	1.001±0.955
时空 GNN	DCRNN	语义图+地理+语义CPC	30.42±20.42	1.000±0.926

模型族	1 周 sMAPE	6 周 sMAPE	12 周 sMAPE
最佳基线	30.42	35.04	40.23
最佳协变量 TSFM	27.94	27.14	29.14
最佳时空 GNN	25.82	30.42	37.46