Competition-Aware CPC Forecasting with Near-Market Coverage¶

会议: CVPR 2026
arXiv: 2603.13059
代码: 无
领域: 时间序列
关键词: CPC预测, 搜索广告拍卖, 竞争代理, 时空图网络, 时间序列基础模型

一句话总结¶

这篇论文把搜索广告中的 CPC 预测重新表述为“竞争状态部分不可观测”下的时间序列预测问题，用语义相似性、CPC 轨迹对齐和地理意图三个可观测代理去近似隐含竞争，再分别以协变量和图先验两种形式注入预测器，在中长期预测上显著优于纯自回归基线。

研究背景与动机¶

搜索广告里的 CPC 不是一个稳定的业务指标，而是拍卖过程的结果变量。对广告主而言，它直接决定同样预算能买到多少点击，因此预测误差会很快转化成投放计划偏差、预算浪费和利润压缩。

现有 CPC 预测方法面临一个很核心的困难：广告主只能看到自己这一侧的曝光、点击、花费和最终 CPC，却看不到竞争对手的出价、质量分、预算消耗节奏，也看不到平台内部完整的拍卖状态。也就是说，真正决定价格形成的“竞争环境”是隐变量。

作者认为，很多已有方法之所以在中长期 horizon 上开始失效，不是因为模型容量不够，而是因为输入里缺少了能反映竞争变化的结构化信号。纯自回归方法擅长延续短期惯性，但当竞争者切换预算、局部市场需求上升、关键词替代关系变化时，仅靠单变量历史很难稳住预测。

论文的逻辑链条很清楚：

领域现状：搜索广告研究对 GSP 拍卖、排序机制和 CTR 建模已经很多，但对“单个广告主视角下如何预测未来 CPC”研究不足。

现有痛点：观测到的是结果，不是竞争原因；而 CPC 恰恰对竞争态势极其敏感。

核心矛盾：真实竞争状态不可直接观测，但它会在可观测变量中留下痕迹。

本文要解决的问题：能否用一组高质量代理信号，把隐式竞争结构显式化，再交给预测模型吸收。

切入角度：从三个互补视角近似竞争，分别是关键词语义替代性、历史 CPC 轨迹行为相似性，以及地理意图所对应的局部市场结构。

核心 idea：与其发明一个全新的预测架构，不如先把“竞争”构造成能被不同模型使用的先验和协变量，让模型在部分可观测环境下获得更稳定的中长期预测能力。

我觉得这篇论文的动机写得比较扎实。它没有把贡献包装成万能大模型或全新 GNN，而是承认真正的新意在于“代理变量构造”和“代理变量表示方式”。这比很多只换 backbone 的工作更有业务解释力。

方法详解¶

作者的方法不是单一模型，而是一套 competition-aware forecasting 设计框架。核心动作分成两步：先从可观测数据里提炼竞争代理，再决定把这些代理以什么形式喂给预测器。

论文中的预测目标是对 1811 个关键词的周级 CPC 做多步预测，预测 horizon 取 \(h \in \{1, 6, 12\}\) 周。作者并不尝试显式重建真实拍卖机制，而是强调“只要代理足够稳定、足够贴近竞争结构，就足以改善预测”。

整体框架¶

整体 pipeline 可以概括为下面五步：

从 Google Ads 2021 到 2023 年日志中构造关键词级周面板。
生成三类竞争代理：语义代理、行为代理、地理代理。
将代理走两条路线接入模型：
- 协变量路线：把代理整理成 leakage-free 的外生特征。
- 关系先验路线：把关键词之间的竞争关系编码成固定语义图。
在统一评测协议下比较三类模型：传统/神经基线、时间序列基础模型、时空图网络。
按 1 周、6 周、12 周三个 horizon，以及 competitive frontier 的高风险子集分析效果。

这套框架的输入不是单纯的历史 CPC，而是一个更完整的周级面板，包括点击、展示、花费、设备结构、搜索类型结构，以及从关键词文本和轨迹中派生出的竞争信号。输出则是未来若干周的 CPC 预测值。

关键设计¶

论文最重要的不是某个公式，而是三类代理的构造方式和两种表示路径。

语义邻域与语义关键词图
- 功能：用关键词文本的语义相似性近似“可能抢同一类流量”的关键词集合。
- 核心思路：作者用 all-MiniLM-L6-v2 为每个关键词编码得到 384 维向量 \(e_i \in \mathbb{R}^{384}\)，再计算余弦相似度找语义邻居。每个关键词连向最相近的 \(k=10\) 个邻居，构成固定语义图，并对邻接矩阵做行归一化。
- 设计动机：在广告拍卖里，真正的竞争关系往往不是字符串表面相同，而是搜索意图可替代。比如两个不同写法的“机场租车”关键词可能会竞争同一批高意图流量。文本语义能把这种替代性补出来。
- 和以往方法的区别：很多时空图模型依赖天然物理图，例如道路网络或电网拓扑；这里没有现成拓扑，所以作者把“语义替代性”主动变成图结构。
基于 DTW 的行为邻域
- 功能：从历史 CPC 轨迹中寻找“走势相似但时间点可能错位”的关键词。
- 核心思路：作者使用 Dynamic Time Warping 衡量两条 CPC 序列的相似性，并加上 Sakoe-Chiba band 约束避免病态对齐。由此得到的行为邻域不会直接泄漏未来，而是只用历史轨迹做统计汇总，形成 leakage-free 的行为竞争特征。
- 设计动机：有些关键词在词面上不相似，但会一起受季节、预算调整或市场冲击影响。如果只看文本，这类联动抓不到；加入轨迹对齐后，可以补足“同涨同跌”的竞争暴露关系。
- 和语义邻域的关系：语义代理更像静态替代关系，DTW 行为代理更像动态共振关系，两者互补而不是替代。
地理意图代理
- 功能：从关键词文本中提取 continent、country、city 等层级地理信息，作为局部需求与竞争异质性的代理。
- 核心思路：作者结合关键词文本、地理词典和层级映射，为每个关键词打上多尺度地理标签。它本质上是把“用户意图的地理归属”转成结构化变量。
- 设计动机：租车行业的搜索需求高度本地化，机场、城市、国家的不同会对应完全不同的需求强度和竞争密度。地理结构天然决定局部市场是否拥挤。
- 经验发现：更细的地理粒度不一定更好，continent 这种粗粒度反而更稳，因为它不容易把训练样本切得过碎。
两种代理表示路线
- 功能：同一组 competition proxy 不固定绑定某一种模型，而是分别以协变量和图先验两种方式接入。
- 核心思路：协变量路线把邻域历史汇总、地理变量、核心运营变量一起输入 TSFM 或传统模型；图路线则把关键词间的语义连边变成 STGNN 的固定图结构，让跨关键词信息沿图传播。
- 设计动机：作者想回答的不是“哪个 backbone 最强”，而是“什么样的竞争表示最有用”。因此必须把表示方式和模型家族解耦来比较。
- 结果含义：如果协变量路线更强，说明 competition proxy 更适合作为外生条件；如果图路线更强，说明关系传播本身更关键。论文最终发现两者在不同 horizon 上各有优势。
competitive frontier 评估视角
- 功能：把关键词按均值 CPC 和波动率划分成四个象限，单独分析最贵且最不稳定的高风险区。
- 核心思路：作者用 mean CPC 表示“价值”，用变异系数表示“波动性”，重点看右上角高 CPC 高 volatility 的 frontier 区域。
- 设计动机：平均误差不能体现业务风险，真正需要稳的是那些昂贵且波动大的词，因为这些词的预测失误最伤预算。
- 价值：这一步让论文不只是报告平均 sMAPE，而是把预测提升和业务风险直接关联起来。

损失函数 / 训练策略¶

训练和评测设置比较统一，重点是避免时序泄漏和适配重尾分布：

数据按时间严格切分，最后 20% 作为 out-of-sample test。
预测 horizon 为 1 周、6 周、12 周，分别对应短期出价调整、中期战术规划、长期预算分配。
评测主指标是 sMAPE，辅指标是 RMSE。
STGNN 采用全局训练方式，在关键词面板上联合学习。
图模型使用 MAE 作为优化目标，因为 CPC 分布重尾明显，用平方误差容易被极端值支配。

论文没有把重点放在复杂 loss 工程，而是把主要精力放在输入结构设计上。这也说明作者相信：对这个问题而言，先把竞争信息表达对，比换一个更花哨的训练技巧更重要。

实验关键数据¶

数据部分很关键，因为它解释了为什么这篇工作需要 competition-aware 的建模方式。

原始日志规模约 16.6 亿条，来自 2021 到 2023 年的 Google Ads 车租行业数据。
每条记录包含关键词、匹配查询、落地页 URL、设备类型、搜索类型，以及 impressions、clicks、cost 等数值指标。
经过领域过滤、域名质量过滤和关键词标准化后，保留 1811 条关键词时间序列。
每条关键词要求在 127 周窗口中至少出现 110 周，避免极短生命周期词带来的假信号。
周级聚合后得到 218,924 个 keyword-week 样本。
周级 CPC 定义为 \(\mathrm{CPC}_{k,t} = \frac{\mathrm{cost}_{k,t}}{\mathrm{clicks}_{k,t}}\)，只在 clicks 大于 0 时计算。
CPC 均值为 2.86，最大值达到 80.16，p99 为 12.13，偏度 3.34，说明价格分布明显重尾。
competitive frontier 的高风险象限包含 402 个关键词，是作者重点分析的业务关键区域。

主实验¶

先看跨 horizon 的家族级总结，可以非常直观地看到不同模型在不同规划周期上的分工。

预测 horizon	最强传统/ML 基线 sMAPE	最强 TSFM sMAPE	最强 STGNN sMAPE	结论
1 周	30.42	27.94	25.82	短期上图模型最强，说明局部竞争传播对即时预测更有帮助
6 周	35.04	27.14	30.42	中期上带竞争协变量的基础模型最稳
12 周	40.23	29.14	37.46	长期上 TSFM 明显领先，图结构优势变弱

作者进一步把 6 周这个最关键的业务 horizon 展开，因为这是 competition-aware 设计最能拉开差距的时间点。

模型家族	架构	最优 competition-aware 配置	sMAPE	RMSE
统计/ML	SARIMAX	单变量滞后	43.93 ± 23.55	1.660 ± 1.759
统计/ML	XGBoost	核心运营特征	36.64 ± 17.51	1.301 ± 1.119
统计/ML	TabPFN	核心运营特征	35.04 ± 17.77	1.250 ± 1.133
TSFM	Moirai	leakage-free lags + calendar stabilization	30.14 ± 18.24	1.000 ± 0.970
TSFM	TimeGPT	calendar conditioning + growth clamp	29.29 ± 17.07	1.002 ± 1.008
TSFM	Chronos-2	地理意图协变量	27.14 ± 15.04	0.841 ± 0.846
STGNN	GraphWaveNet	语义图 + search mix	30.57 ± 20.57	1.005 ± 0.941
STGNN	GConvLSTM	语义图 + 大洲地理	30.69 ± 20.42	1.001 ± 0.955
STGNN	DCRNN	语义图 + 地理 + 语义邻域 CPC	30.42 ± 20.42	1.000 ± 0.926

从这个表可以看出三件事：

纯基线已经到达明显天花板，最好也只有 35.04。
竞争协变量给 TSFM 的收益最大，尤其是 Chronos-2 + 地理意图直接把 6 周 sMAPE 拉到 27.14。
图模型虽然在 6 周不如 Chronos-2，但依然系统性优于非图基线，说明关系先验是有信息量的。

消融实验¶

论文最有价值的消融不是“去掉某一层网络”，而是比较不同 competition proxy 的有效性和粒度选择。

配置/分析	horizon	关键指标	说明
Core only	6 周	31.61 sMAPE	只用核心输入时的图模型参考点
Core + Geo + Sem CPC	6 周	30.71 sMAPE	最优 6 周配置，地理代理和语义邻域 CPC 互补
All proxies naive stacking	6 周	34.0 sMAPE	无选择地堆特征反而最差，比最优方案差 3.3 点
Core only	12 周	38.32 sMAPE	长期预测下的参考基线
Core + Continent	12 周	37.93 sMAPE	长期最稳的是粗粒度地理先验
All proxies naive stacking	12 周	43.13 sMAPE	比最优配置差 5.2 点，说明特征越多并不越好

作者还专门比较了地理粒度，结果很能说明“粗先验比细先验更稳”。

地理分辨率	1 周 sMAPE	6 周 sMAPE	12 周 sMAPE	解释
Continent (7 dummies)	26.36	30.90	37.93	粗粒度最稳定，兼顾结构信息和样本密度
Country (63 dummies)	26.72	31.51	38.70	信息更细，但样本被切碎，稳健性下降
City (268 dummies)	27.16	31.82	39.04	粒度过细，噪声和稀疏性问题更明显

关键发现¶

发现 1：竞争代理不是可有可无的辅助信息，而是中长期预测性能的决定因素之一。6 周和 12 周的提升远大于 1 周，说明它们主要在应对 regime shift 和局部市场变化时发挥作用。
发现 2：不同 horizon 需要不同的表示方式。1 周时 STGNN 最强，说明短期更依赖跨关键词的即时关系传播；6 周和 12 周时 TSFM 更强，说明中长期更需要稳定的外生先验来抑制漂移。
发现 3：地理代理比作者最初的文本直觉还重要。最强整体结果来自 Chronos-2 + geographic intent，而不是某种复杂图结构。
发现 4：selective augmentation 比 exhaustive stacking 更重要。把所有代理都堆进去会变差，说明 noisy auction 环境里高质量先验必须有选择地使用。
发现 5：提升主要集中在高 CPC 高波动的 competitive frontier 区域。作者报告在 6 周上，Core + Geo + Sem CPC 相比 Core only 可把这一高风险区域的误差再降 1.3 个百分点。

亮点与洞察¶

这篇论文最好的地方是问题建模很准确。它没有把 CPC 预测简单看成普通时序任务，而是明确指出这是“部分可观测竞争系统”下的预测问题，这个 framing 直接决定了后续方法设计。
三类代理的选择很有层次。语义代理抓替代性，DTW 代理抓行为同步，地理代理抓局部市场结构，三者分别对应三种不同来源的竞争痕迹。
“代理表示方式”这个视角很值得学。很多工作只比较 backbone，这篇文章则把“同一信息到底作为协变量还是图先验更好”单独拿出来分析，研究问题更干净。
competitive frontier 的评估方式很实用。广告业务里平均误差不是唯一目标，真正危险的是贵且波动大的词；作者把评测重点放到这些词上，实验更接近真实投放决策。
一个很有启发的结论是：粗粒度地理比细粒度地理更稳。这提醒我们在商业时序里，先验不是越细越好，而要看它是否能在有限样本下形成稳定统计信号。
论文也给出一个重要工程经验：在高噪声拍卖环境里，特征工程的关键不是“多”，而是“对”。这对做工业预测非常重要。

局限与展望¶

作者自己承认，数据只来自 car-rental 这一垂直行业，且市场相对集中，因此结论未必能直接推广到竞争主体更多、查询意图更散的行业。
语义图是固定图，无法表达关键词替代关系随季节、事件、竞争者策略变化而动态变化的事实。对于广告市场，这一点其实很关键。
论文依然是在单广告主可见数据上构建代理，因此代理再好也只是近似，不可能等价替代真实拍卖状态。
行为邻域用 DTW 虽然合理，但仍是离线静态邻域，没显式建模邻居关系随时间滚动更新的过程。
文章主要分析的是预测误差，没有继续往下连接到实际 bidding 或 budget allocation 的收益提升，这让业务闭环还差半步。

我觉得可以继续做的方向包括：

把固定语义图升级为动态图，让边权随时间和市场状态变化。
在图上显式区分“替代关系”和“互补关系”，而不是只用单一相似度建边。
引入事件信号或外部需求信号，例如旅游旺季、节假日、机场流量等，进一步增强长期 horizon 的稳定性。
直接评估“更准的 CPC 预测是否真的带来更优投放 ROI”，把预测任务连到决策优化。

评分¶

新颖性: ⭐⭐⭐⭐ 将 CPC 预测明确建模为部分可观测竞争问题，并系统比较代理构造与表示路线，这个切入点是有新意的。
实验充分度: ⭐⭐⭐⭐☆ 覆盖传统模型、TSFM、STGNN、多 horizon 和 competitive frontier 分析，实验面较完整，但跨行业泛化仍不足。
写作质量: ⭐⭐⭐⭐ 动机、问题 framing 和实验结论都比较清晰，读完后能明确知道作者想证明什么。
价值: ⭐⭐⭐⭐☆ 对广告投放这种高业务价值场景很实用，也给更一般的工业预测任务提供了“用代理恢复隐变量结构”的方法论启发。