PriorDrive: Enhancing Online HD Mapping with Unified Vector Priors¶

会议: AAAI 2026
arXiv: 2409.05352
代码: https://github.com/MIV-XJTU/PriorDrive
领域: 自动驾驶 / HD地图构建
关键词: HD Map, 先验地图, 统一向量编码, 即插即用, 在线建图

一句话总结¶

提出 PriorDrive 框架，通过 Unified Vector Encoder (UVE) 和 Hybrid Prior Representation (HPQuery) 将多种向量化先验地图（SD地图、旧HD地图、历史预测地图）统一编码并集成到各种在线建图模型中，在 nuScenes 上 mAP 提升 14.3，兼容 query-based 和 non-query-based 两类建图架构。

研究背景与动机¶

HD地图对自动驾驶至关重要但传统创建/维护方法成本高昂、更新滞后。在线建图用车载传感器实时构建地图，但受遮挡、恶劣天气和远距离区域性能瓶颈限制。利用先验地图（SD地图、旧HD地图、历史预测）可弥补单一感知数据的不足。

然而现有先验地图利用方法存在系统性缺陷： 1. P-MapNet/NMP/HRMapNet 使用栅格化编码，受分辨率限制信息有损且冗余，需复杂后处理转换格式 2. MapEX 仅利用旧HD地图单一先验源，更新频率低难以反映实时道路变化 3. NavMap 在整合HD和SD地图时丢弃变长路段信息，造成有价值信息损失 4. 向量编码面临三大特有挑战：不同地图含不同向量类型（点/线/面）、向量长度可变、不同地图间存在对齐和一致性问题 5. 现有方法通常只编码位置和类别属性，缺乏方向、几何形状、拓扑等细粒度信息的能力 6. 历史预测地图作为先验源的潜力被大多数研究忽视

方法详解¶

整体框架¶

多源先验地图 M_prior = {M₁, M₂, ..., M_t} → UVE 统一编码为 f_prior → 与在线建图模型交互：对 non-query 模型通过 DeConv+Conv 融合到 BEV 特征；对 query-based 模型通过 HPQuery 在实例级和点级分别与Query交互 → 增强的地图预测 P = D_map(f_bev, HPQuery)。预测结果可上传云端成为其他车辆的先验地图，形成正反馈循环。

关键设计¶

Unified Vector Encoder (UVE)：类比 BERT 编码文本——向量点 ≈ 词，向量元素 ≈ 句子。Fused Prior Embedding (FPE) 融合5类信息：位置嵌入（Fourier特征编码x,y）、方向嵌入（编码v_x,v_y）、[VEC] token（每个向量开头的锚点，提取实例级特征）、可学习实例嵌入+类型嵌入（区分不同向量实例和类型）、2D位置嵌入保持点序。Dual Encoding机制：M层 intra-vector attention（掩码限制在同一实例内，学习点间交互增强感知能力）+ N层 inter-vector attention（全开放掩码，学习跨实例全局上下文），从变长向量中提取固定长度的实例级和点级特征。通过注意力掩码机制自适应关注不同先验地图中更优的元素。
向量数据预训练（Position Modeling）：首创段级+点级预训练范式。Noise & Mask Generator 两种模式：(a) 加噪——对10%段级（选中元素内所有点）+ 5%点级施加高斯噪声 ε∼N(0,1) 到水平和垂直坐标；(b) 掩码——选中点坐标置为-1。UVE编码后通过MLP重建所有点坐标，损失为 L = RMSE(P, mlp(E_uve(M_org*)))。预训练24 epochs（约12小时），一次性完成，提升UVE对噪声历史地图的去噪和编码能力。
HPQuery 集成方法：对 query-based 模型（MapTR系列）的 Q = {q_ij} = {q_i^ins + q_j^pt} 提供三种融合操作——addition（q = q.add(f)，先验特征加到对应Query上）、replacement（q = q.replace(f)，先验特征直接替换部分Query）、concatenation（q* = concat[q, f]，先验特征拼接到Query）。三种操作在实例级和点级分别交互。对 non-query 模型直接 DeConv 上采样后 concat+Conv 到 BEV 特征。

损失函数¶

预训练：L = RMSE(P, mlp(E_uve(M_org*)))，24 epochs，约12小时一次性预训练
主训练：沿用各基线模型原始损失和超参数不变（如MapTR的匈牙利匹配损失等），PriorDrive不引入额外损失项
计算资源：8×RTX A6000

实验关键数据¶

主实验：跨数据集/跨模型验证¶

数据集	基线模型	指标	+PriorDrive	原始基线	提升
nuScenes	MapTRv2 R50 24ep	mAP	75.8	61.5	+14.3
nuScenes	MapTRv2 R50 110ep	mAP	80.5	—	新SOTA
nuScenes	HDMapNet Effi-B0	mIoU	40.1	32.9	+7.2
nuScenes	PivotNet R50 24ep	mAP	65.3	56.5	+8.8
Argoverse 2	MapTRv2	mAP	72.8	64.7	+8.1
OpenLane-V2	TopoLogic	OLS	46.2	41.6	+4.6

消融实验¶

配置	mAP	变化	说明
完整模型 (SD+HD+Local)	75.8	—	三种先验互补最优
去除UVE（用独立MLP）	69.7	-6.1	统一编码器关键
去除预训练	71.5	-4.3	预训练提升编码质量
仅SD地图先验	72.8	-3.0	单源不如多源
仅旧HD地图先验	73.3	-2.5	HD地图精度高但部分过时
仅历史Local先验	72.3	-3.5	单次预测不够完整
无先验（原始MapTRv2）	61.5	-14.3	基线对照
搜索范围5m	75.8	—	最优搜索范围
搜索范围10m	74.2	-1.6	过宽引入噪声降低精度

关键发现¶

三种先验地图互补：每种先验都独立提升性能，组合后效果最优（SD+3.0, HD+2.5, Local+3.5 → 组合+14.3）
在线局部先验数量越多效果越好（1份+3.0 mAP, 多份+5.2 mAP），体现信息累积优势
极小计算开销：FPS 10.3→9.9（-3.9%），参数仅增3.1MB，UVE仅占15.3%运行时间
新划分数据集（无地理重叠）上仍有效——证明不是记忆地图而是真正学会利用先验信息
大感知范围（60m×30m）下提升更显著——先验地图在远距离区域优势更明显
拓扑推理任务（OpenLane-V2 OLS +4.6）验证了框架的跨任务泛化能力

亮点与洞察¶

真正即插即用：兼容HDMapNet/MapTR/MapTRv2/PivotNet/TopoLogic等多种建图模型
首次统一编码三种先验地图类型，最大化互补信息利用
将向量数据类比为NLP文本（点≈词、元素≈句子）的建模思路新颖且有效
向量预训练范式（段级+点级噪声/掩码 → 坐标重建）填补了该领域空白
正反馈循环设计：当前预测上传云端→成为他人先验→持续改善整体精度

局限性¶

先验地图需从外部获取（SD地图、历史数据），新区域首次部署冷启动困难
预训练依赖数据集内的向量地图分布，跨域迁移需重新训练
不同先验间的对齐和一致性虽通过注意力机制缓解但未完全解决
FPS从10.3降至9.9，虽影响不大但对实时性要求极高的场景仍需优化

评分¶

⭐⭐⭐⭐⭐ (5/5) 问题定义准确，方法设计全面（编码器+预训练+集成），3数据集×多基线×详细消融的实验极其充分。对自动驾驶HD建图有直接工程价值。