Learning to Segment for Vehicle Routing Problems¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=pN261iTKvr
代码: 待确认
领域: optimization
关键词: 车辆路径问题, 神经组合优化, 迭代搜索加速, 问题分解, 自回归/非自回归模型

一句话总结¶

作者发现迭代式 VRP 求解器在搜索过程中大量边其实早已"稳定不变"、反复优化它们纯属浪费算力，于是提出 First-Segment-Then-Aggregate（FSTA）分解框架把稳定段聚合成超节点、只让求解器去啃不稳定部分，再用神经网络 L2Seg（含自回归、非自回归及二者协同三种变体）学会判断哪些段该聚合，从而把 LKH-3/LNS/L2D 等 SOTA 求解器加速 2~7 倍。

研究背景与动机¶

领域现状：车辆路径问题（VRP）是物流、网约车等场景的核心 NP-hard 组合优化问题，目前最强的求解器——无论是经典启发式（LKH-3、HGS、LNS）还是神经求解器（LEHD、L2D 等）——几乎都依赖迭代搜索（ruin-and-repair 式的局部搜索）来逐步精炼解。

现有痛点：作者观察到一个被普遍忽视的现象——随着搜索推进，解中很大一部分边会"稳定"下来（即在连续若干轮求解调用之间始终保留在解里不再变化），尤其是大容量、长子路径的大规模 VRP。例如相邻子路径的内部边往往固定不动，只有边界边在频繁组合变化。求解器却对这些早已稳定的边一遍遍重复优化，造成大量冗余计算，严重拖累可扩展性。

核心矛盾：稳定性其实可以从客户空间分布和解的结构性质中端到端学出来，但现有求解器没有任何机制去识别并利用这种稳定性——它们要么全局重优化，要么靠手工规则（k 近邻裁剪、有界邻域）盲目缩小搜索空间，无法数据驱动地分辨"哪段稳、哪段不稳"。

本文目标：让求解器学会识别稳定段并跳过它们，把算力集中在真正需要重优化的不稳定部分上，且这套加速要与具体求解器无关（经典/神经/混合都能挂载）、并能覆盖多种 VRP 变体。

核心 idea：先分段后聚合（FSTA） + 学习分段（L2Seg）。FSTA 负责"机制"——把稳定段聚合成固定超节点、缩小问题规模、只重优化不稳定部分，并在理论上证明解的可行性与单调性得以保持；L2Seg 负责"大脑"——用神经网络判断哪些边不稳定，且首次让自回归（AR）与非自回归（NAR）模型协同决策，兼顾全局视野与局部精度。

方法详解¶

整体框架¶

方法分两层。下层 FSTA 是一个求解器无关的分解机制：给定当前解，先识别出不稳定边、断开它们，把剩下的稳定连续节点组成段（segment），每段聚合成一个或两个携带合并属性（总需求、min/max 时间窗等）的超节点，得到规模更小的子问题，交给任意 backbone 求解器重优化，最后把超节点展开还原回原解。上层 L2Seg 是一个编码器-解码器神经网络，专门解决 FSTA 里"哪些边该断"这个组合判断难题，提供 NAR（一次性全局预测）、AR（序列化局部精修）、SYN（二者协同）三种变体。

flowchart LR
    A[当前解 R] --> B[L2Seg 预测不稳定边]
    B --> C[断边并把稳定段分组]
    C --> D[每段聚合成超节点 → 缩小问题 P̃]
    D --> E[backbone 求解器重优化 P̃ → R̃+]
    E --> F[展开超节点还原 → 新解 R+]
    F --> A

关键设计¶

1. FSTA 分解：用超节点固定稳定段，且理论保证解不退化。 这是整套方法的机制基座。把 CVRP 的解记为路径集合 \(\mathcal{R}=\{R_1,R_2,\dots\}\)，每条路径是 \(R_i=(x_0\to x_1^i\to\dots\to x_0)\)。一旦识别出不稳定边集合（与 depot 相连的边强制纳入以保证 depot 合法），就断开它们，把每条路径切成若干不相交的稳定段 \(S^i_{j,k}=(x^i_j\to\dots\to x^i_k)\)，每段用一个超节点 \(\tilde{S}^i_{j,k}=\{\tilde{x}^i_{j,k}\}\)（或两个端点超节点）代替，其属性是段内属性之和（如需求 \(d^i_{j,k}=d^i_j+\dots+d^i_k\)）。这样原问题 \(P\) 收缩成节点更少的 \(\tilde{P}\)，求解器只在不稳定部分上做局部搜索，自然更快。关键是作者证明了两条定理：可行性（聚合解 \(\tilde{\mathcal{R}}_+\) 对 \(\tilde{P}\) 可行 ⟹ 还原解 \(\mathcal{R}_+\) 对原问题可行）与单调性（若 \(f(\tilde{\mathcal{R}}^1_+)\le f(\tilde{\mathcal{R}}^2_+)\) 则 \(f(\mathcal{R}^1_+)\le f(\mathcal{R}^2_+)\)），意味着在缩小问题上改进一定映射为原问题上的改进，且该结论可推广到 CVRP、VRPTW、VRPB、1-VRPPD 等多种变体。正因为有这层保证，FSTA 才能放心地"冻结"大段解而不损失最优性。

2. 编码器统一刻画图级与路径级结构。 AR 与 NAR 共享同一编码器。输入特征上，作者专门设计了两类有判别力的特征——节点相对 depot 的角度（angularity）与内部性（internality，最近邻里属于同路径的比例）——以更好地区分稳定/不稳定边；边则区分"当前解中的边"和"节点到 k 近邻的边"两种类型。节点初始嵌入由 MLP 嵌入与绝对位置编码拼接而成 \(h^{init}_i=\text{Concat}(h^{MLP}_i,h^{POS}_i)\)，先过带掩码的 Transformer 层（掩码阻止不同路径的节点互相计算，从而注入"当前解"的局部结构），再过若干层 GAT 注入全局图信息 \(H^{GNN}=\text{GNN}(H^{TFM},E)\)。这样得到的节点嵌入同时承载了解结构与空间分布，为两种解码器服务。

3. NAR 与 AR 解码器各司其职、互补短板。 NAR 解码器极简——一个 MLP+Sigmoid 一次性输出每个节点不稳定的概率 \(p^{NAR}=\text{MLP}_{NAR}(H^{GNN})\)，全局视野好、速度快，但缺乏条件建模，常把某条不稳定边周围的边"一锅端"全标成不稳定，局部不够精细。AR 解码器则模仿经典局部搜索"删 k 条边再接 k 条边"的行为，交替进行删除阶段与插入阶段：删除阶段（\(t=2k\)）基于目标节点选出一条不稳定边（仅标记不删除），插入阶段（\(t=2k+1\)）从上一条边的端点出发选一条不在解中的伪边作为"桥"通向下一个不稳定区域，最终 \(E_{unstable}=\{e_{\pi_0,\pi_1},e_{\pi_2,\pi_3},\dots\}\)。两阶段都用 GRU 编码序列上下文、用多头注意力做节点选择，并考虑动作空间大小用浅层（删除 \(L^{MHA}_{delete}=1\)）/深层（插入 \(L^{MHA}_{insert}=4\)）解码器，还引入可学习终止候选 \(h_{end}\) 让模型自行决定不稳定边数量。AR 局部精度高，但面对分散在远处的多个不稳定区域时全局视野不足。

4. SYN 协同：NAR 圈定范围、AR 精修，让两种模型联合决策。 这是论文最具开创性的一点——首次在神经组合优化中让 AR 与 NAR 联合决策。SYN 推理分四步：先把问题按相邻子路径对拆成约 \(|\mathcal{R}|\) 个子问题；对每个子问题用 NAR 一次性预测全局不稳定节点 \(\hat{y}^{NAR}=\{x_i\mid p^{NAR}_i\ge\eta\}\)（\(\eta=0.6\)）；再对 NAR 预测出的不稳定节点做 K-means 聚成 \(n_{KMEANS}=3\) 个簇、每簇取概率最高的节点作为 AR 解码的初始目标节点（既缩小 AR 的搜索范围、又避免在相邻节点上重复解码）；最后由 AR 在这些初始点附近局部精修出不稳定边。训练上采用模仿学习：用迭代求解器作 look-ahead 启发式，把一轮重优化前后变化的边 \(E_{diff}=(E_R\setminus E_{R_+})\cup(E_{R_+}\setminus E_R)\) 的端点标为不稳定节点；NAR 用加权二元交叉熵（\(w_{pos}>1\) 平衡正负样本）、AR 用加权交叉熵（\(w_{insert}>w_{delete}\) 平衡两阶段），AR 的标签由 \(E_{diff}\) 诱导的连通分量经深度优先搜索展成"删除-插入"交替的节点序列。NAR 的"全局粗筛"恰好补上 AR 的全局短板，AR 的"局部精修"又纠正 NAR 的过度标记，二者协同因而最优。

实验关键数据¶

主实验：加速三种 backbone 求解器（大容量 CVRP）¶

在 100 个大容量 CVRP 实例上，三种变体都能稳定提升每个 backbone，且 SYN 最好（Gain 相对各自 backbone）：

方法	CVRP2k Obj.↓	Gain↑	CVRP5k Obj.↓	Gain↑
LKH-3	45.24	0.00%	65.34	0.00%
L2Seg-NAR-LKH-3	44.34	1.99%	64.72	0.95%
L2Seg-AR-LKH-3	44.23	2.23%	64.67	1.03%
L2Seg-SYN-LKH-3	43.92	2.92%	64.12	1.87%
LNS	44.92	0.00%	64.69	0.00%
L2Seg-SYN-LNS	43.42	3.34%	63.94	1.16%
L2D	43.69	0.00%	64.21	0.00%
L2Seg-SYN-L2D	43.35	0.78%	63.89	0.50%

搜索曲线显示 SYN 带来 2~7 倍加速，且加速后的弱求解器能反超未加速的强求解器（如 LKH-3+SYN 超过原版 LNS）。

对比 SOTA 经典/神经基线（gap 相对 HGS，越低越好）¶

方法	CVRP1k Gap↓	CVRP2k Gap↓	CVRP5k Gap↓
HGS	0.00%	0.00%	0.00%
LKH-3	4.32%	1.29%	39.22%
SIL	1.94%	-0.17%	-2.33%
L2D	2.11%	0.42%	0.22%
NDS	-0.01%	-1.91%	—
L2Seg-SYN-L2D	0.07%	-2.01%	-3.55%

VRPTW 上同样全面领先，且优势随规模增大（VRPTW5k 上 L2Seg-SYN-L2D 达 -3.14% gap）。

消融实验¶

方法	CVRP2k	CVRP5k
LNS（backbone）	44.92	64.69
Random FSTA (40%)	46.24	66.72
Random FSTA (60%)	46.89	65.92
L2Seg-SYN w/o 增强特征	43.65	64.22
L2Seg-SYN	43.42	63.94

关键发现¶

随机分段反而变差（Random FSTA 比 backbone 还高），说明"分得准"至关重要，盲目聚合会破坏解——这正是需要学习的理由。
增强特征（角度/内部性）有明确贡献，去掉后掉点。
SYN > AR > NAR 的稳定排序印证了"NAR 全局粗筛 + AR 局部精修"的互补逻辑。
L2Seg 对聚类客户、异质需求等更真实分布也能 zero-shot 迁移（比 LNS 提升 0.82%~3.10%），具备实用泛化性。

亮点与洞察¶

从"求解器重复劳动"切入，把加速问题重述为一个学习问题：识别稳定段而非直接构造解，视角新颖且实用。
机制（FSTA）与学习（L2Seg）解耦：FSTA 带可行性/单调性理论保证，使"冻结大段解"在数学上安全；L2Seg 只负责判断，二者职责清晰。
求解器无关、即插即用：能挂在经典 LKH-3、分解框架 LNS、学习引导混合 L2D 上，且对越弱的 backbone 收益越大，工程价值高。
首次让 AR 与 NAR 联合决策：以往 NCO 里二者多用于"NAR 分问题、AR 解子问题"的分治，这里改成"NAR 圈范围、AR 精修同一判断任务"，提供了一种新的协同范式。

局限与展望¶

依赖 look-ahead 求解器生成标签的模仿学习：标签质量受教师求解器上限约束，未探索强化学习等可能突破教师的训练方式。
稳定性假设偏静态：方法建立在"相邻两路径之间发生精炼"的经验观察上，对结构剧烈变动或非局部式搜索的求解器是否同样成立，文中讨论有限。
超参（\(\eta=0.6\)、\(n_{KMEANS}=3\)）需人工设定，跨问题规模/分布是否需重调未充分展开。
主要在 CVRP/VRPTW 上验证，更多复杂约束变体（如取送货、多车型）虽有理论覆盖，但大规模实证仍待补充。

评分¶

新颖性: ⭐⭐⭐⭐⭐ — "学习识别稳定段以加速迭代搜索"是未被探索的视角，且首创 AR/NAR 联合决策范式，配合 FSTA 的理论保证，原创性强。
实验充分度: ⭐⭐⭐⭐ — 覆盖三种 backbone、CVRP/VRPTW 多规模、SOTA 经典/神经/分治基线、消融与泛化齐全；扣分在于复杂约束变体的大规模实证较少、训练范式较单一。
写作质量: ⭐⭐⭐⭐ — 动机观察清晰、方法分层讲解到位、图表充分；公式与符号略密集，AR 解码细节对初读者门槛偏高。
价值: ⭐⭐⭐⭐⭐ — 求解器无关、即插即用、2~7 倍加速且对弱求解器收益更大，对大规模物流路径优化有直接落地价值。