AAAI 2026 机器人网格存储乱序检索最大容量 k-bounded perturbation 鲁棒存储重定位最小化

Robust Out-of-Order Retrieval for Grid-Based Storage at Maximum Capacity¶

会议: AAAI 2026
arXiv: 2601.19144
代码: 无
领域: 机器人
关键词: 网格存储, 乱序检索, 最大容量, k-bounded perturbation, 鲁棒存储, 重定位最小化

一句话总结¶

针对满载 2D 网格存储系统中检索顺序不确定的问题，提出 k-bounded perturbation 不确定性模型，证明 Θ(k) 列宽是零重定位的充要条件，并给出高效鲁棒存储求解器与贪心检索策略，当 k ≤ 0.5c 时几乎消除重定位，k 到达 c 时仍减少 50%+ 重定位。

动机¶

满载存储效率矛盾：高密度网格存储（如拼图式存储 PBS）中，存储密度越高，任意货物的可达性越差；满载时问题尤为严峻。
检索顺序不可预知：先前工作假设存储/检索顺序完全已知，但实际物流场景（末端配送中心、集装箱码头）中检索顺序在存储阶段之后才确定，甚至动态变化。
重定位代价高昂：当目标货物被其他货物阻挡时，需要执行重定位操作（将阻挡货物移开再放回），每次重定位都增加时间、能耗和 I/O 行占用。
已有零重定位方案脆弱：c ≥ 3 列时可保证已知顺序的零重定位（BaseS），但检索顺序稍有变动就失效（如 Figure 1 所示，轻微扰动即导致多次重定位）。
理论空白：网格存储中同时考虑顺序不确定性和满载条件的理论分析（所需列数的上下界）尚未建立。
实用设计指导缺乏：仓库设计者需要知道"给定网格宽度能容忍多大的检索顺序偏差"，以权衡空间利用率和操作鲁棒性。

方法详解¶

问题建模（R-StoRMR）¶

存储区域 W 为 r × c 网格，底部为开放侧（I/O 行），货物通过 I/O 行进出。
n = r·c 个带标签货物按已知到达序列 A 存入，然后按 D̃ 检索，D̃ 是 D = (1,2,…,n) 的 k-bounded perturbation。
k-bounded perturbation：序列 S̃ 是 S 的 k-bounded perturbation，当且仅当所有逆序对 (s_i, s_j) 满足 j - i ≤ k（即任意两个货物的检索顺序偏差不超过 k 位）。
目标：最小化重定位次数、I/O 行占用和总移动距离。

理论分析：零重定位所需列数¶

鲁棒邻接条件（Proposition 1）：排列 𝒜 对 D 是 k-robust 的，当且仅当每个非底行货物 d_i 都与某个至少比它早 k+1 位检索的货物 d_j 相邻。
上界（Theorem 2）：3k+3 列足够。将货物按标签模 (k+1) 分成 k+1 组，每组分配 3 列独立求解 StoRMR。
下界（Theorem 3）：2k+3 列必要。构造性证明：前 k+1 个最早检索的货物和前 k+2 个到达序列的货物都必须放底行。
设计指导：k/c ≤ 1/3 时可保证零重定位；k/c ≥ 1/2 时无法避免重定位。

鲁棒存储算法（RobustS）¶

核心思想：逐对填充相邻列 (L, R)，从底行向上，联合迭代 D 和 A^R，贪心寻找同时满足两个方向邻接条件的货物对。

列对初始化：L 底格放 A^R 中下一个未分配货物，R 底格放最小未分配货物（确保前 k+1 个货物在底行）。
主循环：从 D 中取下一个 D-valid 的货物 x 放 R 列；在 A^R 中找匹配的 y 放 L 列，要求 x 和 y 同时满足所有邻接条件。
末列处理：保留第 3（和第 4）列最后填充，利用相邻列的水平邻接增加成功率。
load-skipping 增强：尝试 A^R 的不同起始偏移量，穷举所有可能的邻接链起点（可并行），显著提高找到鲁棒排列的成功率。

检索策略（ImpR）¶

当 k 超过理论上限、需要重定位时：

对目标货物 x 计算阻挡最少的检索路径 π。
沿 π 从外到内依次重定位 blocker b：
- 计算当前 unblocked 货物集 U（有直接 I/O 通路的货物）。
- 优先在 W 内重定位 b，选择不会阻挡 U 中货物的最近空格。
- 若 W 内无空格，将 b 移至 I/O 行暂存，x 检索后放回原位。
约束：每次检索完成后 I/O 行必须清空。

实验¶

在方形网格（100% 密度）上比较四种组合：BaseS+BaseR、RobustS+BaseR、BaseS+ImpR、RobustS+ImpR。每组参数 50 次随机试验。

表 1：不同 k/c 比值下的平均重定位次数（17×17 网格）¶

k/c	BaseS+BaseR	RobustS+BaseR	BaseS+ImpR	RobustS+ImpR	降幅
0.25	~60	~2	~40	~0	~100%
0.50	~130	~15	~85	~8	~94%
0.75	~190	~80	~120	~55	~71%
1.00	~240	~120	~150	~90	~63%

表 2：算法运行时间（秒，按网格大小）¶

网格大小	RobustS 时间	ImpR 时间
9×9	<1	<0.1
13×13	~5	<0.5
17×17	~20	<1
21×21	~50	<1

RobustS 和 ImpR 在所有网格大小下均在 1 分钟和 1 秒内完成。

发现¶

当 k ≤ 0.5c 时，RobustS 几乎完全消除重定位，与 Theorem 3 的理论预测一致。
k 增大至 c 时，RobustS+ImpR 仍比 baseline 减少 60-70% 重定位。
I/O 行占用显著降低：ImpR 优先在 W 内重定位，RobustS 进一步减少直至 k/c ≤ 0.5 时完全消除。
几乎所有在 W 内重定位的货物不会被再次重定位，避免了级联重定位。
load-skipping 增强使 RobustS 在 k 超过理论上限时仍有 80%+ 的成功率。

亮点¶

理论贡献扎实：首次建立满载网格存储中鲁棒零重定位所需列数的紧界 Θ(k)，上下界仅差 1.5 倍。
问题定义优雅：k-bounded perturbation 模型精确刻画了实际中"局部乱序"的不确定性，比完全随机更贴近现实。
理论与实践统一：理论界不仅是存在性证明，直接指导了 RobustS 算法设计和仓库宽度的工程选择。
计算效率佳：存储算法复杂度与 n 近线性，检索策略实时可用。
实验说服力强：覆盖多种网格大小和 k/c 比值，三个指标（重定位、I/O 占用、距离）全面优于 baseline。

局限性¶

方形网格假设：实验仅在方形网格上进行，非方形（r ≪ c 或 r ≫ c）场景未验证。
RobustS 非最优：算法是贪心启发式，无法保证在 2k+3 ≤ c < 3k+3 时总能找到鲁棒排列（理论 gap 未闭合）。
单机器人假设：仅考虑一个机器人/操纵器顺序操作，未扩展到多机器人并行场景。
静态 k 值：k 在存储阶段就需固定，无法自适应调整；实际扰动分布可能非均匀。
NP-hard 重定位子问题：ImpR 为贪心近似，无最优性保证；大规模场景下贪心选择可能非最优。
未考虑动态到达：假设所有货物先存储完毕再检索，不支持存取交错的在线场景。

评分¶

新颖性: ⭐⭐⭐⭐ k-bounded perturbation 不确定性建模新颖，Θ(k) 紧界为首创
实验充分度: ⭐⭐⭐⭐ 三指标×四组合×多网格大小，含消融实验
写作质量: ⭐⭐⭐⭐⭐ 问题定义精确，理论-算法-实验逻辑链完整清晰
价值: ⭐⭐⭐⭐ 理论指导仓库设计，算法可直接部署于满载存储系统