RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks¶
会议: ICLR 2026
arXiv: 2506.06683
代码: https://github.com/AiDuanshiying/RoboPARA
领域: 机器人 / 任务规划
关键词: 双臂机器人, 并行任务规划, DAG依赖图, LLM规划, 多任务调度
一句话总结¶
提出 RoboPARA 框架,通过依赖图构建和图重遍历两阶段优化双臂机器人的任务并行性,在多场景基准上实现相比现有方法 30-50% 的执行时间缩减和 34% 的成功率提升。
研究背景与动机¶
领域现状:LLM 驱动的双臂机器人任务规划(如 RoCo、FLTRNN)已取得进展,但这些方法主要优化任务成功率和完成时间,大多产生单臂顺序执行的计划。
现有痛点:现有方法忽略了双臂间的并行性——当一个任务只需要一只手臂时,另一只手臂完全空闲。这导致双臂系统的协作潜力未被充分利用,执行效率低下。
核心矛盾:双臂并行规划需要同时处理任务间的依赖关系(某些步骤必须按序执行)和并行机会(独立步骤可以同时分配给两只手臂),这是一个组合优化问题。
本文目标 在保证任务正确性的前提下,最大化双臂的并行利用率,减少执行时间。
切入角度:借鉴人类日常行为——烧水的同时刷牙,利用 DAG(有向无环图)建模任务依赖关系,然后通过图遍历调度算法最大化并行度。
核心 idea:将双臂任务规划解耦为"LLM 生成依赖图→调度算法最大化并行"两阶段,让 LLM 专注于理解任务语义而非直接规划并行。
方法详解¶
整体框架¶
RoboPARA 采用两阶段架构:第一阶段通过 LLM + RAG 生成任务依赖图(DAG),第二阶段通过图重遍历算法为双臂分配并行任务。输入为用户的多任务指令集合,输出为双臂的并行执行计划。
关键设计¶
-
依赖图生成与纠错 (Dependency Graph-based Planning):
- 做什么:将多任务指令转化为有向无环图,节点为原子操作步骤,边为依赖关系
- 核心思路:利用 RAG 从本地记忆模块检索任务的详细程序知识,整合到结构化提示中让 LLM 生成 DAG。每条边 \((u, v)\) 表示步骤 \(v\) 必须在 \(u\) 完成后才能开始。增加 DAG 验证和纠错步骤,检测循环依赖和冗余边
- 设计动机:DAG 结构天然适合建模任务依赖——没有入边的节点可以立即执行,有多个无依赖节点时可以并行分配
-
图重遍历双臂并行调度 (Graph Re-Traversal Scheduling):
- 做什么:优化 DAG 遍历顺序,最大化双臂的并行执行步数
- 核心思路:维护两个手臂队列 \(Q_L, Q_R\),在每个时间步选择当前所有入度为零的节点集合 \(S_t\),按启发式规则将它们分配给空闲手臂。对于需要双臂协作的任务,同步分配给两臂。关键启发式包括:优先分配关键路径上的任务、平衡两臂的工作负载
- 设计动机:DAG 生成阶段只保证任务语义正确,并行度优化需要专门的调度算法,这是 NP 难问题的近似求解
-
X-DAPT 基准数据集:
- 做什么:构建首个专注于双臂任务并行性的评估数据集
- 核心思路:涵盖 10 个关键场景(厨房、办公室、农业温室、工厂等),每个场景分三个难度等级,共 1000+ 任务包。评估指标包括 TEI(时间效率指标)、TFR(任务失败率)、PPR(并行步数比例)和 APR(平均并行度)
- 设计动机:现有基准不评估并行性,无法衡量双臂协作效率
损失函数 / 训练策略¶
无需训练——框架基于 LLM 的零样本/少样本推理和确定性调度算法。
实验关键数据¶
主实验¶
| 方法 | TEI ↑ | TFR ↓ | PPR ↑ | APR ↑ | 场景 |
|---|---|---|---|---|---|
| RoboPARA | 0.953 | 0.033 | 0.543 | 0.283 | 厨房 |
| Embodied TaPA | 0.859 | 0.200 | 0.000 | 0.080 | 厨房 |
| RoCo | 0.836 | 0.067 | 0.008 | 0.041 | 厨房 |
| ChatGPT-Prompts | 0.817 | 0.081 | 0.000 | 0.010 | 厨房 |
| LLM-Planner | 0.858 | 0.200 | 0.000 | 0.077 | 厨房 |
消融实验¶
| 配置 | PPR | APR | 说明 |
|---|---|---|---|
| RoboPARA (完整) | 0.543 | 0.283 | 完整框架 |
| w/o 图纠错 | ~0.35 | ~0.18 | DAG 生成可能含循环/冗余 |
| w/o RAG 检索 | ~0.40 | ~0.20 | 任务分解质量下降 |
关键发现¶
- RoboPARA 平均实现 4.5× 以上的并行和协作步数,执行时间减少 30-50%
- 在最复杂任务组合中,RoboPARA 成功率比其他方法平均高 34%
- 所有 baseline 方法的并行步数接近零(PPR ≈ 0),证实现有方法完全忽略并行性
- 在真实人形机器人上的部署展示了接近人类活动模式的行为
亮点与洞察¶
- 规划-调度解耦设计:让 LLM 专注于任务语义理解和依赖关系建模,将 NP 难的调度问题交给确定性算法,是合理的职责分工
- 并行性作为评估维度:首次将并行度作为双臂机器人的核心评估指标,PPR/APR 指标可推广到多机器人协作场景
局限与展望¶
- DAG 生成仍依赖 LLM 的推理能力,对复杂跨任务依赖可能出错
- 调度算法使用启发式而非最优求解,可能遗漏最优并行方案
- 假设每个原子操作的执行时间已知或可预估,实际中可能不成立
- 未考虑执行过程中的动态重规划(如某步失败后的恢复策略)
相关工作与启发¶
- vs RoCo: RoCo 让 agent 通过对话协商来分解和分配任务,但产生的计划仍以顺序执行为主;RoboPARA 显式优化并行度
- vs FLTRNN: FLTRNN 使用 RNN 结构进行长期规划,关注任务分解和记忆管理,不关注双臂并行
评分¶
- 新颖性: ⭐⭐⭐⭐ 首个系统性关注双臂并行度的 LLM 规划框架
- 实验充分度: ⭐⭐⭐⭐ 丰富的 baseline 对比和多场景评测
- 写作质量: ⭐⭐⭐⭐ 动机清晰、方法描述充分
- 价值: ⭐⭐⭐⭐ 对多臂/多机器人任务调度有实际指导意义