跳转至

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

会议: ICLR 2026
arXiv: 2506.06683
代码: https://github.com/AiDuanshiying/RoboPARA
领域: 机器人 / 任务规划
关键词: 双臂机器人, 并行任务规划, DAG依赖图, LLM规划, 多任务调度

一句话总结

提出 RoboPARA 框架,通过依赖图构建和图重遍历两阶段优化双臂机器人的任务并行性,在多场景基准上实现相比现有方法 30-50% 的执行时间缩减和 34% 的成功率提升。

研究背景与动机

领域现状:LLM 驱动的双臂机器人任务规划(如 RoCo、FLTRNN)已取得进展,但这些方法主要优化任务成功率和完成时间,大多产生单臂顺序执行的计划。

现有痛点:现有方法忽略了双臂间的并行性——当一个任务只需要一只手臂时,另一只手臂完全空闲。这导致双臂系统的协作潜力未被充分利用,执行效率低下。

核心矛盾:双臂并行规划需要同时处理任务间的依赖关系(某些步骤必须按序执行)和并行机会(独立步骤可以同时分配给两只手臂),这是一个组合优化问题。

本文目标 在保证任务正确性的前提下,最大化双臂的并行利用率,减少执行时间。

切入角度:借鉴人类日常行为——烧水的同时刷牙,利用 DAG(有向无环图)建模任务依赖关系,然后通过图遍历调度算法最大化并行度。

核心 idea:将双臂任务规划解耦为"LLM 生成依赖图→调度算法最大化并行"两阶段,让 LLM 专注于理解任务语义而非直接规划并行。

方法详解

整体框架

RoboPARA 采用两阶段架构:第一阶段通过 LLM + RAG 生成任务依赖图(DAG),第二阶段通过图重遍历算法为双臂分配并行任务。输入为用户的多任务指令集合,输出为双臂的并行执行计划。

关键设计

  1. 依赖图生成与纠错 (Dependency Graph-based Planning):

    • 做什么:将多任务指令转化为有向无环图,节点为原子操作步骤,边为依赖关系
    • 核心思路:利用 RAG 从本地记忆模块检索任务的详细程序知识,整合到结构化提示中让 LLM 生成 DAG。每条边 \((u, v)\) 表示步骤 \(v\) 必须在 \(u\) 完成后才能开始。增加 DAG 验证和纠错步骤,检测循环依赖和冗余边
    • 设计动机:DAG 结构天然适合建模任务依赖——没有入边的节点可以立即执行,有多个无依赖节点时可以并行分配
  2. 图重遍历双臂并行调度 (Graph Re-Traversal Scheduling):

    • 做什么:优化 DAG 遍历顺序,最大化双臂的并行执行步数
    • 核心思路:维护两个手臂队列 \(Q_L, Q_R\),在每个时间步选择当前所有入度为零的节点集合 \(S_t\),按启发式规则将它们分配给空闲手臂。对于需要双臂协作的任务,同步分配给两臂。关键启发式包括:优先分配关键路径上的任务、平衡两臂的工作负载
    • 设计动机:DAG 生成阶段只保证任务语义正确,并行度优化需要专门的调度算法,这是 NP 难问题的近似求解
  3. X-DAPT 基准数据集:

    • 做什么:构建首个专注于双臂任务并行性的评估数据集
    • 核心思路:涵盖 10 个关键场景(厨房、办公室、农业温室、工厂等),每个场景分三个难度等级,共 1000+ 任务包。评估指标包括 TEI(时间效率指标)、TFR(任务失败率)、PPR(并行步数比例)和 APR(平均并行度)
    • 设计动机:现有基准不评估并行性,无法衡量双臂协作效率

损失函数 / 训练策略

无需训练——框架基于 LLM 的零样本/少样本推理和确定性调度算法。

实验关键数据

主实验

方法 TEI ↑ TFR ↓ PPR ↑ APR ↑ 场景
RoboPARA 0.953 0.033 0.543 0.283 厨房
Embodied TaPA 0.859 0.200 0.000 0.080 厨房
RoCo 0.836 0.067 0.008 0.041 厨房
ChatGPT-Prompts 0.817 0.081 0.000 0.010 厨房
LLM-Planner 0.858 0.200 0.000 0.077 厨房

消融实验

配置 PPR APR 说明
RoboPARA (完整) 0.543 0.283 完整框架
w/o 图纠错 ~0.35 ~0.18 DAG 生成可能含循环/冗余
w/o RAG 检索 ~0.40 ~0.20 任务分解质量下降

关键发现

  • RoboPARA 平均实现 4.5× 以上的并行和协作步数,执行时间减少 30-50%
  • 在最复杂任务组合中,RoboPARA 成功率比其他方法平均高 34%
  • 所有 baseline 方法的并行步数接近零(PPR ≈ 0),证实现有方法完全忽略并行性
  • 在真实人形机器人上的部署展示了接近人类活动模式的行为

亮点与洞察

  • 规划-调度解耦设计:让 LLM 专注于任务语义理解和依赖关系建模,将 NP 难的调度问题交给确定性算法,是合理的职责分工
  • 并行性作为评估维度:首次将并行度作为双臂机器人的核心评估指标,PPR/APR 指标可推广到多机器人协作场景

局限与展望

  • DAG 生成仍依赖 LLM 的推理能力,对复杂跨任务依赖可能出错
  • 调度算法使用启发式而非最优求解,可能遗漏最优并行方案
  • 假设每个原子操作的执行时间已知或可预估,实际中可能不成立
  • 未考虑执行过程中的动态重规划(如某步失败后的恢复策略)

相关工作与启发

  • vs RoCo: RoCo 让 agent 通过对话协商来分解和分配任务,但产生的计划仍以顺序执行为主;RoboPARA 显式优化并行度
  • vs FLTRNN: FLTRNN 使用 RNN 结构进行长期规划,关注任务分解和记忆管理,不关注双臂并行

评分

  • 新颖性: ⭐⭐⭐⭐ 首个系统性关注双臂并行度的 LLM 规划框架
  • 实验充分度: ⭐⭐⭐⭐ 丰富的 baseline 对比和多场景评测
  • 写作质量: ⭐⭐⭐⭐ 动机清晰、方法描述充分
  • 价值: ⭐⭐⭐⭐ 对多臂/多机器人任务调度有实际指导意义