Abstract not available.
在真实机器人中部署视觉-语言-动作(VLA)模型面临一个核心的多任务学习挑战:协调多任务机器人学习中的任务干扰。当多个任务在单一阶段联合微调时,不同任务的梯度可能相互冲突,导致负迁移并降低每个任务的性能。然而,为每个任务维护一个完整的独立检查点通常因存储和部署成本过高而不可行。为解决这一困境,我们提出了CORAL,一个与主干网络和机器人具体形态无关的框架,其主要设计目标是减轻多任务干扰,同时天然支持对新任务的持续扩展。CORAL冻结一个预训练的VLA主干网络,并为每个任务附加一个轻量级的低秩适应(LoRA)专家;在运行时,动态推理引擎(CORAL管理器)将语言指令路由至相应的专家,并在零推理开销下实时切换专家。这种严格的参数隔离避免了复杂的门控网络,并通过结构设计防止了参数层面的跨任务干扰;作为附加能力,它还支持按顺序引入新任务,而不会因灾难性遗忘导致参数覆盖。我们在真实世界的Galaxea R1双臂移动机械臂和三个仿真基准(LIBERO、WidowX、Google Robot)上验证了CORAL,结果表明CORAL能够克服细粒度指令歧义,显著优于联合训练方法,为终身多任务机器人学习提供了一个实用且可扩展的系统。项目网站:https://frontierrobo.github.io/CORAL