Abstract not available.
在人形机器人控制领域,将视觉-语言-动作(VLA)与全身控制相融合,对于实现语义引导的现实世界任务执行至关重要。然而,现有方法在VLA推理效率低下或缺乏有效的全身控制语义引导方面面临挑战,导致动态肢体协调任务中的不稳定性。为弥补这一差距,我们提出了一种语义-运动意图引导、物理感知的多脑VLA框架,用于人形机器人全身控制。通过一系列实验评估了所提框架的性能,结果表明该框架能够为人形机器人实现可靠的视觉-语言引导全身协调。
← Back