Abstract not available.
我们推出AnyUser,一个统一的机器人指令系统,通过相机图像上的自由草图(可选结合语言)实现直观的家用任务指令。AnyUser将多模态输入(草图、视觉、语言)解释为空间语义基元,以生成无需先验地图或模型的可执行机器人动作。其创新组件包括用于理解的多模态融合和用于鲁棒动作生成的分层策略。通过广泛评估验证了其有效性:(1)在大规模数据集上的定量基准测试显示,该系统在多种模拟家庭场景中能高精度解读多样化的草图指令。(2)在两个不同机器人平台上的真实世界验证:静态安装的7自由度辅助臂(KUKA LBR iiwa)和双臂移动操作器(Realman RMC-AIDAL),执行了如定向擦拭和区域清洁等代表性任务,证实了系统能可靠地落实指令并在物理环境中执行。(3)一项涵盖多样化人群(老年人、模拟非语言用户、低技术素养者)的综合用户研究表明,系统显著提升了可用性和任务指定效率,实现了高任务完成率(85.7%-96.4%)和用户满意度。AnyUser弥合了先进机器人能力与可访问的非专家交互需求之间的差距,为适应真实世界人类环境的实用辅助机器人奠定了基础。