Abstract not available.
在智能机器人系统中,连接具身智能与嵌入式部署仍是一项关键挑战,其中感知、推理与规划必须在严格的计算、内存、能量和实时执行约束下运行。在视觉语言导航(VLN)领域,现有方法通常面临着强大推理能力与现实平台高效部署之间的根本性权衡。本文提出了一种可部署的具身VLN系统,在真实机器人平台上同时实现了高效率和稳健的高层推理。为此,我们将系统解耦为三个异步模块:用于连续环境感知的实时感知模块、用于空间语义聚合的记忆整合模块以及用于高层决策的推理模块。我们逐步构建了一个认知记忆图来编码场景信息,并将其进一步分解为子图,以便通过视觉语言模型(VLM)进行推理。为了进一步提升导航效率和准确性,我们还利用认知记忆图将探索问题形式化为上下文感知加权旅行修理工问题(WTRP),以最小化视点的加权等待时间。在仿真和真实机器人平台上的大量实验表明,与现有VLN方法相比,本方法在保持资源受限硬件上实时性能的同时,提升了导航成功率和效率。