Abstract not available.
开放世界导航要求机器人在复杂的日常环境中做出决策,同时适应灵活的任务需求。传统导航方法通常依赖于密集的三维重建和人工设计的目标度量,这限制了其在任务和环境间的泛化能力。近期,视觉-语言导航(VLN)和视觉-语言-动作(VLA)模型的进展使得基于自然语言的端到端策略成为可能,但这些方法通常需要交互式训练、大规模数据收集或通过移动代理进行任务特定的微调。我们将导航形式化为稀疏子目标识别与到达问题,并观察到为高层语义先验提供视觉锚定目标能够实现高效的目标条件导航。基于这一洞见,我们选择导航前沿作为语义锚点,并提出OpenFrontier——一个无需训练即可无缝集成多样化视觉-语言先验模型的导航框架。OpenFrontier通过轻量级系统设计实现高效导航,无需密集三维建图、策略训练或模型微调。我们在多个导航基准上评估OpenFrontier,展示了其强大的零样本性能,以及在移动机器人上的有效现实世界部署。