Abstract not available.
零样本目标导航(ZSON)要求智能体在未知环境中导航以寻找目标物体,而无需进行任务特定训练。先前基于分层结构的免训练解决方案侧重于场景理解(信念)与高层决策(策略),但忽视了选项的设计——即从动态演化的信念中提出、并交由策略选择的子目标候选。实践中,选项常被简化为独立评分的孤立路径点:单一目的地掩盖了沿途收集的价值;非结构化的候选集合模糊了候选者之间的关系。我们的核心见解是:选项空间应构建为路径树。完整路径能揭示仅基于目的地评分所系统性忽略的途中信息增益;共享段构成的树支持由粗到精的大语言模型推理,使得在检查单个叶节点前即可排除或追踪整条分支,从而将组合路径空间压缩为高效层次结构。我们基于这一见解实现了REST(滚动时域探索斯坦纳树),这是一个免训练框架,其(1)通过在线RGB-D流构建显式的开放词汇3D地图;(2)通过基于采样的规划,以智能体为中心生长出安全且信息丰富的路径树作为选项空间;(3)将每条分支文本化为空间叙事,并通过思维链式的大语言模型推理选择最优路径。在Gibson、HM3D和HSSD基准测试中,REST在成功率方面持续位居前列,同时达到最佳或次优的路径效率,展现了优越的效率与成功率平衡。