LangMap: A Hierarchical Benchmark for Open-Vocabulary Goal Navigation<br>LangMap：面向开放词汇目标导航的分层基准<br>[摘要](abstracts/2602.02220.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

物体与语言之间的关系对于人类与人工智能之间的有意义交流以及实际有用的具身智能至关重要。我们引入了HieraNav，一个多粒度、开放词汇的目标导航任务，其中智能体通过解析自然语言指令，在四个语义层级上到达目标：场景、房间、区域和实例。为此，我们提出了Language as a Map（LangMap），这是一个基于真实世界3D室内扫描的大规模基准，包含全面的人工验证标注和覆盖这些层级的任务。LangMap提供区域标签、区分性区域描述、涵盖414个对象类别的区分性实例描述，以及超过18K个导航任务。每个目标都配有简洁和详细的描述，支持不同指令风格的评估。LangMap实现了卓越的标注质量，在区分性准确率上比GOAT-Bench高出23.8%，同时使用的词汇量减少了四倍。在LangMap上对零样本和监督模型的综合评估表明，更丰富的上下文和记忆能提高成功率，而长尾、小型、上下文依赖和远距离目标，以及多目标完成，仍然是挑战。HieraNav和LangMap为推进语言驱动的具身导航建立了一个严谨的测试平台。项目地址：https://bo-miao.github.io/LangMap

← Back