Benchmarking Interaction, Beyond Policy: a Reproducible Benchmark for Collaborative Instance Object Navigation<br>超越策略的交互基准测试:一个可复现的协作实例物体导航基准<br>[摘要](abstracts/2604.00265.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

我们提出了问答式导航(QAsk-Nav),这是首个可复现的协作实例物体导航(CoIN)基准,能够对具身导航和协作式提问进行明确、独立的评估。CoIN任务要求具身代理在部分可观测条件下,仅使用以自我为中心的视觉观察和与人类的交互式自然语言对话,到达以自由形式自然语言指定的目标物体,其中对话有助于解决视觉上相似物体实例之间的歧义。现有的CoIN基准主要关注导航成功率,缺乏对协作交互的一致评估支持。为弥补这一不足,QAsk-Nav提供了(i)一个独立于导航评分的轻量级提问协议,(ii)一个包含真实、多样、高质量目标描述的增强导航协议,以及(iii)一个开源数据集,其中包含28,000条经过质量检查的推理和提问轨迹,用于训练和分析CoIN模型的交互能力。利用所提出的QAsk-Nav基准,我们开发了Light-CoNav,这是一个用于协作导航的轻量级统一模型,其规模比现有模块化方法小3倍、速度快70倍,同时在泛化到未见过的物体和环境方面优于最先进的CoIN方法。项目页面:https://benchmarking-interaction.github.io/

← Back