Benchmarking Interaction, Beyond Policy: a Reproducible Benchmark for Collaborative Instance Object Navigation<br>超越策略的交互基准测试：一个可复现的协作实例物体导航基准<br>[摘要](abstracts/2604.00265.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

我们提出了问答式导航（QAsk-Nav），这是首个可复现的协作实例物体导航（CoIN）基准，能够对具身导航和协作式提问进行明确、独立的评估。CoIN任务要求具身代理在部分可观测条件下，仅使用以自我为中心的视觉观察和与人类的交互式自然语言对话，到达以自由形式自然语言指定的目标物体，其中对话有助于解决视觉上相似物体实例之间的歧义。现有的CoIN基准主要关注导航成功率，缺乏对协作交互的一致评估支持。为弥补这一不足，QAsk-Nav提供了（i）一个独立于导航评分的轻量级提问协议，（ii）一个包含真实、多样、高质量目标描述的增强导航协议，以及（iii）一个开源数据集，其中包含28,000条经过质量检查的推理和提问轨迹，用于训练和分析CoIN模型的交互能力。利用所提出的QAsk-Nav基准，我们开发了Light-CoNav，这是一个用于协作导航的轻量级统一模型，其规模比现有模块化方法小3倍、速度快70倍，同时在泛化到未见过的物体和环境方面优于最先进的CoIN方法。项目页面：https://benchmarking-interaction.github.io/

← Back