NavTrust: Benchmarking Trustworthiness for Embodied Navigation<br>NavTrust:面向具身导航的信任度基准测试<br>[摘要](abstracts/2603.19229.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

具身导航主要分为两大类:视觉语言导航(VLN),即智能体通过遵循自然语言指令进行导航;以及目标物体导航(OGN),即智能体导航至指定目标物体。然而,现有研究主要评估模型在理想条件下的性能,忽视了现实场景中可能出现的各种干扰因素。为填补这一空白,我们提出了NavTrust,这是一个统一的基准测试框架,能够在真实场景中系统性地对输入模态(包括RGB图像、深度信息和指令)进行干扰处理,并评估其对导航性能的影响。据我们所知,NavTrust是首个在统一框架内将具身导航智能体暴露于多样化的RGB-深度干扰和指令变体下的基准测试。通过对七种最先进方法的广泛评估,我们发现这些方法在现实干扰下性能显著下降,这揭示了其关键的鲁棒性缺陷,并为构建更可信赖的具身导航系统提供了路线图。此外,我们系统评估了四种不同的增强策略,以提升对RGB-深度干扰和指令干扰的鲁棒性。我们的基础模型包括Uni-NaVid和ETPNav。我们将这些模型部署于真实移动机器人上,并观察到其对干扰的鲁棒性有所提升。项目网站为:https://navtrust.github.io。

← Back