NavTrust: Benchmarking Trustworthiness for Embodied Navigation<br>NavTrust：面向具身导航的信任度基准测试<br>[摘要](abstracts/2603.19229.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

具身导航主要分为两大类：视觉语言导航（VLN），即智能体通过遵循自然语言指令进行导航；以及目标物体导航（OGN），即智能体导航至指定目标物体。然而，现有研究主要评估模型在理想条件下的性能，忽视了现实场景中可能出现的各种干扰因素。为填补这一空白，我们提出了NavTrust，这是一个统一的基准测试框架，能够在真实场景中系统性地对输入模态（包括RGB图像、深度信息和指令）进行干扰处理，并评估其对导航性能的影响。据我们所知，NavTrust是首个在统一框架内将具身导航智能体暴露于多样化的RGB-深度干扰和指令变体下的基准测试。通过对七种最先进方法的广泛评估，我们发现这些方法在现实干扰下性能显著下降，这揭示了其关键的鲁棒性缺陷，并为构建更可信赖的具身导航系统提供了路线图。此外，我们系统评估了四种不同的增强策略，以提升对RGB-深度干扰和指令干扰的鲁棒性。我们的基础模型包括Uni-NaVid和ETPNav。我们将这些模型部署于真实移动机器人上，并观察到其对干扰的鲁棒性有所提升。项目网站为：https://navtrust.github.io。

← Back