Where Did It Go Wrong? Capability-Oriented Failure Attribution for Vision-and-Language Navigation Agents<br>问题出在哪里?面向视觉与语言导航智能体的能力导向失败归因<br>[摘要](abstracts/2604.25161.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

在视觉-语言导航(VLN)等安全关键型应用中的具身智能体依赖于多种相互关联的能力(如感知、记忆、规划、决策),这使得失败难以定位和归因。现有的测试方法大多停留在系统层面,对哪些能力缺陷导致任务失败提供的洞察有限。我们提出了一种能力导向的测试方法,通过结合(1)基于种子选择和变异的自适应测试用例生成,(2)用于识别特定能力错误的能力预言,以及(3)将失败归因于能力并指导进一步测试生成的反馈机制,实现失败检测和归因。实验表明,与最先进的基线方法相比,我们的方法能发现更多失败案例,并更准确地定位能力层面的缺陷,为改进具身智能体提供更可解释且可操作的指导。

← Back