Does Peer Observation Help? Vision-Sharing Collaboration for Vision-Language Navigation<br>同伴观察是否有效？视觉语言导航中的视觉共享协作研究<br>[摘要](abstracts/2603.20804.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

视觉语言导航（VLN）系统本质上受限于部分可观测性，因为智能体仅能从其亲自访问过的位置积累知识。随着多个机器人在共享环境中日益共存，一个自然的问题随之产生：在同一空间导航的智能体能否从彼此的观察中获益？本研究提出Co-VLN，一个极简且模型无关的框架，用于系统探究并发导航智能体间的同伴观察是否以及如何提升VLN性能。当独立导航的智能体识别出共同经过的位置时，它们会交换结构化的感知记忆，从而在不增加探索成本的前提下有效扩展每个智能体的感知范围。我们在R2R基准测试中，基于两种代表性范式（基于学习的DUET和零样本MapGPT）验证了该框架，并通过大量分析实验系统揭示了同伴观察共享在VLN中的内在机制。结果表明，启用视觉共享的模型在两种范式中均实现了显著的性能提升，为未来协作式具身导航研究奠定了坚实基础。

← Back