Abstract not available.
视觉语言导航(VLN)系统本质上受限于部分可观测性,因为智能体仅能从其亲自访问过的位置积累知识。随着多个机器人在共享环境中日益共存,一个自然的问题随之产生:在同一空间导航的智能体能否从彼此的观察中获益?本研究提出Co-VLN,一个极简且模型无关的框架,用于系统探究并发导航智能体间的同伴观察是否以及如何提升VLN性能。当独立导航的智能体识别出共同经过的位置时,它们会交换结构化的感知记忆,从而在不增加探索成本的前提下有效扩展每个智能体的感知范围。我们在R2R基准测试中,基于两种代表性范式(基于学习的DUET和零样本MapGPT)验证了该框架,并通过大量分析实验系统揭示了同伴观察共享在VLN中的内在机制。结果表明,启用视觉共享的模型在两种范式中均实现了显著的性能提升,为未来协作式具身导航研究奠定了坚实基础。