Abstract not available.
鲁棒的具身导航依赖于互补的感知线索。然而,高质量且良好对齐的多模态数据在实践中往往难以获取。训练单一模型同样具有挑战性,因为丰富的多模态输入会引发复杂的表示并显著扩大策略空间。轻量级模态专用智能体之间的跨模态协作提供了一种可扩展的范式。它支持灵活部署和并行执行,同时保持每种模态的优势。在本文中,我们提出了 extbf{CRONA},一种用于 extbf{跨模态导航}的多智能体强化学习(MARL)框架。CRONA通过利用与控制相关的辅助信念和具有全局状态的集中式多模态评论家来改进协作。在视觉-声学导航任务上的实验表明,多智能体方法在性能和效率上显著优于单智能体基线。我们发现,在显著线索下的短距离导航中,具有有限模态的同质协作已足够;具有互补模态的智能体之间的异质协作通常高效且有效;而在大型复杂环境中的导航则需要更丰富的多模态感知和更大的模型容量。