PathPainter: Transferring the Generalization Ability of Image Generation Models to Embodied Navigation<br>PathPainter:将图像生成模型的泛化能力迁移至具身导航<br>[摘要](abstracts/2605.07496.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

鸟瞰图已被广泛证明可为导航提供有价值的先验信息。尽管这类视图提供了全局信息,但仍存在两个关键挑战:如何充分利用这些信息,以及如何在执行过程中可靠地使用它们。本文提出了一种以鸟瞰图作为全局先验的导航系统,专为地面及近地面机器人平台设计。该系统采用图像生成模型从自然语言中解读人类意图、识别目标位置,并生成可通行性掩膜。在执行过程中,我们引入跨视角定位技术,将机器人的里程计与鸟瞰图对齐,并缓解传统里程计中的长期漂移问题。我们通过广泛的基准实验评估了所提方法,并在无人机平台上进一步验证。仅使用传统局部运动规划器,无人机便成功完成了160米的户外远程导航任务。本工作展示了如何将基础模型的世界理解能力迁移至具身导航,使机器人能够受益于现有图像生成模型的强大泛化能力。

← Back