LCGNav: Local Candidate-Aware Geometric Enhancement for General Topological Planning in Vision-Language Navigation<br>LCGNav:面向视觉语言导航中通用拓扑规划的局部候选感知几何增强方法<br>[摘要](abstracts/2605.09053.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

在线拓扑规划已成为连续环境视觉语言导航(VLN-CE)的有效范式,但现有方法仍存在两个局限:冗余的局部深度信息,以及随着拓扑图增长而对当前前沿候选关注度的削弱。为此,我们提出LCGNav,一种面向拓扑VLN的模块化局部几何增强框架。LCGNav将候选深度视图显式转换为三维点云,并基于智能体的可到达范围进行物理截断,从而实现更紧凑的局部几何建模。它进一步引入带有瞬态状态退化的维度保持局部融合策略,使得几何增强仅应用于当前相关的幽灵节点,而不改变原始规划器接口。在R2R-CE和RxR-CE上的实验表明,LCGNav作为一种有效的跨架构增强模块,能够以较低额外训练成本持续提升多个代表性在线拓扑基线的关键指标。当与ETP-R1集成时,LCGNav在R2R-CE和RxR-CE基准的val-unseen分割上达到了所比较在线拓扑方法中的最佳性能。代码开源于https://github.com/shannanshouyin/LCGNav。

← Back