Abstract not available.
基于大语言模型的具身导航代理在单一任务上表现出色,但在持续学习新导航技能时面临灾难性遗忘的挑战。我们将此问题形式化为终身具身导航学习(LENL),要求代理能够适应跨越多个场景和多样化用户指令风格的导航任务序列,同时保留先前习得的知识。为解决这一问题,我们提出了Uni-Walker,一个终身具身导航框架,通过解码器扩展低秩适应(DE-LoRA)将导航知识解耦为任务共享和任务特定组件。为学习共享知识,我们设计了知识继承策略和专家协同激活策略,以促进跨多个导航任务的共享知识迁移与精炼。为学习特定知识,我们提出了专家子空间正交性约束及导航专用思维链推理机制,以捕获特定知识并增强对指令风格的理解。大量实验证明了Uni-Walker在构建具有终身学习能力的通用导航代理方面的优越性。