Abstract not available.
在复杂环境中,具身导航的失败是不可避免的。为增强鲁棒性,重规划(RP)是一种可行的选择,即允许机器人失败,但能够调整计划直至成功。然而,现有的重规划方法冻结了自身动作模型,错失了通过升级机器人自身来探索更优计划的机会。为解决这一局限,我们提出了自进化重规划(简称SERP),它通过从近期经验中实时学习,引领了从冻结模型向进化模型的范式转变。与常受限于预定义静态参数的现有模型进化方法不同,我们引入了自主自进化动作模型,该模型利用上下文学习与自动微分(ILAD)实现自适应函数调整和全局参数重置。为实现SERP的令牌高效重规划,我们还提出了图链式思维(GCOT)重规划方法,基于蒸馏图进行大语言模型(LLM)推理。广泛的仿真和真实世界实验表明,SERP在各种基准测试中以更低的令牌消耗实现了更高的成功率,验证了其在多样化环境中的卓越鲁棒性和效率。