Abstract not available.
世界模型能够在想象的未来预测空间中进行规划,为具身导航提供了一个有前景的框架。然而,现有的导航世界模型往往缺乏动作条件一致性,导致视觉上看似合理的预测在多步推演中仍可能发生漂移,从而影响规划效果。此外,高效部署需要少步扩散推理,但现有的蒸馏方法未能明确保持推演一致性,造成了训练与推理之间的不匹配。为解决这些挑战,我们提出了MWM,一种用于基于规划的图像目标导航的移动世界模型。具体而言,我们引入了一个两阶段训练框架,结合了结构预训练与动作条件一致性后训练,以提升动作条件下的推演一致性。我们进一步提出了推理一致状态蒸馏方法,用于实现具有更好推演一致性的少步扩散蒸馏。在基准测试和真实世界任务上的实验表明,我们的方法在视觉保真度、轨迹准确性、规划成功率及推理效率方面均取得了持续提升。代码:https://github.com/AIGeeksGroup/MWM。项目网站:https://aigeeksgroup.github.io/MWM。