ELITE: Experiential Learning and Intent-Aware Transfer for Self-improving Embodied Agents<br>精英：具备经验学习与意图感知迁移能力的自我提升型具身智能体框架<br>[摘要](abstracts/2603.24018.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

视觉语言模型（VLMs）已展现出卓越的通用能力，但基于其构建的具身智能体在执行复杂任务时仍常遭遇失败，表现为跳过关键步骤、提出无效动作及重复错误。这些失败源于VLMs静态训练数据与具身任务物理交互之间的根本性脱节：VLMs虽能从静态数据中学习丰富的语义知识，却缺乏与世界交互的能力。为解决这一问题，我们提出了ELITE框架，该框架通过经验学习与意图感知迁移机制，使智能体能够持续从自身环境交互经验中学习，并将习得的知识迁移至流程相似的任务中。ELITE通过两种协同机制运作：自反思知识构建与意图感知检索。具体而言，自反思知识构建从执行轨迹中提取可复用的策略，并通过结构化精炼操作维护一个动态演进的策略池；意图感知检索则从策略池中识别相关策略并应用于当前任务。在EB-ALFRED和EB-Habitat基准测试上的实验表明，在无监督在线场景下，ELITE相比基础VLMs分别实现了9%和5%的性能提升；在有监督场景下，ELITE能有效泛化至未见过的任务类别，其性能优于当前基于训练的最先进方法。这些结果证明了ELITE在弥合语义理解与可靠动作执行间鸿沟方面的有效性。

← Back