ELITE: Experiential Learning and Intent-Aware Transfer for Self-improving Embodied Agents<br>精英:具备经验学习与意图感知迁移能力的自我提升型具身智能体框架<br>[摘要](abstracts/2603.24018.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

视觉语言模型(VLMs)已展现出卓越的通用能力,但基于其构建的具身智能体在执行复杂任务时仍常遭遇失败,表现为跳过关键步骤、提出无效动作及重复错误。这些失败源于VLMs静态训练数据与具身任务物理交互之间的根本性脱节:VLMs虽能从静态数据中学习丰富的语义知识,却缺乏与世界交互的能力。为解决这一问题,我们提出了ELITE框架,该框架通过经验学习与意图感知迁移机制,使智能体能够持续从自身环境交互经验中学习,并将习得的知识迁移至流程相似的任务中。ELITE通过两种协同机制运作:自反思知识构建与意图感知检索。具体而言,自反思知识构建从执行轨迹中提取可复用的策略,并通过结构化精炼操作维护一个动态演进的策略池;意图感知检索则从策略池中识别相关策略并应用于当前任务。在EB-ALFRED和EB-Habitat基准测试上的实验表明,在无监督在线场景下,ELITE相比基础VLMs分别实现了9%和5%的性能提升;在有监督场景下,ELITE能有效泛化至未见过的任务类别,其性能优于当前基于训练的最先进方法。这些结果证明了ELITE在弥合语义理解与可靠动作执行间鸿沟方面的有效性。

← Back