Knowledge-Guided Manipulation Using Multi-Task Reinforcement Learning<br>基于知识引导的多任务强化学习操作<br>[摘要](abstracts/2603.24083.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

本文介绍了基于知识图谱的大规模多任务模型策略优化框架（KG-M3PO），该框架在部分可观测环境下统一了感知、知识与策略，用于多任务机器人操作。该方法通过在线三维场景图增强以自我为中心的视觉感知，将开放词汇检测结果映射到度量化的关系表示中。动态关系机制在每一步更新空间、包含和可供性边，并通过强化学习目标端到端训练图神经编码器，使得关系特征直接受控制性能塑造。多种观测模态（视觉、本体感觉、语言和基于图的）被编码到共享潜在空间中，强化学习智能体在此空间上操作以驱动控制循环。策略在视觉和本体感觉输入之外，还基于轻量级图查询进行条件化，从而生成紧凑且语义丰富的决策状态。在包含遮挡、干扰物和布局变化的操作任务套件上的实验表明，该方法相较于强基线模型取得了持续提升：基于知识条件化的智能体实现了更高的成功率、改进的样本效率，以及对新物体和未见场景配置更强的泛化能力。这些结果支持了以下前提：结构化且持续维护的世界知识是推动可扩展、可泛化操作的强大归纳偏置——当知识模块参与强化学习计算图时，关系表示与控制目标对齐，从而在部分可观测条件下实现鲁棒的长期行为。

← Back