Abstract not available.
基于大语言模型/视觉语言模型的数字智能体通过可扩展的沙盒环境(如编程、网页导航和计算机操作)取得了快速进展,这些环境提供了丰富的交互式训练平台。相比之下,具身智能体仍然缺乏丰富、多样且可自动生成的3D环境来进行交互式学习。现有的具身模拟器依赖人工构建的场景或程序化模板,而近期基于大语言模型的3D生成系统主要产生静态场景,而非具备可验证任务和标准学习接口的可部署环境。我们提出SimWorld Studio,一个基于Unreal Engine 5构建的开源平台,用于生成演化的具身学习环境。其核心是SimCoder,一个增强工具和技能的编码智能体,能够编写并执行引擎级代码,从语言/图像指令构建物理可行的3D世界。SimCoder通过使用验证器反馈(如编译错误、物理检查、视觉语言模型批判)自我演化,修正环境并自主向代码库添加可复用的工具和技能。生成的世界被导出为Gym风格的环境,供具身智能体学习。SimWorld Studio进一步实现了环境生成与具身学习之间的协同演化:智能体性能反馈引导SimCoder在接近学习者能力边界处生成自适应课程,使得环境随着具身智能体能力的提升而逐渐增加挑战难度。三项具身导航案例研究表明,自我演化提升了生成可靠性,生成的环境显著提升了具身智能体的性能并泛化到未见基准,协同演化相比固定环境学习带来了18个百分点的成功率提升,相比未训练智能体提升了40个百分点。