Abstract not available.
通用机器人操作的发展受到多样化真实世界交互数据稀缺的阻碍。与视觉或语言领域可从网络收集数据不同,机器人数据收集是一个主动过程,涉及高昂的物理成本。因此,自动化任务生成以最大化数据价值,成为一个关键但尚未充分探索的挑战。现有手动方法难以扩展且偏向常见任务,而现成的基础模型常产生物理上不可行的指令幻觉。为解决这一问题,我们提出了RoboGene,一个旨在为单臂、双臂及移动机器人自动生成多样化、物理可行的操作任务的智能体框架。RoboGene整合了三个核心组件:用于广泛任务覆盖的多样性驱动采样、强制执行物理约束的自我反思机制,以及持续改进的人机协同优化。我们进行了广泛的定量分析和大规模真实世界实验,收集了包含1.8万条轨迹的数据集,并引入了新指标以评估任务质量、可行性和多样性。结果表明,RoboGene显著优于最先进的基础模型(如GPT-4o、Gemini 2.5 Pro)。此外,真实世界实验显示,使用RoboGene预训练的视觉语言动作模型实现了更高的成功率和更优的泛化能力,凸显了高质量任务生成的重要性。项目网址:https://robogene-boost-vla.github.io。