Abstract not available.
扩散模型与流匹配已成为机器人模仿学习的基石,但其存在结构性低效问题:推理过程通常受限于固定的积分调度,而该调度对状态复杂性不敏感。这种范式迫使策略在简单动作与复杂任务上消耗相同的计算资源。我们提出了生成式控制即优化(GeCO),一种无时间条件的框架,将动作合成从轨迹积分转化为迭代优化。GeCO在动作序列空间中学习一个静态速度场,其中专家行为形成稳定吸引子。因此,测试时的推理成为一个自适应过程,根据收敛情况分配计算资源——对简单状态提前退出,而对困难状态则进行更长时间的优化。此外,这种静态几何结构产生了一种内在的、无需训练的安全信号:优化后动作处的场范数可作为鲁棒的分布外(OOD)检测器,在分布内状态下保持较低值,而在异常状态下显著升高。我们在标准仿真基准上验证了GeCO,并展示了其可无缝扩展至pi0系列视觉-语言-动作(VLA)模型。作为标准流匹配头的即插即用替代方案,GeCO通过优化原生机制提升了成功率与效率,并支持安全部署。视频与代码详见:https://hrh6666.github.io/GeCO/