Abstract not available.
基于扩散模型和流匹配的生成策略通过对多模态人类示教进行建模,在机器人操作任务中展现出卓越性能。然而,这些方法依赖迭代的常微分方程积分求解,导致显著的计算延迟,限制了高频闭环控制的应用。近期提出的单步加速方法虽能缓解计算开销,但常出现分布坍缩现象,生成趋于平均化的轨迹,难以执行连贯的操作策略。本研究提出一种通过隐式最大似然估计将条件流匹配专家模型蒸馏为快速单步学生模型的框架。双向Chamfer距离提供了集合级别的优化目标,兼顾模态覆盖度与保真度,从而在单次前向传播中保持教师模型的多模态动作分布特性。统一的感知编码器进一步整合多视角RGB图像、深度信息、点云数据及本体感知,形成几何感知的融合表征。最终实现的高频控制支持实时滚动时域重规划,并在动态干扰下表现出更强的鲁棒性。