Preference Aligned Visuomotor Diffusion Policies for Deformable Object Manipulation<br>面向可变形物体操作的偏好对齐视觉运动扩散策略<br>[摘要](abstracts/2602.09583.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

人类自然地发展出对如何执行操作任务的偏好，这些偏好通常是微妙、个性化且难以明确表达的。尽管机器人需要考虑到这些偏好以提升个性化水平和用户满意度，但在机器人操作领域，尤其是在处理衣物和织物等可变形物体时，这一问题仍未得到充分探索。本研究探讨了如何利用有限的演示数据，调整预训练的视觉运动扩散策略以反映偏好行为。我们提出了RKO，一种新颖的偏好对齐方法，它结合了RPO和KTO两种近期框架的优势。我们在真实世界的布料折叠任务中，针对多种衣物和偏好设置，将RKO与常见的偏好学习框架（包括上述两种）以及基线标准扩散策略进行了比较评估。结果表明，偏好对齐策略（特别是RKO）相较于标准扩散策略微调方法，在性能和样本效率方面均表现出更优的表现。这些发现凸显了结构化偏好学习在扩展复杂可变形物体操作任务中个性化机器人行为方面的重要性和可行性。

← Back