PhyCo: Learning Controllable Physical Priors for Generative Motion<br>PhyCo:学习可控物理先验以生成运动<br>[摘要](abstracts/2604.28169.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

现代视频扩散模型在外观合成方面表现出色,但仍难以保证物理一致性:物体漂移、碰撞缺乏真实反弹,材料响应通常与其固有属性不匹配。我们提出PhyCo框架,将连续、可解释且基于物理的控制引入视频生成。该方法整合三个关键组件:(i) 超过10万张逼真模拟视频的大规模数据集,其中摩擦、恢复系数、形变和力在不同场景中系统变化;(ii) 利用基于像素对齐物理属性图的ControlNet,对预训练扩散模型进行物理监督微调;(iii) 基于视觉语言模型的奖励优化,即通过微调的视觉语言模型结合定向物理查询评估生成视频,并提供可微分反馈。这种组合使生成模型能够通过物理属性的变化生成物理一致且可控的输出——在推理时无需任何模拟器或几何重建。在Physics-IQ基准上,PhyCo显著提升了强基线模型的物理真实感,人工研究进一步证实对物理属性的控制更清晰、更忠实。我们的结果表明,这是一条通往物理一致、可控生成视频模型的可扩展路径,且能泛化到合成训练环境之外。

← Back