DSSP: Diffusion State Space Policy with Full-History Encoding<br>DSSP:具备全历史编码的扩散状态空间策略<br>[摘要](abstracts/2605.14598.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

基于扩散的模仿学习在机器人操作中展现出巨大潜力。然而,现有策略大多仅依赖当前观测或短时间窗口的近期观测,限制了其在长期任务中解决历史依赖歧义的能力。为此,我们提出DSSP——一种历史条件化的扩散状态空间策略,能够高效实现机器人操作的完整历史条件化。通过利用状态空间模型的连续序列建模特性,我们的历史编码器将整个观测流有效压缩为紧凑的上下文表征。为确保该上下文保留关于未来状态演化的关键信息,编码器通过动力学感知的辅助训练目标进行优化。这种高层上下文表征与近期状态观测无缝融合,形成用于动作生成的层次化条件化机制。此外,为保持架构一致性并降低GPU内存开销,我们同样采用状态空间模型实例化扩散主干网络。在仿真基准和真实世界操作任务上的大量实验表明,DSSP在显著减小模型规模的同时达到最先进性能,充分证明了层次化条件化机制在历史长度增加时捕获关键信息的卓越效率。

← Back