Abstract not available.
物理属性估计对于安全高效的自主机器人操作至关重要,尤其是在接触密集的交互场景中。在此类情境下,视觉与触觉感知能够提供关于物体几何形状、位姿、惯性、刚度及接触动力学(如粘滑行为)的互补信息。然而,这些属性仅能间接观测,且无法始终精确建模(例如非刚性物体的形变与非线性接触摩擦的耦合),使得估计问题本质复杂,需要在动作执行过程中持续利用视觉-触觉感官信息。现有的视觉-触觉感知框架主要侧重于强力传感器融合或静态跨模态对齐,较少考虑物体属性相关的不确定性及信念如何随时间演变。受人类多感官感知与主动推理的启发,我们提出跨模态潜在滤波器,以学习物理物体属性的结构化因果潜在状态空间。该模型支持视觉与触觉间跨模态先验的双向传递,并通过随时间演化的贝叶斯推理过程整合感官证据。真实机器人实验表明,相较于基线方法,跨模态潜在滤波器在不确定性条件下提升了潜在物理属性估计的效率与鲁棒性。除性能提升外,该模型展现出与人类观察到的感知耦合现象类似的特征,包括对跨模态错觉的敏感性以及跨感官关联学习的相似轨迹。这些成果共同为机器人多感官感知实现可泛化、鲁棒且物理一致的跨模态集成迈出了重要一步。