PAWS: Perception of Articulation in the Wild at Scale from Egocentric Videos<br>PAWS：基于大规模第一人称视角视频的野外关节感知<br>[摘要](abstracts/2603.25539.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

关节感知旨在恢复可动物体（如抽屉和橱柜）的运动与结构，是机器人、仿真与动画领域三维场景理解的基础。现有基于学习的方法严重依赖高质量三维数据与人工标注的监督训练，限制了其可扩展性与多样性。为克服这一局限，我们提出PAWS方法，直接从大规模野外第一人称视角视频中的手-物交互中提取物体关节信息。我们在包括HD-EPIC和Arti4D在内的公开数据集上评估了该方法，相比基线模型取得了显著提升。进一步研究表明，提取的关节信息有助于下游任务，包括微调三维关节预测模型及实现机器人操作。项目网站详见：https://aaltoml.github.io/PAWS/。

← Back