Abstract not available.
现有的基于学习的占据预测方法依赖大规模3D标注,且在不同环境间泛化能力差。我们提出FreeOcc,一种无需训练的框架,用于从单目或RGB-D序列进行开放词汇占据预测。与需要体素级监督和真实相机位姿的先前方法不同,FreeOcc无需3D标注、真实位姿或任何学习阶段。FreeOcc通过四层流水线逐步构建全局一致的占据图:SLAM主干估计位姿和稀疏几何;几何一致的高斯更新构建密集3D高斯地图;来自现成视觉语言模型的开放词汇语义与高斯基元关联;概率性高斯到占据投影生成密集体素占据。尽管完全无需训练且与位姿无关,FreeOcc在EmbodiedOcc-ScanNet上的IoU和mIoU相较于先前的自监督方法实现了超过2倍的提升。我们进一步引入ReplicaOcc,一个室内开放词汇占据预测基准,并展示FreeOcc零样本迁移到新环境,显著优于监督和自监督基线。项目页面:https://the-masses.github.io/freeocc-web/。