FreeOcc: Training-Free Embodied Open-Vocabulary Occupancy Prediction<br>FreeOcc：无需训练的具体化开放词汇占据预测<br>[摘要](abstracts/2604.28115.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

现有的基于学习的占据预测方法依赖大规模3D标注，且在不同环境间泛化能力差。我们提出FreeOcc，一种无需训练的框架，用于从单目或RGB-D序列进行开放词汇占据预测。与需要体素级监督和真实相机位姿的先前方法不同，FreeOcc无需3D标注、真实位姿或任何学习阶段。FreeOcc通过四层流水线逐步构建全局一致的占据图：SLAM主干估计位姿和稀疏几何；几何一致的高斯更新构建密集3D高斯地图；来自现成视觉语言模型的开放词汇语义与高斯基元关联；概率性高斯到占据投影生成密集体素占据。尽管完全无需训练且与位姿无关，FreeOcc在EmbodiedOcc-ScanNet上的IoU和mIoU相较于先前的自监督方法实现了超过2倍的提升。我们进一步引入ReplicaOcc，一个室内开放词汇占据预测基准，并展示FreeOcc零样本迁移到新环境，显著优于监督和自监督基线。项目页面：https://the-masses.github.io/freeocc-web/。

← Back