GSMem: 3D Gaussian Splatting as Persistent Spatial Memory for Zero-Shot Embodied Exploration and Reasoning<br>GSMem：将3D高斯泼溅作为持久空间记忆，用于零样本具身探索与推理<br>[摘要](abstracts/2603.19137.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

有效的具身探索要求智能体能够随时间积累并保持空间知识。然而，现有的场景表示方法（如离散场景图或基于静态视图的快照）缺乏“事后可重观察性”。如果初始观测遗漏了目标，由此产生的记忆缺失往往无法恢复。为弥补这一差距，我们提出了GSMem，一个基于3D高斯泼溅（3DGS）构建的零样本具身探索与推理框架。通过显式参数化连续几何与密集外观，3DGS作为一种持久空间记忆，赋予智能体“空间回忆”能力：即能够从先前未占据的最优视角渲染出逼真的新视图。为实现这一功能，GSMem采用了一种检索机制，该机制同时利用并行对象级场景图和语义级语言场。这种互补设计能够鲁棒地定位目标区域，使智能体能够“幻觉化”出最优视图，以支持高保真视觉语言模型（VLM）的推理。此外，我们引入了一种混合探索策略，结合了VLM驱动的语义评分与基于3DGS的覆盖目标，从而在任务感知探索与几何覆盖之间取得平衡。在具身问答与终身导航任务上的大量实验验证了我们框架的鲁棒性与有效性。

← Back