Abstract not available.
在分层工作空间中,由于遮挡、狭窄间隙和高度相关约束远强于开放桌面场景,实现高自由度灵巧手的泛化抓取仍具挑战。现有方法大多在相对无遮挡环境中评估,且通常未显式建模空间约束下手臂导航与手部关节控制的差异化需求。本文提出SpaceDex,一种面向受限三维环境的层次化灵巧操作框架:高层级采用视觉语言模型规划器解析用户意图,通过多视角相机推理遮挡与高度关系,生成用于零样本分割与掩码跟踪的目标边界框,为下游控制提供结构化空间引导,而非依赖单视角目标选择;低层级设计手臂-手部特征分离网络,将手臂的全局轨迹控制与手部的几何感知抓取模式选择解耦,减少抵达目标与抓取动作间的特征干扰。控制器进一步融合多视角感知、指尖触觉传感及少量恢复演示数据,以提升对部分可观测性与异常接触的鲁棒性。在包含四大类别30余个未见物体的100次真实世界实验中,SpaceDex取得63.0%的成功率,显著优于桌面基线方法的39.0%。结果表明:结合层次化空间规划与手臂-手部表征解耦的策略,能有效提升空间受限环境下的灵巧抓取性能。