Robotic Manipulation is Vision-to-Geometry Mapping ($f(v) \rightarrow G$): Vision-Geometry Backbones over Language and Video Models<br>机器人操作即视觉到几何的映射（f(v) → G）：超越语言与视频模型的视觉-几何骨干网络<br>[摘要](abstracts/2604.12908.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

未生成（可稍后重试翻译）