Abstract not available.
具身人工智能系统(如自动驾驶汽车、服务机器人和基于大语言模型的交互式智能体)正迅速从受控环境转向安全关键的实际部署。与非具身人工智能不同,具身智能的失败会导致不可逆转的物理后果,从而引发关于安全性、可靠性和稳健性的根本性问题。尽管现有研究主要从大语言模型漏洞或经典信息物理系统故障的角度分析具身人工智能,但本综述认为,这些视角单独来看均不足以解释现代具身系统中观察到的许多故障。我们提出,一类重要的故障源于具身化引发的系统级不匹配,而非孤立的模型缺陷或传统的信息物理系统攻击。具体而言,我们识别了四个核心见解,用以解释为何具身人工智能本质上更难保障安全:(i)语义正确性并不意味着物理安全,因为语言层面的推理抽象了几何、动力学和接触约束;(ii)由于非线性动力学和状态不确定性,相同的行动在不同物理状态下可能导致截然不同的结果;(iii)微小误差在紧密耦合的感知-决策-行动循环中传播并放大;(iv)安全性在时间或系统层级上不具备组合性,使得局部安全的决策可能累积为全局不安全的行为。这些见解表明,保障具身人工智能安全需要超越组件级防御,转向对物理风险、不确定性和故障传播的系统级推理。