From Prompt to Physical Action: Structured Backdoor Attacks on LLM-Mediated Robotic Control Systems<br>从提示到物理动作：针对LLM介导机器人控制系统的结构化后门攻击<br>[摘要](abstracts/2604.03890.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

将大型语言模型（LLMs）集成到机器人控制流程中，实现了自然语言接口，可将用户提示转换为可执行命令。然而，这种数字到物理的接口引入了一个关键且尚未充分探索的漏洞：在微调过程中嵌入的结构化后门攻击。本研究通过实验探究了基于LoRA的供应链后门在LLM介导的ROS2机器人控制系统中的应用，并评估了其对物理机器人执行的影响。我们构建了两种针对命令生成流程不同阶段的中毒微调策略，并揭示了一个关键的系统级洞见：嵌入在自然语言推理阶段的后门无法可靠地传播至可执行控制输出，而与结构化JSON命令格式直接对齐的后门则能成功存活于翻译过程并触发物理动作。在仿真和真实世界实验中，后门模型实现了平均83%的攻击成功率，同时保持超过93%的清洁性能准确率和亚秒级延迟，证明了其可靠性和隐蔽性。我们进一步实施了一种基于辅助LLM的语义一致性检查的代理验证防御机制。尽管该机制将攻击成功率降低至20%，但将端到端延迟增加至8-9秒，暴露了实时机器人系统中安全性与响应性之间的显著权衡。这些结果凸显了LLM介导的机器人控制架构中的结构性漏洞，并强调了为具身AI系统开发机器人感知防御的必要性。

← Back