B体育官方网站首页 复旦、CityUHK、SMU、UIUC等13家合伙髻布「具身智能安全」综述


具身智能(Embodied AI)正在快速从实验室走向果真天下。
自动驾驶汽车启动在城市谈路中穿梭,机械臂在工场里自主握取和安设,劳动机器东谈主渐渐插足病院、市集与家庭。与传统大模子不同,这些系统不再仅仅「在屏幕上语言」——它们正在平直团结传感器、驱动践诺器,并对物理天下产生果真影响。
但与此同期,一个更深层、也更危境的问题正在浮现:当大模子启动驱动物理天下,已往那些「说错话」的安全风险,将第一次演变成「干错事」的实践风险。
关于聊天机器东谈主,一段逃狱提醒词最坏可能仅仅生成无益文本;但关于机械臂、自动驾驶或机器东谈主系统,相通的袭击却可能平直转动为危境动作,甚而对实践天下形成不行逆成果。
近日,来自复旦大学果真具身智能讨论院、上海创智学院、香港城市大学、新加坡顾问大学、伊利诺伊大学、墨尔本大学、约翰霍普金斯大学、南洋理工大学、中科院自动化所等 13 家机构的 38 位学者,合伙髻布了迄今最系统的具身智能安全时期综述,全文 70+ 页,狡饰近 480+ 篇讨论论文。

论文标题:Safety in Embodied AI: A Survey of Risks, Attacks, and Defenses
综述将具身智能分袂为一个逐层递进的「五层才略圈」:感知、知道、谋划、行径与交互,以及 Agentic 系统,并提倡了一个连气儿全文的中枢知悉——
「才略—风险」二象性(Capability-Risk Duality)
每加多一层才略,就会新增一层袭击面;才略越强,风险面也越广。
感知
这也组成了整篇综述的中枢组织逻辑。沿着五层才略圈,具身智能系统的风险正在从「数字天下」冉冉演化为「物理天下」:
在感知层(举例东谈主脸门禁系统),袭击者主要主管传感器输入;
当系统具备知道才略(举例博物馆导览机器东谈主),沙巴体育世界杯中国官网首页袭击面进一步推广到语言清爽与视觉推理;
当系统具备谋划与闭环有盘算才略(举例自动驾驶),袭击者甚而不错骚扰旅途有盘算、轨迹展望与及时戒指;
当系统进一步具备复杂物理交互才略(举例机械臂、东谈主形机器东谈主),空幻有盘算将平直转动为实践天下中的危境动作与物理伤害;
而当系统演化为具备缅想、器用调用、自主谋划与陆续进化才略的 Agentic 系统后,内层纵情一个缺点,都可能沿着才略栈逐层级联放大。
换句话说,已往那些被孤苦孤身一人盘考的「挣扎样本」「后门袭击」「逃狱袭击」,在具身智能时间将不再仅仅单点安全事件。
它们会沿着「感知—知道—谋划—行径」的才略链条不断传递与放大,最终从一次模子空幻,演变为一次果真天下中的系统性事故。

图 1:「才略—风险」二象性。才略栈每多一层,袭击面扩大一圈。
五层恐吓,B体育官方网站首页一图看懂具身智能安全
综述进一步将分散的袭击与沉稳讨论斡旋到合并套才略框架中,系统梳理了不同才略层对应的中枢袭击面与实践风险:
才略层
代表性袭击
果真天下成果
感知层
挣扎样本、后门袭击、传感器诱拐
篮球比赛投注app(中国)官网谢却物漏检、罢手璀璨误判、雷达诱拐
知道层
念念维链劫持、推理后门
空间清爽空幻、高下文曲解、空幻语义推理
谋划层
任务逃狱、轨迹中毒、有盘算主管
不安全旅途谋划、违背戒指指示、机器东谈主闯入禁区
行径与交互层
戒指挣扎、东谈主机交互后门
机械臂撞东谈主、车辆失控、绕过安全公约
Agentic 系统层
器用 / 技巧销耗、缅想投毒、缅想泄漏、级联失效
经久不安全步履、狡饰泄漏、跨任务稠浊、自进化对王人坍塌

图 2:具身智能 5 层才略栈中的袭击面与恐吓分散。
这篇综述与已有责任不同在那儿?
具身安全这两年露出了一批综述(VLA Safety, Trustworthy EAI, World-Model Safety, LLM Robotics Security 等)。但绝大大批只看其中一层——
有的只讨论 VLA 模子的挣扎鲁棒性;
有的只看导航场景下的慎重性;
有的只爱护 LLM 戒指机器东谈主时的提醒注入;
还有的把安全行动「IoT 系统中的一个组件」。
而这篇综述赈济一个中枢态度:
必须端到端地看通盘这个词 embodied pipeline,因为袭击会跨层级联。
它不仅整合了 embodied-specific 的责任,还从 vision、language、multimodal 基础模子安全讨论中筛选出与具身高度相干的责任,把「具身智能安全」放回更大的 AI 安全图景里。
被低估的几个讨论空缺
读这篇综述最值得保藏的部分,是它指出的几条险些没东谈主系统讨论的洞开问题:
多模态交融的脆弱性——交融越多模态,安全越复杂,但现在险些莫得针对交融层的攻防分析;
谋划层在逃狱袭击下的踏实性——LLM 当 planner,逃狱成果不再是「输出无益文本」,而是「机器东谈主启动践诺无益任务」;
洞开场景下的东谈主机交互果真度——传统 HRI 安全假定交互是闭合的,但果真天下里的对话是洞开的;
Agentic 系统的级联失效旅途——缅想、器用、技巧、自进化之间如何相互稠浊,现在枯竭面容化框架。
这些每一条都足以撑起一个孤独的讨论标的。
不仅仅综述,更是一套社区资源
团队同期爱戴了齐备的洞开资源生态,包括:
Awesome-Embodied-AI-Safety GitHub 仓库(已收录 480+ 篇著述,按层级 + 子类组织,陆续更新);
面容网站:提供分类浏览、讨论统计与结构化阅读视图;
arXiv 双月更新机制:团队以双月节拍同步最新 arXiv 责任,现在已纳入 HazardArena、RedVLA、JailWAM、IPI-in-Wild、MCP Function Hijacking、Skill Safety 等最新讨论。
关于爱护具身智能安全的讨论者而言,这篇综述不仅是一份文件整理,更像是一张插足通盘这个词限制的「导航舆图」。
写在临了
具身智能正在重新界说 AI 与实践天下的团结形状。
当一个模子不再仅仅「在屏幕上语言」,而启动信得过插足物理天下——启动握取、行走、操控、驾驶、交互、长久缅想,甚而自主进化——安全问题也正在发生根人道变化。
已往,模子「说错一句话」,成果通常仍停留在数字空间;
而在具身智能时间,一次感知偏差、一次谋划空幻、一次逃狱袭击,都可能最终演化为果真天下中的危境动作与系统性事故。
这意味着,安全如故不再仅仅某一种袭击、某一个 Benchmark、某一篇论文能够单独贬责的问题。
它正在成为连气儿感知、知道、谋划、行径与 Agentic 系统的底层问题。
而这篇综述最进攻的少许,好像恰是它反复强调的那句话:
在具身智能时间,安全应当与才略同步想象,而不是过后打补丁。
要是你也在爱护机器东谈主、自动驾驶与智能体如何信得过走进实践天下B体育官方网站首页,那么这篇综述,值得保藏。