具身智能是人工智能通过物理本体与环境实时交互,实现感知、认知、决策和行动一体化的智能系统,涵盖人形机器人、仿生机器人、环境嵌入式系统等多种形态。当前,具身智能在与环境的反复交互中不断发展,认知决策能力和本体实用性能显著提升,正加速向更自主、跨场景的通用智能演进。准确把握具身智能全球技术创新态势,积极应对深层挑战,对于在新一轮产业变革中抢占先机、赢得主动权具有重要意义。

在北京人形机器人创新中心具身智能机器人数据与训练基地大厅门口,人形机器人做出“比心”姿势。新华社记者 王婧嫱摄
全球具身智能技术发展呈五大态势
当前,全球具身智能技术呈现加速演进态势,感知交互、决策认知、控制执行、虚实域数据融合与系统集成五大维度协同突破,正推动具身智能从实验室走向规模化应用。
一是世界模型内嵌,感知交互跃迁。在世界模型和多模态感知技术的驱动下,具身智能对物理环境的理解与交互能力显著跃升,实现从“刺激—响应”到“推演式决策”、从数据重组到规律理解的范式跃迁。Meta公司推出V-JEPA2世界模型,可预判不同行为后果,依据目标作优劣排序,行动准确性大幅提升。北京大学提出MLA多感官语言动作模型架构,引入完备多感官模态,通过整合异构信号提供更可靠的决策依据。
二是端到端成趋势,决策范式革新。具身智能“大脑+小脑”分层决策架构已成熟,应用越来越广;端到端模型凭借广覆盖、低时延、高自主、强协同的优势,在具身智能走向通用泛化的探索中展现出很大潜力。Google DeepMind的Gemini Robotics依托端到端VLA架构,跨本体泛化能力出色;国内越疆自研的DOBOT-VLA模型融合视、语、控能力,经实景强化学习优化,搭载了其的人形机器人ATOM已于2025年实现量产,可完成行走、动态平衡与精密装配等复杂作业。
三是柔性材料突破,自愈能力涌现。材料革命正推动具身智能由“刚性执行末端”向“智能适应本体”演进。类肤触觉传感器与电子皮肤让具身智能拥有高灵敏的环境感知能力,仿生柔性结构赋予具身智能类生命体爬行、滚动、蠕动等多模态运动能力,有效适应并拓宽了应用场景。自修复材料实现主动自愈突破,本体受损后可在光、热作用下实现化学键可逆重组,集损伤检测、定位与自愈功能于一体,大幅提升具身智能在复杂恶劣环境下的耐久度与可靠性,保障长期自主作业。
四是虚实数据融合,统一数据标尺。真机数据采集成本高、规模小,对未见环境泛化能力较弱,已成为具身智能发展的瓶颈。生成式数据源自大模型创建的仿真环境,体量大、结构化程度高,可低成本填补数据鸿沟,结合物理规律约束和混合数据范式,并以真机数据校准,能够显著缩小仿真与现实的差距。国内企业51Sim基于英伟达平台积累端到端辅助驾驶场景及合成数据,成功用于港口、矿山等复杂场景的机器人训练。“穹顶—DOME”平台统一数据接口与格式规范,打破数据孤岛,构建产业通用语言,有力推动跨场景互操作与高质量数据供给。
五是实现异构协同,筑牢安全底座。软硬件解耦与模块化集成,正推动具身智能操作系统加速实现跨本体兼容与异构协同。OpenRMF架构统一机器人“交通规则”与“沟通语言”,实现异构机群的协同作业;OpenMind公司推出的OM1支持主流大模型API的即插即用与跨本体开发。系统集成筑牢工程底座,安全可信守牢底线约束。对抗训练、差分隐私等隐私计算技术可在不泄露原始数据的前提下实现跨机构协作,为具身智能规模化应用构筑主动安全的纵深防御体系。
多措并举增强我国具身智能竞争力
当前,我国具身智能正处于技术突破、产业导入和生态培育协调并进的关键阶段。核心硬件国产化提速,大模型性能大幅增强,国产算力可高效承载复杂模型,部分领域初步形成应用能力。但随着国际竞争的日益激烈,具身智能的深层挑战也不容忽视。
一是核心零部件自主可控度有待提高,伺服电机、减速器、高端传感器对外依存度高,能源系统续航能力不足,全栈自研能力仍存弱项;二是标准体系与产业生态尚待完善,硬件接口、通信协议、软件兼容标准不统一,数据孤岛现象普遍,开源社区影响力有限,高质量交互数据供给不足;三是安全治理体系仍需完善,自主系统事故责任划分难以界定,敏感数据持续采集易引发数据泄露和隐私侵权等风险,跨机构协作的可信机制有待健全。
面对上述挑战,我国应抢抓发展窗口期,以自主创新为核心、标准建设为抓手、安全治理为底线,加快培育具身智能产业生态,为发展新质生产力、建设科技强国注入强劲动能。
一是强化战略科技力量布局,夯实自主创新根基。依托新型举国体制,强化全国重点实验室等在具身智能领域的战略科技力量作用,围绕“信息—物理—认知”三域融合大模型、端到端决策架构、仿生柔性材料等前沿方向开展有组织科研。深化企业主导的产学研融合,支持科技领军企业牵头组建创新联合体,集中优势资源突破伺服电机、减速器、行星滚柱丝杠等核心零部件国产化瓶颈,贯通“基础研究—技术开发—产业应用”全链条,从源头破除产业发展桎梏。
二是构建开放协同的产业生态,以高标准引领高质量发展。加快制定跨行业硬件接口、通信协议与软件兼容标准,推进操作系统、中间件等基础软件自主可控。探索建立高层级数据汇聚与治理主体,制定多模态数据采集与标注规范,建设面向智能制造、高危作业等重点场景的仿真基准与数据开放平台,破除数据流通壁垒。大力培育本土开源生态,鼓励高校、科研院所与企业共建算法算力共享体系,降低研发门槛,加速技术迭代,以高水平标准化和开源化引领产业提质升级。
三是健全安全治理体系,筑牢可信发展根基。构建涵盖算法、数据、物理安全的分级防护机制,明晰生产、使用、算法供给、监管各方权责边界。前瞻研究事故责任认定、跨机构协作互信等治理规则,规范具身导航、群体协同等行为的安全与伦理准则。探索包容审慎的监管模式,开展全生命周期安全伦理评估,搭建主动安全的纵深防御体系,为具身智能规模化落地、长效健康发展提供制度保障。
来源:科技日报