机器人前瞻(公众号:robot_pro)
作者 | 程茜
编辑 | 漠影

机器人前瞻6月29日报道,6月26日,北京人形机器人创新中心慧思开物平台的双大脑模型天鹕(Pelican-VL)和我悟(WoW,同步完成北京市网信办最新一批生成式人工智能服务备案。

斩获三项全国首个!北京人形慧思开物双模型完成备案,补齐具身智能商业化短板

▲北京市生成式人工智能服务新增已备案信息(图源:网信北京)

此次备案成果含金量十足,北京人形本次备案一举斩获三项“全国首个”:国内首个完成备案的通用大脑基座模型、首个完成备案的具身世界模型,也是行业内唯一一家一次性完成双底层核心模型同步备案的企业。

行业普遍认为,人形机器人的终极竞争力与“大脑”的感知、决策与规划能力息息相关,完整的技术与合规闭环是产业规模化落地的前置条件。北京人形此次备案完成,正意味着“慧思开物最强大小脑”完成从底层数据、平台发布、真机验证、技术迭代到合规资质全链条闭环。

此前,为实现全维度技术最优效果,北京人形自主研发并开源慧思开物72B具身大脑模型。据了解,该模型为同期业内规模最大、性能最优的具身大脑开源模型,综合性能超越同期全部开源模型,整体能力对标同期GPT、Gemini主流闭源模型。

在此基础上,其迭代研发了122B、397B超大参数大脑模型,以提升具身场景任务规划、智能工具调用等核心能力,在服务低时延、运行稳定性等关键指标上全面优于海外闭源模型。

在备案完成的同时,北京人形计划打造模型Token商用服务开放计划,以打通“底层基座—开发生态—产业商业化”完整闭环,这或许加速国内通用具身智能产业迈入合规化、规模化落地的全新发展阶段,为国产人形机器人产业注入核心动力。

一、拿下三项全国首创,双引擎底层体系成型

北京人形完成备案的两大模型分别是通用大脑基座模型天鹕 (Pelican-VL)以及具身世界模型我悟(WoW

值得一提的是,这是国内具身智能赛道里首例、目前唯一的技术合规成果,其实现通用大脑基座+具身世界模型双底层核心模型一次性同步完成备案。

天鹕(Pelican-VL)是全国首个备案通用大脑基座模型。

目前行业中已完成备案的部分机器人交互模型侧重于语音对话、情绪反馈和拟人化表达,其服务的是人机交互链路,让机器人能听懂指令、自然回应。可以说交互模型就是机器人的语音聊天窗口

天鹕(Pelican-VL)的不同之处在于,其强调面向具身智能场景的通用视觉语言理解能力,可以作为机器人智能系统中的认知理解底座,为后续任务规划、交互决策和场景适配提供统一的感知与推理支撑。

斩获三项全国首个!北京人形慧思开物双模型完成备案,补齐具身智能商业化短板

具体而言,这一模型不与单一交互场景绑定,而是围绕机器人在真实环境中的“看、理解、推理、表达”需求构建,可以覆盖复杂场景理解与视觉认知能力、 视觉语言统一表征能力、面向具身任务的推理与任务理解能力、可迁移的通用基座能力、支撑上层智能系统开发的能力。

在此基础上,慧思开物平台的通用大脑基座就成为机器人整套智能体系的“中央处理器底层架构”。

交互模型属于上层应用、Pelican-VL为底层基座,后者的优势在于全场景通用性、底层拓展性与产业支撑能力。

我悟(WoW)是全国首个备案具身世界模型,也是国内首个合规物理世界仿真底层引擎。

我悟以真实世界物理规律为训练核心,可构建高精度数字孪生环境,自主预测物体运动、碰撞、形变、抓取等物理结果,让机器人在虚拟空间完成百万次作业预演,降低实体机器人试错成本。

对比仅能处理对话信息的交互模型,具身世界模型可以打通“数字世界—物理实体”双向映射,让机器人拥有预判环境、自主避障、柔性操作、动态调整作业方案的物理认知能力。

交互模型不具备物理仿真、环境预测相关底层能力,而上述能力正是人形机器人真正走进非结构化真实环境的核心前提,是实现通用人形作业的底层技术。

在此基础上,慧思开物双模型形成了完整双引擎底层体系:通用大脑基座负责全局认知、逻辑推理、任务规划、多机调度;具身世界模型负责物理环境建模、动作仿真、风险预判、运动预演,二者协同构成通用人形机器人完整底层智能闭环,覆盖从理解世界、思考方案、仿真试错到实体执行全链路技术能力。

二、启动全系列模型Token服务,助推人形机器人跑通商业化

模型合规备案是关键一步,在此基础上,北京人形将启动慧思开物全系列模型Token服务,计划分阶段面向产业客户、科研机构、开发者全面开放API调用能力,对外输出专业化具身模型服务。

依托已量产的具身天工3.0人形机器人硬件,慧思开物平台Token服务可配套整机硬件,推出软硬件一体化解决方案,落地于工业制造、商业服务、特种作业等领域。同时该平台将开放SDK开源生态。

斩获三项全国首个!北京人形慧思开物双模型完成备案,补齐具身智能商业化短板

未来,随着慧思开物平台大小脑模型的正式发布与开源,国内人形机器人行业或将跳出单纯对话交互的浅层应用局限,让更多通用作业机器人项目可以合规落地。

凭借双备案的先发合规优势,北京人形正联动上下游企业共建通用具身智能底层基座,率先打通国内人形机器人商业化道路。

三、跳出单一交互模型备案路径,打通人形机器人模型合规闭环

想要顺利完成大模型备案并非易事,核心要攻克两大关口。根据《生成式人工智能服务管理暂行办法》规定,企业自研的底层大模型在对外提供服务前,需完成属地安全评估与备案流程

北京人形基于监管细则,完成了双底层模型全维度安全评测、数据合规校验、算法透明性审查、内容风险管控体系搭建,并于6月26日取得双模型备案资质。这使其成为业内首家完整按照国家AI监管政策、在北京属地同步完成两大底层核心模型备案的国家队主体。

在安全方面,据了解,其备案与行业主流的单一交互模型备案为主路径不同,而是围绕通用具身大模型底座开展了大规模、多维度、全链路的严格测试与安全评估。

其对两个模型的安全、效果、性能等方面进行了考核和测试,包括建立覆盖“数据合规—模型能力—输出安全—场景适配—风险处置”的完整测试体系,面向真实机器人应用场景构建大量测试样例,系统检验模型在多模态理解、场景认知、空间关系判断、目标识别、任务语义理解、上下文推理和内容安全等方面的表现。

整个备案不仅考核模型基础应答能力,还重点核验了其在复杂场景下的识别精度、推理稳定性、内容安全性与能力边界

此次备案落地,意味着慧思开物平台搭建起通用人形机器人底层大模型的标准化测试与审核流程,能够为政企、工业制造、科教、商业服务等场景提供安全可靠的模型支撑。

四、通用具身智能平台是核心载体,研发迭代、合规认证双管齐下

能够率先完成备案,离不开北京人形长期的技术沉淀与前期布局。

其打造的慧思开物平台是全球首个实现一脑多能、一脑多机的通用具身智能平台,自发布以来,其已经围绕数据筑基、架构、技术开源、真机验证、模型迭代的完整路线稳步推进,打通从训练、测试到落地的完整技术链条:

  • 2024年底发布行业首个跨本体标准化大规模具身数据集RoboMIND,为大小脑模型训练奠定全域数据根基;
  • 2025年3月首次完整提出“大脑决策+小脑执行”双轮驱动技术框架;
  • 2025年10月开放慧思开物全套SDK,同步开源具身世界模型WoW;
  • 2026年4月搭载慧思开物大小脑体系的具身天工3.0全自主拿下机器人勇士挑战赛冠军,极限场景验证全域自主决策与物理操作能力;
  • 2026年5月发布Pelican-Unify大一统具身基础模型,实现大脑全局感知、动态记忆核心技术突破;慧思开物平台的世界模型和大一统模型先后在World Arena全球权威评测榜单,斩获多赛道全球第一。

此次两大模型完成备案,也意味着“慧思开物最强大小脑”完成从底层数据、平台发布、真机验证、技术迭代到合规资质全链条闭环。

其层层递进的技术积累,正逐步为人形机器人在政企、工业制造、科教服务等场景规模化商用扫清障碍。

结语:填补具身模型备案空白,角逐全球人形机器人话语权

长期以来,行业大多仅完成单一交互对话模型备案,针对通用具身底座、机器人空间决策、物理作业的全链路安全测评长期处于空白状态,不少技术方案卡在资质环节,难以走出实验室进入产业实景。

此次北京人形这套兼具技术能力与合规保障的大小脑方案,补齐了产业化最关键的政策短板。

未来,其将持续迭代慧思开物平台的大小脑模型能力,开放Token商用服务、扩大产业生态合作,推动我国通用具身智能底层技术自主可控、合规高质量发展,抢占全球通用人形机器人底层智能赛道话语权。