智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影

智东西4月29日报道,今天,2024中关村论坛年会盛大落幕。其中,首次举办的主题日活动「人工智能主题日」为学术大牛、企业代表与参会观众打造了一场探索未来人工智能发展趋势的高规格交流平台。

其中,堪称当下最热门话题的具身智能引爆了当日几波小高潮。中关村科学城管委会副主任、海淀区副区长唐超发布了海淀区《打造全国具身智能创新高地三年行动方案》(以下简称《行动方案》)。这也是海淀区政府首次专门针对具身智能的细化行动方案发布。

《行动方案》重点聚焦具身大模型和机器人整机,部署六大行动,力争到2026年,初步建成全国具身智能原始创新策源地、应用示范新高地和产业加速集聚地,成为国内参与全球具身智能竞争的核心力量。

其中重点提到三个“小目标”

1、突破一批具身智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人。

2、打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。

3、集聚一批具身智能创新团队,率先培育出具有国际竞争力的领军企业。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲中关村科学城管委会副主任、海淀区副区长唐超

中关村科学城产业四处处长陈镭在与智东西等媒体交流时提到,《行动方案》是政府与海淀区头部机器人企业共同探讨、反复思考的最新成果。具身智能的创新迭代飞速进行,政府将建立为创新主体解决共性难题的数据共享、训练平台。

他补充说,今年年内,依据《行动方案》要与头部玩家探讨清楚创新中心等平台的具体模式、组合形式、牵头方等,衔接好机器人企业、场景方、科研机构。

此外,在未来人工智能先锋论坛圆桌对话环节,由智源研究院院长王仲远主持,7位国内具身智能领域代表性的创业者及研发负责人同台输出对具身智能的发展思辨。

包含星动纪元创始人陈建宇,傅利叶智能创始人兼CEO顾捷,智元机器人联合创始人、上海人工智能研究院院长宋海涛,银河通用机器人创始人、智源具身智能研究中心负责人王鹤,宇树科技创始人兼CEO王兴兴,小米机器人团队负责人许多,ACM会士李航7位嘉宾。

包括数字世界中是否有可能实现通用人工智能,以及具身智能兴起的意义、重要特征与系统性工程、与AI智能体如何协同、研发与工程挑战、仿真数据与现实数据两种路线、技术发展与产业应用等。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

一、具身智能发展已成业界共识,海淀区机器人创新优势凸显

具身智能当之无愧是当下AI产业的一大热潮,并成为通往AGI(通用人工智能)的重要路径。

相比于语言、图像、视频等非具身大模型,拥有身体的具身大模型可以直接与物理世界进行交互。因此,陈建宇认为,通过具身智能实现AGI非常可能,具身智能既具备语言和图像的理解能力,还能控制身体。

从这一概念被提出起,主要的观点就是通过和物理世界的交互促进人的智能发展,但没有身体的智能会缺失很多交互的方式。

王鹤也表达了相同的观点,“具身智能与非具身智能互补,其全集才是AGI。”

他用“读万卷书,行万里路”进行类比,互联网的图文信息是“读万卷书”,让智能体理解人类的思维,但这无法替代行万里路,需要依靠具身智能赋予智能体身体,以及和物理世界交互并从中学习的能力。

宋海涛认为通往AGI之路非常漫长,具身智能是其中的一个关键里程碑。

可以看出,具身智能的发展迭代迫在眉睫,与此同时,具身智能仍处于发展初期,未达产业发展的临界点。

具身智能是系统性的工程,目前硬件和软件在发展速度上并不匹配,硬件的突破、数据收集的效率等是困扰产业的难题。

在此背景下,在机器人领域具有得天独厚优势的海淀区迅速抢占发展新先机。

海淀区聚焦了全市40%的企业,人形机器人企业数量近200家(占全市半数以上),包括十余家人形机器人本体企业(占全市一半以上),有3家本体上市企业、2家独角兽企业,清华、北大、北航、北理、中科院等高校院所,银河通用机器人、智源研究院联合研发了140亿参数量的具身智能多模态大模型Emu。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

此外,海淀区于4月初承办了首届中国人形机器人产业大会暨具身智能峰会,为企业搭建交流平台,激发思考和讨论的同时,触及更多具身智能相关合作。

二、以创新中心为核心,重点部署六大行动,突围技术突破、应用测试、场景部署

基于上述背景,《行动方案》重点部署了六大行动。

一是源头创新突破行动。重点开展大脑技术创新、小脑能力突破、脑身系统协同三项任务,加快突破一批具身智能前沿核心技术。

具身智能包括机器人本体,和决定其智能化的大脑、小脑、脑身协同。陈镭解释说,目前大脑的研究方向是大模型,让机器人听懂人的语言;小脑为控制身体运动,掌握基本运动技能;脑身协同指机器人的意识训练。

不同于语言、视频等大模型,具身智能的最大特点在于其要直接和物理世界交互。因此在具体的技术布局方面,《行动方案》会关注于多模态大模型开发,实现机器人的全身协调、灵巧操作,并提升数字世界的模拟能力以及提升虚拟世界到物理世界的迁移技术。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

二是整体产品领跑行动。重点开展机器人整机性能提升,模块化部组件攻关,加快研制一批国内领先、国际先进的多形态机器人。

现在有一大技术路线为,人形机器人本体通过传感器、摄像头获得的物理世界数据进行训练,慢慢提升智能化。

因此,《行动方案》会重点关注整机机器人打造,以及伺服器、灵巧手等机器人关键零部件的研发。陈镭谈道,他们计划在北京建立一个共享零部件加工中心,以加速机器人的研发进程。

在这背后,海淀区政府将打通产业和科研的资源,加速高校科研成果转化。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

三是创新平台赋能行动重点打造具身智能创新中心等共性技术支撑平台、产业创新孵化平台,加快提升样机研发、检验测试、中试服务、生产制造等产业公共服务能力。

人形机器人的发展处于早期,很多企业在研发阶段很难产生利润空间。因此,陈镭认为,具身智能创新中心可以为企业提供训练的场景,帮助其获取更多数据,从而降低研发成本。

同时,《行动方案》还会通过合作运营的方式,打造研究院、孵化器、加速期等平台。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

四是应用场景示范行动。重点面向科研、工业、消费等场景,组织实施一批可复制、可推广的具身智能应用示范工程。

陈镭透露,目前他们已经征集了人形机器人、四足机器人等的应用场景方向。此外,诸如小米、联想等企业的工厂总部均位于海淀区,也可以为机器人提供应用测试合作的机会。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

五是产业集群建设行动。重点开展企业梯次培育,建设具身智能特色园区,打造有竞争力的产业集群。

这也是为企业提供开放测试环境的重要平台,陈镭谈道,他们计划在海淀北部打造机器人小镇,为企业提供技术交流的平台。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

六是生态雨林打造行动。重点加强人才队伍建设,打造具身智能人才社区。强化金融赋能,加大市区基金对具身智能的投资力度。制定标准规范,提升具身智能科技伦理治理能力。支持建设具身智能开源社区,举办具身智能论坛、峰会、大赛等活动,形成开放合作的产业生态。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

三、具身智能创业者、研发负责人同台,热议AGI时代终极形态、技术突破、应用前景

产业层面,7位嘉宾在圆桌对话环节,围绕着具身智能产业的科技创新和产业革命进行了思想交锋。

李航总结了具身智能的三大特点,机器人有自主性;能基于不同数据产生不同智能;结合多模态大模型在物理世界不断演进。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲ACM会士李航

但由于具身智能产业的发展尚处早期,对于其终极形态并没有明确的定义,但人形目前已成为业界共识。

王兴兴谈道,机器人的形态对具身智能而言并不重要,只是目前的发展决定了,人形是社会公认的理想形态,可以方便从人的现实生活中采集数据。

“移动可达、操作可达、语义可达、价值和智慧可达”是小米理解的机器人产品做到可用的四个层次。许多解释说,基于这四个目标,人形是当下人们可想象的形态中最优的选择,但也不排除未来会有超越人类的更多形态出现。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲小米机器人团队负责人许多

具身智能的智能化表现除了与机器人本体相关,更为重要的就是软件,但目前的难点在于两者研发并不匹配。

对于此,顾捷谈道,机器人本体迭代是切入点,因为如果本体自身的任务完成能力差,就会加大基于其开发软件的难度。因此当本体迭代、基本应用开发完成后,才会进行本体收敛,以及更丰富应用开发。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲傅利叶智能创始人兼CEO顾捷

许多也认为,短期内具身机器人的挑战在于硬件,要突破移动空间可达做到1cm,手眼协同做到0.1mm。远期来看就是数据闭环的工程效率,上层大模型在硬件上大规模高效率收集数据。

在李航看来,具身智能可能在某个阶段,需要软硬件一起往前推进、优化。但未来会有一个很明显的趋势,不同的团队会有不同侧重,既有单独做软硬件,也有软硬兼做的玩家。

数据是智能的重要推动力,具身智能最重要的一大瓶颈就是缺乏数据。

不同于非具身大模型,人形机器人没有数据集。因此王鹤认为,具身智能的数据实现0-1可能会完全靠仿真数据驱动。其中最实际的方式就是通过物理仿真,制造模拟在真实世界训练的虚拟世界。

当这样的机器人大规模存在后,在真实世界中交互的数据闭环最终会成为具身智能的源头活水,释放更多的能力。

陈建宇补充说,仿真世界的采集数据更快,但其也有局限性,就是难以准确搭建复杂场景。因此,他认为,机器人前期会通过仿真世界搭建简单场景学习,当能力迭代到一定程度,就进入真实世界的复杂环境采集数据。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲星动纪元创始人陈建宇

在技术路径之外,面向具身智能的商业化应用前景。

业界都普遍认为工业会是最先落地的。陈建宇称具身智能在工业场景3-5年内会实现规模化,进入与人交互更频繁的场景会需要更长时间。

除了工业场景本身的具体、可重复性高,适合技术演进先做出来产生商业价值的特点外,工业场景还具有厂商付费意愿高、公众可感知度高等特点。

宋海涛透露,他们目前在3C制造领域已经有了实测,他们主要关注的场景特点是融合度较高、公众感知度更强、场景的买单能力更强。

同时,他还强调了研发过程中的三个真实,真实的场景、真实的重大工程问题、真实的数据。基于此,未来3-5年是具身智能的渗透期,在整个构建过程中,以算力+基础的训练框架构成的新型数字基础底座形成,5-8年会有快速上量过程。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲智元机器人联合创始人、上海人工智能研究院院长宋海涛

王鹤谈到了更为具体的布局规划,从能力的角度,合成大数据今年、明年将会出现能做拿取放的通用大模型;机器人成本方面,轮式底盘的机器人成本低于劳动力一年的工资,他们已经与某些车厂、商超沟通合作,预计1-2年起量。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲银河通用机器人创始人、智源具身智能研究中心负责人王鹤

从整个产业来看,具身智能的发展突飞猛进,但好的地方在于AI的出现让产业中的参与者更为平等。

王兴兴谈道,在AI的世界很平等,技术的突破更多要靠个人的学习能力、思维能力,并且目前来看具身智能的发展尚未突破临界点,因此谁能率先突破都有可能。

北京海淀打响具身智能争夺战:公布三年行动方案,部署六大行动

▲宇树科技创始人兼CEO王兴兴

结语:海淀区以产业积累,率先拉开具身智能产业变革大幕

AI主题日落幕,但具身智能作为最具划时代意义的技术之一,大幕才刚刚拉开。

前沿产业从底层技术突破到应用场景落地,无不需要经过长期且艰难市场的检验,这背后离不开财力、人力的大规模投入。

一直以来在人工智能领域率先布局的海淀区,已经拥有深厚的创新底座以及产业集聚优势。

海淀区是全国人工智能创新基础最好、人才密度最高、研发能力最强、产品迭代最活跃的地区。从研发机构、人才、全产业链玩家,到大模型、算力布局等,都为大模型的场景应用落地提供了优势条件。

这些产业积累将成为具身智能这一系统性工程的强大底座,依据《行动方案》将科研院所、机器人企业、场景方相结合,推进技术革新与产业落地,使得AGI愿景在具身智能的承载下成为现实。

此外,基于《行动方案》,下一步,海淀区将凝聚各方力量全力保障方案的落地实施,在具身智能共性技术服务平台建设、重点企业培育与引进、推进应用场景落地、打造具身智能特色园区等方面持续发力,加快形成具身智能创新发展的良好格局,开启具身智能产业发展新篇章,为打造首都新质生产力示范区贡献力量。