智东西(公众号:zhidxcom)
作者 | 香草 云鹏
编辑 | 心缘
打麻将、拆快递、纽扣穿针,还能做30KG重物提拉!
沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。
智东西8月18日报道,今日,“野生钢铁侠”稚晖君一连亮出5款智元人形机器人,全程整活儿,前有机器人开瓶盖、倒可乐、搬重物,后有机器人上场主持、穿针、搓麻将、推销卖车,最后还有老父亲稚晖君陪伴“夹子手机器娃”蹒跚学步的感人成长Vlog,并甩出“0元购”终极大招。
智元不仅首次定义具身智能的五级技术演进路线图,而且公布了最新商业化进展:团队面向量产做了大量的正向设计分析、系统方案重构、核心部件自研;远征系列产品规模量产正在进行,接收到来自制造业、交互服务行业等不同客户的大量订单,整个团队都在加班加点准备批量交付。
稚晖君还秀了一波大格局,化身“赛博源神”,从数据集、设计图纸、软件框架、中间件源码到运控算法,通通开源,要让人人可造人形机器人。
智元机器人此次发布了“远征”与“灵犀”两个系列,共5款商用机器人新品,包括远征A2、远征A2-W、远征A2-Max、灵犀X1以及灵犀X1-W。
发布会一开场,稚晖君直接和远征A2机器人家族的几位成员演了一出“人机小品”。
远征A2系列秀出不少新技能,比如远征A2-W机器人用开瓶器开可乐瓶、操作榨汁机做出一杯“葡汽可乐”、精准将榨汁机中的饮料倒入杯中。
“大力士”远征A2-Max则原地抱起80多斤的重物。整体来看,机器人的肢体动作流畅灵巧,相比去年8月首次出场时,显然娴熟了许多,但动作属实有点太过缓慢,光是做饮料就花了整整3分钟。
演完小品后,稚晖君转身走入发布会现场,一台远征A2机器人直接登台当主持人,介绍了远征A2系列机器人家族。
远征A2系列包括远征A2、远征A2-W和远征A2-Max三款机器人,分别针对交互服务、柔性制造和重载特种场景,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。
▲远征A2语音交互现场演示
作为今天发布会的“One More Thing”,稚晖君亮出自家的首款模块化机器人灵犀X1,它个头不大,可以看作是“青春版”机器人,在成本方面有大幅优化。
稚晖君带领不到10人的团队,在不到3个月的时间里,就把灵犀X1从概念做成了整机。灵犀X1从组装完成到今天,还不到两周的时间,因此是“还没满月就出来干活了”。
值得一提的是,灵犀X1有个“机机模式”,手机可以直接放到机器人里,做机器人的“大脑”,这个“脑洞”确实够大。
灵犀X1的屏幕可以定制画面,比如显示稚晖君自己的脸,颇有一种机器人带上了Vision Pro的既视感。
为了避免“价格战”,稚晖君直接给灵犀X1定价为“0元”,全面开源。
在应用场景方面,远征A2可以在4S店内作销售导购,多语言交流,了解用户需求,例如听到顾客想喝水就去拿水,路上可以自动避障;在工厂里,远征A2基本可以完成质检上料、货架摆放货物等工作。
一、全身40+主动自由度,灵巧手19自由度,四大子域核心系统
人形机器人远征A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超2小时,行走速度每秒1米。
在外形方面,远征A2比上一代远征A1更像人了,脑袋更圆、四肢比例更协调,腿部形态从A1的反屈膝设计变为了正屈膝。
远征A2-W由一个人形上半身和背后的机械身体组成,主要用于工业制造领域,其主动自由度22个,续航超过5小时,每秒可行走1.5米以上。双臂写作、多模态感知、持久作业等是远征A2-W针对制造场景进行的针对性优化。
远征A2-Max最大的特点就是力大无穷,其主动自由度达到53个,双臂可称重80斤以上。
远征A2系列产品的工业设计采用了家族化ID语言,有助于实现量产以及独特的视觉识别特征。
在核心零部件上,远征A2系列借鉴新能源汽车的系统,将机器人的核心系统划分为动力域、感知域、通信域、控制域四个子域。
在动力域方面,远征A2的关节模组在上一代的基础上面向量产做了大量的优化和测试,其中部分关节电机的峰值扭矩可以达到512 Nm。
视触觉灵巧手也全面升级,拥有19个自由度,其中12个为主动关节。
基于灵活的手部关节和视觉、触觉感知,灵巧手现在可以轻松拧螺丝、拆快递。
通用的物品抓取更是不在话下,还能双手配合倒水。
纽扣穿针这样的精细活,灵巧手也能轻松实现。
远征A2拥有7自由度双臂,单臂自由度达到3+2+2+N,臂展60厘米。双臂内置六维力传感器,可以配合实现更复杂的操作。
感知域方面,远征A2增加了激光雷达、全景相机等传感器,可实现全域安全、局部避障。基于自研的系统算法,机器人对环境的理解也大幅提升。
通信域方面,智元团队自研了一套轻量化、高性能的智能机器人通信框架AimRT,可以完全不依赖第三方中间件。
值得一提的是,这一框架将在下个月底全面开源。
控制域方面,远征A2在去年Model base的基础上增加了数据驱动的Learning base,使用两种方式共同驱动机器人的行为优化,行走起来更稳定自然。
在运动算法层面,智元构建了一套由自然语言指令集驱动,可以适配不同机器人硬件的AgentOS。
基于机器人本体,AgentOS定义了技能库,通过多模态大模型去定义机器人的状态,再由任务执行器来驱动各种原子技能去进行任务操作,然后再进行反馈来获取这信号。
AgentOS目前还在预研初期,不过从开头的自制饮料等演示来看,它已经实现了比较好的任务编排效果。
远征A2的整体框架参考强化学习来构建,整个机器人是一个软硬件非常复杂的系统,既涉及到内部各个硬件模块的协同和部署,也需要软件跟算法做高效的配合
智元构建了开放软硬件平台AIMA,将远征A2的复杂系统的二次开发能力,开放给外部更多的开发者,共同去构建整个生态。
二、交互服务、柔性制造领域落地,自研数据采集全流程开源
稚晖君首次公布了智元机器人的具身智能技术演进路线图,从G1到G5分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似自动驾驶领域的L1、L2、L3分级。
去年一年,智元机器人在G2、G3阶段并行研发,其中基于G2的原子能力已经实现实际场景的落地应用。
例如在交互服务场景中,远征A2可以针对客户进行精准营销。在汽车4S店内,它可以作为导购为客户提供服务。基于记忆能力,远征A2能够知道顾客上次看中的是哪款车,并主动推荐体验。
基于多模态大模型,远征A2能对不同意图指令精准识别。比如当小朋友说口渴了,远征A2会主动询问需要什么饮品,并取回来交给她。
在行进的路上,远征A2还能智能避障,躲开碰到的人或物品。
基于语言动作大模型,远征A2可以端到端生成自然动作,比如说“1万现金优惠”时,它非常自然地比了个1的手势。
虽然从人形机器人演进的角度来看,远征A2已经实现了很大的进步,但仅凭其现在慢吞吞的说话和做事效率,离替代人类销售还差得远。
在柔性制造场景中,远征A2-W可以基于多模态感知、双臂协作、原子模块化等能力,实现工件投料、上下料、质检、搬运等,还能在不同工序间自动转场。
智元具身智能数据系统AIDEA是稚晖君放出的另一个关键大招,包括仿真平台、机器学习平台、功能部署平台、数据平台,可以说是智元机器人从实验室到工厂再到量产商用的关键基础。
具身领域有一个很大的痛点,就是真实场景数据稀缺。它不像大语言模型有海量的互联网免费数据,也不像自动驾驶每天有上百万汽车在路上采集到的真实数据。
为了解决这一痛点,智元自研了具身智能数据系统AIDEA,形成了一套全流程稳定可靠的数据采集方案。
AIDEA将在今年Q4全面开源百万条真机、千万条仿真数据集,此外,今年下半年智元将会落地百台以上机器人专门用于数据采集。
三、首个模块化机器人灵犀X1亮相,团队不到10人,2个月从概念到整机
在发布会临近尾声的时候,稚晖君还带来了一个One more thing:智元机器人首个模块化机器人灵犀X1,就藏在发布会开头远征A2-Max举起的箱子里。
灵犀X1由智元X-Lab打造,这是智元于6月新成立的一个实验室,也叫“稚晖君实验室”,专门做一些前沿技术创新类研究。这台灵犀X1,是由不到10个人,在两个多月的时间内从无到有自研得到的。
灵犀X1身高133厘米,体重不到66斤,十分小巧。其手臂使用串并联混合结构,整臂重量只有2kg,这使得它可以支持更灵活的运动、更高效的控制。
灵犀X1还创新推出“机机模式”,也就是机器人+手机,把手机放到机器人的“头”里来做大脑,让手机本身的麦克风、扬声器、屏幕等硬件,以及网络、AI算力等软件能力,为机器人带来新的突破。
通过在远征系列上积累的各种研发经验,灵犀X1上也自研了两款全新的关节,其全身30多个自由度,均由这两款关节提供支持,做到了极致的标准化。
灵犀X1也推出了用于数据采集的机器人灵犀X1-W,相比远征A2-W成本更低。
就像稚晖君本人一样,智元机器人可谓是将开源贯彻到底。灵犀X1的本体设计图纸、软件框架、中间件源码,以及基础运控算法都将全面开源。
四、沉寂一年,华为天才少年“闷声干大事”
自智元机器人首款人形机器人远征A1发布,刚好过去一整年的时间。如果说远征A1是从零到一的突破,那么这次发布的远征A2,则是在从1到100的AGI之路上,迈出的重要一步。
智元机器人成立于去年2月,致力于研发具身智能机器人产品及应用生态。带着创始人之一稚晖君的光环,智元机器人从诞生之初就备受科技圈关注。
稚晖君本名彭志辉,本硕均毕业于电子科技大学,毕业后曾在OPPO研究院AI实验室担任算法工程师,随后在2020年加入“华为天才少年计划”,从事昇腾AI芯片和AI算法相关研究工作。
那一年的华为天才少年,总共有6名。
▲稚晖君华为天才少年签约纪念
稚晖君的另一个身份,是科技圈知名up主,因在B站发布的一系列硬核科技产品视频而闻名。
视频中的他软硬件“通吃”,从写代码、画电路图,到建模、装配全部DIY,独立制作了给葡萄缝针的钢铁侠机械臂、“能够自己行走”不摔跤的自行车、模块化机械键盘等有趣的项目。
▲稚晖军B站主页
2022年12月,稚晖君宣布已从华为离职创业,次年2月就正式成立了智元机器人(上海智元新创技术有限公司),作为联合创始人之一担任CTO和首席架构师。
智元机器人也备受资本青睐,目前已完成A3轮融资,投资方包括比亚迪、BV百度风投、红杉中国、高瓴创投等知名企业或机构,估值也早在去年就超过10亿美元,晋升独角兽。
结语:人形机器人明星独角兽重磅“回归”
就在上周,美国人形机器人创企Figure刚刚发布第二代机器人Figure 02,要做“地表最强人形机器人”。Figure 02第四代手部拥有16个自由度,比特斯拉的擎天柱二代多了5个,而远征A2则更胜一筹达到19个。
在自媒体时代,稚晖君就时常“闷声干大事”,半年做一个项目惊艳全场。在过去一年中,智元机器人一直比较低调,此次时隔一年再办发布会,稚晖君果然没让大家失望,不仅甩出超强远征A2全家桶,还带来了灵犀X1这一惊喜新品。光是现场演示,就已经打败了一大半同类产品。
在生态方面,智元看起来是要走和稚晖君本人同样的开源路线,让更多开发者参与进来,共同为远征A2、灵犀X1的迭代添砖加瓦。