智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 心缘
智东西10月1日报道,北京时间9点19分,一个全身裸露电线的人形机器人缓缓走上特斯拉AI Day 2022的舞台,向现场观众挥手打招呼。
去年8月,特斯拉CEO马斯克在第一届特斯拉AI Day上重磅公布特斯拉首款人形机器人“擎天柱”(Optimus)的概念图。今年,为了让人形机器人顺利发布,马斯克将“特斯拉AI Day”从原定的8月19日推迟了40多天!
今天,“擎天柱”终于从一个身着白衣、头戴黑面纱的真人扮演者变成了真的机器人,马斯克的“造人梦”照进了现实。
“我们的目标是尽快制造出有用的仿人机器人。”马斯克说,擎天柱将是一种“能力极强的机器人”,产量非常高,最终将生产数百万台,并且预计成本将远低于汽车——不到2万美元。
按其说法,擎天柱最初会从事一些枯燥或危险的工作,比如在特斯拉工厂周围移动部件,或用扳手给汽车安装螺栓。按照马斯克的设想,未来机器人还可以用于家庭、做饭、修剪草坪和照顾老人,乃至成为人类的“伙伴”或伴侣。
同时马斯克谈道,要完善并证明擎天柱,还有很多工作要做。
他还在活动期间发推文,透露擎天柱机器人将会有“猫女版”。
一、能浇水、送物、流水线工作,6个月推出原型机
完全体的特斯拉人形机器人“擎天柱”体重73kg,用电功率在静坐时为100W,快走时500W,全身有28个自由度,手部有11个自由度。马斯克称,一个人形机器人的成本大概在2万美元之内,远低于一辆汽车。
在现场,马斯克展示了工程版“擎天柱”,全身裸露天线的“擎天柱”初始版走下台后,一段视频中展示了人形机器人的才艺。
在特斯拉工厂内,“擎天柱”可以搬起印有特斯拉标志的箱子,并将其运送到其他地方。
“擎天柱”能够拿起放在桌子上的水壶,然后行走至办公室内的花草种植区,为花草浇水。渲染的图片就是机器人的“视角”,看起来除了色彩差异与人类正常看到的图像内容没有特别大的区别。
在工厂里,机器人能将一个长条状的物体从工作台拿下来,再整齐排放至装有相同物体的盒子中。在机器人视角的渲染图中,它能够用颜色区分开现实世界中的不同物体。如它手持的长条形物体是紫色、工作台是黄色等。
随后,一台更像人的“擎天柱”被推上现场,它同样可以张开双手或抬起右手,向台下缓慢打招呼。
优化版本的“擎天柱”因为脚下有支撑装置,还可以同时抬起双手双脚。
不过,与初始版本不同的是,优化版“擎天柱”并没有在现场走动,而是全程由工作人员搬运。
在过去的四个月里,特斯拉的人形机器人就一直在办公室内四处走动。
现阶段,特斯拉人形机器人项目从去年2021年AI Day上的概念图,到今年2月,短短六个月就推出了原型机,现在已经有近似完全体的新一代“擎天柱”亮相。
特斯拉第一代机器人从概念、设计、分析、建立、优化、验证经过了反复验证,对于这一新物种来说,拥有较低的成本和较高的工作效率也正是验证这一产品是否能真正推向市场的关键。
二、以汽车设计过程为基础,优化调参至机器人平台
擎天柱的设计是以特斯拉此前积累的车辆设计过程为基础。
人类可以吃少量的食物来维持能量,因此为了减少机器人上消耗的能力,特斯拉将人形机器人在空闲时消耗的能量降到最低,只需要按下开关就可以调节其处于低电量或者正常工作的状态。
1、电动和控制系统:28个驱动器+2.3kWh的电池组,可工作一整天
从其概念图中可以看到,整个机器人包含了28个电动驱动器(橙色)和电池及控制模块(蓝色)。
“擎天柱”身体中间有2.3kWh的电池组,工作电压为52V,能支持人形机器人工作一整天。这个电池组的独特之处在于,它把所有的电池电子都集成到了一起,传感器融合电荷管理等,利用汽车和机能源产品将其融合到一起。这也是特斯拉流线型制造的高效之处。
除技术外,当然也离不开特斯拉强大的基础设施和供应链。
特斯拉机器人使用了单颗特斯拉自研SoC芯片,不同于特斯拉在汽车上使用的双芯片自动驾驶方案。
与汽车不同,机器人需要处理视觉数据做出迅速反应、基于多种感官输入和通讯,因此装有无线电连接、音频支持以及需要保护机器人本体和人类的安全特性。
2、基础结构设计:量化人体运动轨迹、力度,机器人行动更灵活
特斯拉有能力完成高度复杂的系统。如人们在驾驶时遇到的突然撞击,汽车做出相应反应的过程。因此,为了保护机器人,研发人员对其结构基础进行了优化,在人形机器人摔倒时不会把变速器和胳膊弄坏,就可以将这一技术应用到机器人之上。毕竟一台机器人的维修成本很高。
研发人员采用了与汽车相同的底层技术,让机器人在所有组件中产生压力,使得其行走控制变得更加容易,也不会那么僵硬。
以膝盖为例,人形机器人在设计时需要仿照人类真实的膝盖结构。
研发人员将人类的膝盖和其运动过程中所受的力线性化,从而学习如何让机器人膝盖使用更少的力来构建,让其能实现更好的力度控制,并让相关结构紧密的包裹在膝盖周围。
3、机械驱动系统:解析云端数据,轻松定制28个驱动器
汽车和机器人在动力设计上有很多相似之处,因此,特斯拉在动力设计上的经验可以应用到机器人上。
汽车的驱动单元是为了让汽车加速,机器人有28个关节驱动器,和汽车的驱动器在数量上相比差异并不明显,但人形机器人要做的任务则更为复杂,它们需要走路或者攀岩,因此研发人员用模型生成机器人的连接转矩速度轨迹,随后输入其优化模型来运行。
机器人需要转动,研发人员根据扭矩速度轨迹和关节驱动器的效率图,沿着轨道产生的能源消耗、任务与时间的累计能量,就可以定义特定执行机构的样本,并发送到云端。这样一来,就可以缩短其生产成百上千万关节驱动器的时间。
不过,机器人的每个关节都是特定的,28个关节都需要定制规格。因此,研发人员需要减少定制的执行器设计,解析它们上传的云并采取共性研究。
“擎天柱”的关节驱动器共有6种,包括三种不同规格的舵机、三种不同规格类似重量秤一样的牵引执行器等。
在极限范围内进行测试,其关节驱动器抬起一架半吨重的钢琴,这也是人形机器人必须具备的功能。
4、手部感知系统:大、小形态均能抓握,手部也能感知物体
人手能以每秒300度的速度移动,拥有成千上万的触觉传感器。特斯拉机械手的设计灵感就来自于生物学,和人手一样同样使用五个手指来驱动,既可以完成大口径物体抓取,同时也能满足抓取精巧物体的需求。
我们周围世界的工厂被设计为适于人手抓握的,但也会出现很多我们没见过的物体。因此,特斯拉的人形机器人手指有6个执行器和11个自由度,搭载了能够驱动手指并进行感知的传感器。
手的适应机制是非常复杂的,人类可以认识到手在空间中的位置,而这也是其能抓取物体的关键。因此,特斯拉目前也在进行相应测试。
5、视觉导航系统:采用汽车同款神经网络,自主识别行驶区域
在机器人的行动方面,“擎天柱”使用特斯拉电动车同样的神经网络——“占用网络”来识别可行驶区域,研究人员称,他们正在研发如何改善“占用网络”,来使得机器人更快、更精准到达目的地。他们最近在训练人形机器人的计算机视觉识别高频特征,让人形机器人能够快速找到最近的充电站。
研发人员在模拟测试中,使用自动驾驶模拟器并集成了机器人的运动代码,在今年四月份,“擎天柱”的移动速度很慢。
研发人员演示了擎天柱机器人的行动成长轨迹。从2022年4月份迈出第一步,到2022年7月,让人形机器人解锁了骨盆的应用来保持平衡,2022年8月,让手臂开始发挥作用,直到2022年9月,擎天柱的脚趾也派上了用场,可以看出,随着人形机器人慢慢将更多的关节等利用起来并加以训练,它的移动速度有了明显提升。
6、行动控制系统:优化调参从测试映射至现实,解决机器人平衡难题
从人体步行的过程来看,机器人有身体上的自我意识很重要,如能意识到自己四肢的长度是多少、脚有多大,并且如何保持平衡,如何协调四肢运动。人类很容易就能做到这些,但对于机器人来说很难。
研发人员通过运动计划和控制堆栈,生成机器人运动学模型,然后将所需路径生成底层平台,让整个系统参考其轨迹进行训练。
机器人模拟系统中按照其期望的路径规划一条线路,不断添加相互连接的轨迹,并找到能让整个系统保持平衡。
在运动训练中,运动规划式是一个理想情形,但实际上将其放到现实世界上是不显示的。在这个过程中缺少几个关键动作,将其放置到现实世界中,会对模型动力学造成影响,特别是像两足动力学这样稳定的系统。
研发人员利用相应的传感器以及他们在现实世界中的观察来解决机器人的控制难题,机器人的骨盆位置、重心位置,使用更好的机器人模型来进行训练。
通过跟踪机器人在工作室中的路径来构建更好的机器人模型,并依据实际情况修正机器人的行为。
7、手部控制系统:人类模拟视频映射运动参考,掌握抓握物体位置
为了解决人形机器人在观察的同时操纵真实的物体世界的难题,研发人员将这一步骤分成了两个,首先生成一个自然运动参考系统,然后再将其进行优化推广。
假设有一个人类对某一动作进行了演示,然后研发人员通过视频对其动作设置关键帧,并将其映射到机器人上。这样只需要一个演示视频,研发人员就可以将其推广到机器人的现实操纵应用上。
这就可以解决机器人在抓取物体时手应该放在哪里,如何搬运放置等难题。
三、人形机器人发展仍有无限可能
人形机器人这一新物种自诞生起就引发了热烈讨论,今年已经有多家知名科技公司发布了人形机器人,前有小米“铁大”,现在特斯拉“擎天柱”在概念版亮相一年后,终于公布了可以走起来的工程版,同时在这次AI Day上,公布了十分完整的技术路线。
人形机器人因其技术集成度及难度都很高,被视作AI领域的终极形态,也将成为未来智能机器人的重点发展方向之一。
现如今,服务、工业、特种机器人已经深入到社会生活的方方面面,小至家庭中的扫地机器人,大到工厂配送、机械臂等。而人形机器人仍然是一个新鲜事物。
从其技术难度而言,人形机器人不同于其他机器人形态,代表了人们脑海中机器人的理想形态,其研发难度也可想而知。
特斯拉作为第一家将其摆上台面并在控制、步行方面都较为稳定的企业,离不开这家公司在自动驾驶领域的多年技术积累。事实上,自动驾驶技术中的神经网络架构、AI算法、激光雷达等都可以迁移至人形机器人研究中。
马斯克在第一届“AI Day”上曾说过:“我们的汽车是带轮子的半感知机器人——用神经网络识别世界,了解如何在世界中导航。”
再加上随着AI技术不断进步,伴随着人机交互能力加强,其具备的人形相比于其他机器人形态来说,能够更好的满足情感和陪伴需求,这也为人形机器人的发展带来了更多可能性。
谈及马斯克研发人形机器人的初衷,要追溯到四年前。马斯克认为特斯拉的工厂“过度依赖机器人”,并且在很多任务上,机器人的表现并不如人类。因此,“擎天柱”的初始应用场景也被他放到了代替人们从事枯燥、危险性的工作上。
结语:马斯克让人形机器人商业化之路可期
等了一年之久的“擎天柱”,终于出现在了大众视野中,这也成为特斯拉“AI Day”最受瞩目的环境。不过,其新奇的外观与性能并不是关键,对于人形机器人而言,其真正量产落地才是衡量这一新物种是否真正有价值的关键。
但从其能浇花、搬东西这些更为细致的功能来看,马斯克仍一直坚持着向拟人形态机器人不断进阶,从手部动作、步态调整、控制系统等,依托于特斯拉在汽车领域的强大技术积累,和基础设施及供应链。再加上马斯克在人形机器人领域的野心和他强大的行动力,为这一产业带来了无限憧憬。
马斯克在人形机器人亮相后说:“自动驾驶汽车对世界产生的巨大影响,使得运输生产力提升上至少提高了半个数量级,未来,擎天柱或许会带了数个数量级的提升。”
此前曾有爆料称特斯拉“擎天柱”预计2023年实现量产,计划在德州工厂部署数千台人形机器人,最终可能会扩展到全球数百万台。如果特斯拉的人形机器人能最终量产,并真正解决其落地难题,有望促进人形机器人的产业发展向前迈进一大步。