智东西(公众号:zhidxcom)
编译 | 程茜
编辑 | Panken
智东西1月21日消息,1月19日,瑞士苏黎世联邦理工学院的一项新成果登上国际学术顶刊Science(《科学》)的子刊Science Robotics(《科学·机器人学》)。研究人员推出一个类似机器狗的四足机器人,这个机器人能够结合外部感知和本体感知,爬上120米高的山仅需要31分钟,比人类徒步花费的时间还要快4分钟。
山上往往都由湿滑地面上的陡峭路段、高高的台阶、碎石和布满树根的森林小径组成,能在偏远和危险环境中自主操作的腿式机器人,将帮助人类探索海拔较高的未知领域。
外部感知对于快速和节能的运动至关重要,机器人在接触地形之前感知地形可以提前规划和适应步态,以保持速度和稳定性。
瑞士苏黎世联邦理工学院机器人系统实验室机器人学教授马可·赫特(Marco Hutter)领导的研究小组,联合学校的衍生公司ANYbotics,推出了商业化的腿式四足机器人ANYmal,这个机器人能够穿越多种类型的复杂地形。
▲ANYmal与其他四足机器人跨越障碍物对比
论文链接:https://www.science.org/doi/10.1126/scirobotics.abk2822
一、不依赖传感器,自主判断速度快慢
为了在困难的地形上前进,人类和动物会自动将其环境的视觉感知与他们的腿和手的本体感觉结合起来。这使他们能够轻松应对湿滑或松软的地面,并较容易地四处走动。不过,到目前为止,腿式机器人只能在有限的范围内做到这一点。
“原因是激光传感器和摄像头记录的有关直接环境的信息通常不完整且模棱两可。”赫特研究小组的博士生、该研究的主要作者三木崇弘(Takahiro Miki)解释说。
机器人能够利用外部感知来行动,是该项技术中的一项重大挑战。首先,山上的雪、植被和水表面的反射率高,机器人会将它们视为无法踩到或完全消失的障碍物;其次,由于山上有灰尘、雾气,能见度低,或者由于光线反射、植被遮挡机器人身上的传感器,这些都可能会导致传感器的感知度降低。
受这些因素影响,机器人腿部运动比较通用的解决方案是靠本体感觉,这也严重限制了其运动速度,因为机器人需要先亲身感受地形,然后再调整步态。
“这就是为什么像ANYmal这样的机器人必须能够自己决定,何时信任对环境的视觉感知并快速前进,何时最好谨慎行事,小步前进。”三木崇弘说。
▲ANYmal爬楼梯
二、控制器快速避障,10秒前进4米多
赫特领导的研究小组提出的这种更加通用的解决方案,他们整合了机器人腿部运动的外部感受和本体感受。研究人员开发的具有高鲁棒性和速度的腿式运动控制器,采用了基于注意力的循环编码器。该编码器可以集成本体感受和外部感受输入,并经过端到端的训练,让机器人学习无缝组合不同的感知模式。
“机器人已经学会将其环境的视觉感知与本体感觉,也就是基于直接的腿部接触的触觉结合起来。这使它能够更快、更有效地应对崎岖地形,最重要的是,更稳健。”赫特说,未来,ANYmal可以用于任何对人类来说太危险,或对其他机器人来说也难以通过的地方。
机器人在现实世界中实际行动之前,科学家们在虚拟训练营中为这个四足机器人设置了众多障碍,以便于它能找到克服多种障碍的理想方式,以及它何时可以依赖环境数据、何时可以忽略这些数据。
赫特说:“在实验中评估机器人外部感知很重要。”研究人员在模拟的附加实验中,他们还比较了各种阶梯和楼梯地形中,机器人行动的成功率,以进一步定量评估其性能。
▲ANYmal上楼梯
在评估过程中,研究人员向机器人发出0.7m/s的固定前进速度指令,持续10秒,并收集了300个实验数据来计算成功率。实验成功的标准是机器人的行动距离是否超过4米。研究结果显示,这个四足机器人的控制器性能明显优于基线,可以穿越更多类型的地形范围。
▲ANYmal于其他机器人行动对比
三、教师+学生模型训练,训练迭代1000个环境
研究小组还采用了教师-学生模式来对机器人进行训练。在训练过程中,赫特将信息策略的控制频率设置为50 Hz,每个环境收集250个时间段的轨迹数据,形成一次训练迭代。随后他们将模拟环境并行化,以同时执行1000个环境的训练。
对于教师模型,研究人员采用深度增强学习PPO算法,这个算法模型可以有效衡量机器人的步长。在将观察结果汇总观察之前,他们会使用运行平均值和标准偏差对其进行标准化,不同的实验会在每一次训练中以指数形式更新。
对于学生模型,赫特说:“我们在300个环境中进行了推广,并为一次训练迭代收集了400个时间段的轨迹。”并且在训练学生模型时,实验过程没有高度样本噪音干扰。
“通过这种训练,机器人能够在以前从未见过的情况下掌握最困难的自然地形。”赫特说,“即使直接环境中的传感器数据模棱两可或含糊不清,这也有效。”
▲ANYmal与其他四足机器人避障对比
根据赫特的说法,ANYmal会依靠其本体感觉安全行事,这样的话机器人行动就做到了两全其美,能够结合外部感知的速度和效率以及本体感知的安全性。
结语:机器人或能帮助人类探索未知领域
在实际应用场景中,ANYmal在自主探索狭窄隧道、洞穴和城市基础设施的地下系统的同时,还能自动快速地克服许多障碍物和困难地形。
机器人的快速避障和感知能力进一步提升,在未来,各种极端条件下,比如地震之后、核灾难之后或是森林火灾期间,对人类来说太危险以及其他机器人无法应对困难地形的地方,像ANYmal这样的机器人都可以派上大用场。
近年来,机器人研究的应用在不断扩展,机器人行动结合本体感受和外部感受等技术,都在解决很多机器人运动的难题,该领域未来在人类未知领域的探索应用场景可能会进一步扩大。
来源:Robohub、Science