AI助两足机器人自学走路,还能旋转跳跃加速度

智东西(公众号:zhidxcom)
编译 | 熊大宝
编辑 | 李水青

智东西4月19日消息,近日,加州大学伯克利分校的研究团队打造了一个两条腿的机器人Cassie(凯西),它可以通过AI强化学习自己学会走路,而非直接编程或模仿来学习。

相比传统经典模型法,强化学习无需建模,而是通过AI学习框架让Cassie以“试错”的方式进行自主训练,类似于婴儿学走路,主动适应环境渐渐执行敏捷、稳定、多样化的行走动作。行走之外,Cassie还会不断学习跑步、跳跃等新技能,还可实现自动调速功能。

未来,基于AI强化学习这一技术,运动机器人也将更为敏捷。

一、AI模拟训练学走路,无需婴儿般跌倒重来

双足机器人Cassie类似我们的腿部外形,因此相比其他形状的机器人更容易进入为人类设计的城市环境之中。

为帮助Cassie像人类一样学会自主行走,研究团队将这个过程想象为如婴儿学走路一般。婴儿虽然不会直接学会站立行走,但他们能通过一次次的站立、跌倒、迈步中记住步行的步骤,最终学会直立行走。

AI助两足机器人自学走路,还能旋转跳跃加速度

Cassie学走路也是如此。但为防止机器人在学习过程中跌倒损坏实际硬件,研究团队利用模拟到真实的传输技术,在模拟环境中训练,在高保真度的模拟器中进行评估,最终部署到Cassie机器人上。

在模拟中,机器人接受了描述直立行走等目标的信息后,AI引擎可以帮助其记住步行步骤,以此为基础添加更多信息,最终学会直立行走。此外,它还可以学会如何在轻微滑倒时防止摔倒,或从侧面被推倒时如何恢复。

一旦机器人在模拟中学会走路,研究人员便将此知识移植给Cassie,进行实际操作。后续实践中,研究人员计划继续在机器人中进行强化学习,看看它能走多远。

二、步态库中强化学习让步伐更灵活稳健

研究团队基于强化学习( Reinforcement Learning;RL)方法,希望让Cassie通过系统学习法学会更敏捷的行走。强化学习又称增强学习、评价学习,是智能体以“试错”的方式进行学习,在环境交互中达成特定目的。

在此之前,研究者往往通过机械建模控制双足机器人行走,然而这种方式难以对复杂地面进行建模,机器人缺乏适应环境变化的能力和运动稳定性。

AI助两足机器人自学走路,还能旋转跳跃加速度

▲基于强化学习的步行控制器

RL方法训练策略可以让机器人模拟步态库中的步态,通过随机训练增加其行为的多样性。这种多样性的增加,能够让Cassie应对以往无法建模的地面摩擦变化等环境因素,在随机环境下保持灵活稳健性。

AI追踪行走环境步行速度高度自动调

基于RL方法,研究人员建立了一种自适应调速步行控制器。

这种控制器能够通过AI追踪Cassie的步行环境,并给其适当的行走策略。

AI助两足机器人自学走路,还能旋转跳跃加速度

▲Cassie在不同场景下的行走策略

在实验中,Cassie能够执行各种敏捷行为,如快进和后退行走、侧身行走、改变行走高度,还能够在偏航时进行转身操作。

此外,Cassie还能够从路障等外界随机扰动中恢复。

结语AI强化学习助机器人运动更敏捷

基于步态库的参考运动,AI强化学习可以帮助两足机器人学习步行、转弯、下蹲等运动状态,跟踪其行走环境以达到自动调速、转弯等功能,让机器人在运动中更好的达到灵活性和稳健性。

未来,AI强化学习还将在此基础上,助力两足机器人及其他机器人学习更多动态、敏捷的行为,助其在复杂的未知环境下仍能应对自如。

来源:Tech Xplore