谷歌AI新进展:机器手学会旋转小球,只需训练2.7小时

智东西(公众号:zhidxcom)
编 | 李水青

智东西9月28日消息,近日,谷歌大脑发布了一项深度动力模型成果,能支持机器手做精细的动作。据称,他们的方法能使机器手仅利用三个小时实践获得的数据,就学会旋转小球等动作。

谷歌AI新进展:机器手学会旋转小球,只需训练2.7小时

谷歌新研发的系统是以腾讯、OpenAI等众多相关的AI研究为基础建成的。据称,研究人员打算尽快将代码开源。

一、训练2.7小时就会转保定球

在研究人员用这套系统执行拾起放任务的过程中,最困难的一项任务是将两个保定球绕着手掌旋转而不掉落,但研究人员的模型仅使用了100,000个(或训练2.7小时)数据点的数据,就能完成这一任务。

在一个保定球的分支实验中,该团队改变了模型的用途。结果,该模型无需接受额外的培训,就能完成新的任务,包括将单个球放到目标位置、改变旋转的方向等等。它能成功地将两个球旋转90度和180度,成功率分别为100%和54%。

后续测试旨在研究其系统的灵活性,该团队在模拟环境中进行了手写实验。该方法将三维模型与特定任务分离,从而可以将算法沿用到其他的任务中,而不是记住特定任务的答案。

二、数据需求小,切换任务也奏效

“无物理模型的机器学习方法可以在学习复杂任务上很好地奏效。但是,当任务对机械手的灵活性要求提高时,即使是最先进的这类算法也会遇到困难。”论文合著者写道。

“任务联动的复杂性和任务的高失败率都使整体技术更加难以突破。无物理模型方法对数据需求量很大,因此很难在现实世界中使用。在这个项目中,我们旨在突破这种任务复杂性的界限。”

最终,团队将所谓的“不确定”的AI模型与最先进的轨迹优化结合起来,使用强化学习训练机器手。

每一个动作都会通过机器学习模型被计算下来,作为平均预测的奖励,该模型可用于优化待做动作的序列。机器手只执行第一个动作,然后接收更新的状态信息并在接下来的步骤中重新计划动作。

谷歌AI新进展:机器手学会旋转小球,只需训练2.7小时

研究人员指出,这种根据反馈重新计划下一次动作的方法具有防止错误累积的优点,能降低误差。此外,使用他们的方法,机器人在中途切换新任务之后,之前的训练数据仍会奏效。

三、集腾讯、OpenAI多家之长

谷歌新研发的系统是以众多机器手相关的AI研究为基础建成的。

其中,包括腾讯近期一项关于五指魔方的立方体求解器研究。另外,OpenAI在去年七月份也介绍了一种系统,它能够以最先进的精度指导机器手抓握和操作对象。

去年九月,麻省理工学院CSAIL小组提出了一种名为“ 密集物体网”的计算机视觉系统,该系统使机器人能够检查、看懂并操纵它们没见过的物体。

就谷歌自己而言,它在年初就与哥伦比亚普林斯顿大学和麻省理工学院的研究人员合作,开发了一种被称为TossBot的捡拾机器人,能够抓取物体并扔进盒子里。

谷歌AI新进展:机器手学会旋转小球,只需训练2.7小时

结语:新方法开创性地使机器手执行灵活任务

论文写道:“基于深度模型的方法挑战了惯有的观念,即模型难以学习且尚不能提供像无物理模型方法一样好的控制结果。在我们的操作任务模拟套件中,在学习速度和最终性能方面,它始终优于先前的方法,能开创性地执行很多灵活任务。”

“据我们所知我们首次证明,深层神经网络模型确实可以使机械臂高效地利用数据样本,自动探索精细的运动技能。”

文章来源:Venture beat