智东西(公众号:zhidxcom)
编 | 王颖

导语:谷歌宣布重启机器人计划,使用AI教会机器人抓握物品,开发机器人自主学习技能的方法。

智东西3月27日消息,谷歌宣布重启机器人计划,重新考虑对复杂机器人技术的关注,这项新工作在谷歌被称为Robotics。

2013年,谷歌花费了数千万美元购买了美国和日本的六家机器人初创企业,包括两个专门研究与人类相似的机器的团队。但接下来的几年里将收购的公司陆续变卖或关闭,波士顿动力公司被日本企业收购后仍在研制能像人或动物一样移动的机器人。

目前机器人已经在仓库和工厂车间使用,但它们只能处理特定任务,例如拾取特定物体或转动螺丝。谷歌希望机器能够自主学习,使用人工智能为未来能够学习投掷、滑动、旋转、摆动、捕捉和其他运动技能的系统奠定基础,这些技能目前对最有能力的机器都构成了挑战。

虽然这些机器可能不像人形机器人那样引人注目,但谷歌的研究人员认为,内在的更先进的技术使它们在现实世界中具有更大的潜力。谷歌正在开发这些机器人自主学习技能的方法,例如在一堆不熟悉的物体中准确抓取目标物,或者在一个充满障碍物的仓库中导航。

谷歌学生研究员Andy Zeng在博客中写道:“尽管在使机器人能够高效地抓取物体、视觉自适应甚至从现实世界中学习方面已经取得了相当大的进步,但机器人操作仍然需要仔细考虑它们如何拾取、处理和放置各种物体——尤其是在非结构化环境中。”但是仍不确定机器人是否能将动态变化形成物理直觉有效的完成任务。

Andy Zeng和他的同事们与普林斯顿、哥伦比亚和麻省理工学院的研究人员合作开发了拾取机器人TossingBot,这种机器人可以学习抓取物体,将物体扔进目标盒子里。它实现了两倍的有效放置范围,还可以通过自我监督提高。

可预见性投掷对人类而言也非易事,抓握、姿势、质量、空气阻力、摩擦力、空气动力学以及无数其他变量会影响物体的轨迹。Andy Zeng指出,通过反复试验对射弹物理进行建模是可能的,但计算成本高,需要大量时间,并且很难形成普遍的规律。

TossingBot 使用投射弹道模型来估计将一个物体送到目标位置所需的速度,并使用端到端的神经网络,来模拟生物神经元的数学函数层,也就是通过从高架摄像机获得的视觉和深度数据进行训练,来预测在估计值之上的调整。这种混合方法使系统的投掷准确率达到85% 。

 

谷歌重启机器人计划 用AI教机器人拿东西

研究人员让TossingBot首先尝试错误的抓取,再教会机器人抓取正确物品,偶尔随机让TossingBot投掷没有测试过的物体,变换测试速度进行训练来提高其学习能力。经过大约14个小时的10,000次抓握和投掷尝试后,TossingBot可以在87%的时间内牢牢抓住杂乱堆中的物体。

经过一两个小时的训练,TossingBot 可以适应从未见过的地点和物品,如假水果、装饰物品、办公室物品。

Andy Zeng表示,TossingBot可能学会更多地依赖几何线索(例如形状)来学习抓握和投掷,这些新出现的特征是在没有任何明确监督的情况下从零开始学习的,超出了任务级别的抓取和投掷。但TossingBot足以区分对象类别(乒乓球和记号笔)。

TossingBot 还没有用易碎物体进行过测试,它使用严格的视觉数据作为输入,这可能妨碍了它在测试中对新物体做出反应的能力。但研究人员表示将物理学和深度学习结合起来的基本构想是未来工作的一个有希望的方向。

 

原文来自:VentureBeat、TheNewYorkTimes