智东西(公众号:zhidxcom)
编 | 伟鸿

导语:OpenAI智能机械手臂发布,50小时便可搜集100年的经验

当你还是个婴儿的时候,用手抓东西是你学会做的第一件事,但这绝不是一件简单的事情,它只会随着你的成长而变得更加复杂多变。这种复杂性使得机器很难自学,但是Elon Musk和Sam altman创立的OpenAI公司的研究人员已经创造了一个系统,它不仅能像人类一样持有和操纵物体,而且还发展出了属于它自己的行为。

许多机器人和机械手已经精通某些抓握的动作——在工厂里的机器人能比人更灵巧地使用螺栓枪。但是让机器人完成这项任务的程序是人类编写的,而且仅适用于某项特定工作。例如,你不能给工厂的机器人一支铅笔,让它完成书写工作。即使是在同一条生产线上,不同的工作也需要不同的软件支持。

然而,对于一个人来说,拿起一个苹果和拿起一个杯子没什么区别。差异固然存在,但是我们的大脑会自动地处理差异信息。比如我们可以随机应变,安全地握起一个不熟悉的物体。在这个方面,机器人做的还远远不如人类。此外,你不能仅仅训练机器人做一件工作——你必须提供数百万个例子来充分展示人类的工作技能。

OpenAI的研究人员认为,解决方案根本不是使用人类数据。取而代之的是,让机器人的计算机在模拟中反复尝试,慢慢地学习如何移动手指,以便机器人控制的对象能够按要求移动。

这项系统被他们成为Dactyl,只提供机器人手指的位置和三种手持物体的视角,并且在训练时,所有的数据都是在虚拟环境中进行模拟的。在虚拟环境中,计算机不需要实时工作,在几秒的时间里,它就可以尝试上千种不同的方法抓住目标物体,分析结果并将数据反馈到下一次尝试中。Dactyl使用与OpenAI 5相同的通用增强学习算法和代码从头学习。结果表明,在模拟环境中训练机器人,让他们解决现实世界的任务是完全可行的。

除了需要学习抓握不同物体和姿势之外,还有许多随机参数,比如指尖的摩擦力、场景的颜色和灯光等等。目前还不能做到完全模拟现实,但可以确保你的系统不只是在一个带有特殊标记的蓝色实验室里工作。

研究团队在这个问题上投入了大量的力量:6144个CPU和8个GPU,在50个小时内收集了大约100年的经验。然后他们将这个系统首次应用到现实世界中,初次应用,它就展示了一些令人惊讶的类人行为。

OpenAI全新机械手臂曝光,高效、独立、自我进化

人类在不经意间的行为,比如把一个苹果转过来检查是否擦伤,或者把咖啡递给朋友,其中包含了许多细微的技巧来稳定手中的物体。而Dactyl已经重建了数个,比如用拇指和中指固定物体,然后用剩余的手指将物体转到需要的方向。

这个系统的伟大之处在于它运动的自然性,以及它是通过机器反复试验而独立完成的,与任何特定的形状或物体类型无关。就像人类一样,可以控制和操纵你放在它手里的任何东西,这理所应当。

OpenAI全新机械手臂曝光,高效、独立、自我进化

这种灵活性被称为感念泛化,对于必须与现实世界交互的机器人来说,这一点是至关重要的。想要对现实中的所有的场景和物体进行手工编码是不可能的,但机器人能够在依赖这套系统核心理解的前提下适应并填补这些空白。这项技术使OpenAI的机器人和人类一样,有了自我学习的能力,在面对多种未知的环境下能进化出合适的行为模式。总得来说,OpenAI 提出的“将模拟环境的成果应用到现实世界”会是开发通用机器人的有效解决方案之一。

文章来源:techcrunch

OpenAI全新机械手臂曝光,高效、独立、自我进化