智东西(公众号:zhidxcom)
编译 | 杨畅
编辑 | 李水青
智东西6月15日消息,据美国科技媒体Tech Xplore报道,麻省理工学院、MIT-IBM沃森人工智能实验室(MIT-IBM Watson AI Lab)和加州大学圣地亚哥分校的研究人员在今年5月的国际学习表征会议(The International Conference on Learning Representations)上公布了一款新的软体模拟仿真软件PlasticineLab,旨在让机器人进行更直观地学习。
机器人可以解魔方,可以在火星崎岖的地形中前行,但是它们很难完成一些简单的任务,比如擀面皮或者拿起一双筷子。即使有海量数据、清晰的说明和大规模训练,机器人在完成孩子们可以轻松完成的任务时还是存在困难。
研究人员通过将物理世界的知识构建到模拟器中,希望能够更轻松地训练机器人摆弄现实世界的经常弯曲变形不能复原的物体和材料。
在PlasticineLab中,机器人通过模拟操纵各种柔软的物体来感知学习如何完成一系列特定的任务。擀面杖测试中,目标是让机器人通过按压或滚动擀面杖压平一块面团;绳索测试中,是要机器人完成将绳子缠绕到柱子上;在筷子测试中,是要机器人用筷子夹起一根绳子并移动到目标位置。
研究人员表示他们通过将现实世界中的物理知识嵌入模拟器来进行感知训练,比在强化学习(Reinforcement Learning)算法下进行感知学习,可以让机器人更快地完成这些和其他任务。这也使研究人员能够利用基于梯度下降的优化技术来找到最佳的解决方案。
“将物理学基本知识写入模拟器中,可以使机器人学习过程更高效。”该研究的主要负责人、前MIT-IBM沃森人工智能实验室实习生、现在是加州大学圣地亚哥分校博士生的Zhiao Huang说:“这让机器人对现实世界有更直观的感知,了解现实世界充满有生命的和可变形的物体。”
“机器人可能需要经过数千次迭代才能通过强化学习中的试错技术来掌握一项任务,而这种强化学习方法通常用于在模拟中训练机器人。”该研究的资深作者,IBM研究员Chuang Gan说:“我们通过补充一些物理知识可以更快完成机器人的训练,允许机器人使用基于梯度的规划算法来学习。”
通过名为太极(Taichi)的图形编程语言,研究人员将基本物理方程融入到PlasticineLab中。TaiChi和早期的PlasticineLab模拟器乾坤(ChainQueen)都是由合作者Yuanming Hu开发的。通过使用基于梯度的规划算法,在PlasticineLab中机器人能够不断地将其目标与其在该点上所做的运动进行比较,从而更快地修正路线。
“与用于训练神经网络的技术相同,我们可以通过反向传播找到最佳解决方案。”研究合作者、麻省理工博士生Tao Du说:“反向传播为机器人提供了更新其所需的反馈,使机器人更快地实现其目标。”
这项工作是一项持续研究的一部分,旨在赋予机器人更多的常识,以便他们有一天能够在现实世界中做饭、打扫、叠衣服和执行其他日常的任务。
结语:当机器人“懂了”物理知识,能做的更多了
仿真模拟软件是开发和评估技能学习算法的主要驱动力之一,现有的模拟环境软件通常只能模拟刚体操作,PlasticineLab的出现使模拟软体操作成为可能。
机器人可以完成的事情越来越多了,无论是模仿人类动作还是超越人类表现方面,都有很多新进展。除了科学家要懂物理知识给机器人制造硬件外壳之外,机器人进行机器学习训练的数据中也融入物理知识,来实现以前不能实现的动作。可能人类看来很简单的动作,要让机器人完成并不容易。众多科学家的努力让机器人能做的更多了。
来源:Tech Xplore