丰田研究院亮出机器人AI大招，无须人工编码，利用触觉高效学习新技能

智东西（公众号：zhidxcom）
编译 | 陈佳慧
编辑 | 徐珊

智东西9月21日消息，据The Verge报道，丰田研究院（TRI）成功研发出一种突破性的生成式AI技术即机器人行为模型，在“机器人幼儿园”中教导机器人各种灵巧的技能。该机器人行为模型基于AI的扩散策略，可以在数十次新技能的演示后学习新技能。

运用该机器人行为模型，能让机器人产出一致性强、可重复和高性能的结果。而且机器人学习和产出的速度极快，不再需要人工来进行编码和修复编码错误，提高了机器人的实用性，也在构建机器人大型行为模型（LBM）方向上迈进了一步。

一、机器人也上学，通过机器人行为模型掌握超60项挑战性技能

据TOYOTA官网公告，以前，教机器人新行为的技术进展缓慢、效率较低，而且一般在执行任务时有很多限制性条件，所执行的任务也是非常具体和细节的。机器人专家需要花费大量时间编写复杂的代码，可能还要不断修改代码错误，以此为机器人添加新行为。

现在，有了机器人行为模型。研究员认为，触觉是这个机器人行为模型的关键要素。他们给机器人提供了一种大拇指般大小的触觉传感器，能够让机器人通过触觉来感知和学习，从而像人类一样更轻松地执行各种复杂任务。据The Verge报道，研究人员就曾在“机器人幼儿园”教机器人如何做早餐。

“机器人幼儿园”的运作方式是，首先由一位“老师”展示一套技能，然后机器人的模型在后台学习几个小时，最后机器人成功形成新的工作行为。丰田研究院的灵巧操纵实验室经理Ben Burchfiel说，他们经常是在下午教机器人，让它学习一晚上，第二天早上就可以来看到它的新行为了。

到目前为止，研究人员已经使用机器人行为模型，成功培训机器人获得了超过60项具有挑战性的技能，例如倒液体、使用工具以及操控可变形物体等。并且他们希望在2024年底前将这个数字增加到1000项。

丰田研究院亮出机器人AI大招，无须人工编码，利用触觉高效学习新技能

▲机器人搅拌液体（图源：TOYOTA官网）

丰田研究院的研究人员在研发出现在的机器人行为模型后，还试图为机器人创建大型行为模型。丰田研究院机器人研究副总裁Russ Tedrake说，大型行为模型与大语言模型类似，是通过观察来学习，然后能够执行从没有教过的新技能。

谷歌在其AI学习模型机器人变压器RT-2的研发中，其实也在研究类似的技术。与丰田研究人员的方法类似，他们的机器人利用自己获得的经验来推断如何执行任务。从理论上讲，经过AI训练的机器人最终可以实现，只给出一个大致方向，而不需要任何具体的行动指令就可以完成任务，例如“清理那个溢出的东西”。

不过，根据纽约时报报道，谷歌的机器人研发还有很长的路要走。同时，泰晤士报也称，研究工作通常是“缓慢而费力的”，提供足够的训练数据比向AI模型提供从互联网下载的数据要难得多。

丰田研究院的机器人行为模型让机器人获得了触觉，相比于从前训练机器人的人工编码和错误查找，新模型不仅减少了人力付出，也提高了机器人学习新技能的速度，让机器人能够帮助人们更快、更好地完成更多任务。

而丰田研究院研究人员称，他们正在构建机器人大型行为模型，谷歌也在不断尝试开发类似技术。有了现在的机器人行为模型的出现，在研究院与科技公司的探索下，未来机器人大型行为模型或许也有可能成为现实，机器人通过观察自主拓展新技能也有可能实现。

来源：The Verge