AI机器人必须跨过一道难关:至少比婴儿聪明

智东西(公众号:zhidxcom)
文|海中天

机器已经可以理解语音,可以识别面部图像,感知汽车安全性,看起来最近一段时间技术取得了很大突破,已经变得相当强大。如果AI希望获得革命性的突破,制造出像人类一样的机器人,首先AI必须像孩子一样学习。

“最近一段时间,AI行业的思考重点开始转移:以前大家试图设计出一套系统,让它可以做成人能做的事,现在大家意识到如果想开发系统,让它灵活强大,可以做成人做的事情,首先要开发出可以像婴儿、孩子一样学习的系统。”加州大学伯克利分校发展心理学家阿里森·高普尼克(Alison Gopnik)说,“如果将现在电脑所能做的事与10年前对比,就会发现电脑取得了很大的进步,如果将它与4岁的孩子对比,就会发现差距还很大。”

婴儿与孩子会构建与世界有关的理论,科学家用同样的方法构建科学理论。婴儿与孩子会不断努力,这种努力是系统性、实验性的,它对学习至关重要,孩子用这种方式探索自己所处的环境,了解环境中的人。

AI机器人必须跨过一道难关:至少比婴儿聪明

孩子越小学习能力越强

最近,高普尼克与一个研究团队携手合作,发现在相同的统计数据条件下,15个月大的婴儿比年长的孩子更容易理解因果效应。婴儿和年轻孩子的学习能力更强,因为它们的大脑更具弹性,可塑性更强,他们没有被预先存在的知识所污染,因此在接受信息时更加开放。大脑并不是一成不变的,每学习一次就会改变一点。

将发展心理学、计算机科学结合起来,人类也许可以搞清世界上那些最棒的大脑是如何运行的,并将这种计算能力放进机器。就目前而言,AI需要庞大的数据来提取模式、获得结论。

孩子对周围世界的了解很少,他们用统计评估方式学习——也就是所谓的“贝叶斯学习”。换言之,孩子的理解并不是根据结果的已知频率做出的,相反,它以现有知识推断可能性,当接受到新信息时,孩子会不断调整。

高普尼克说:“孩子第一次看到新东西时,或者第一次听到新单词时,他们已经对新单词的意思有了不错的理解,对单词的使用也有了不错的理解,这才是最惊人的地方。即使没有太多的数据,孩子也可以有效学习,贝叶斯方法能够很好解释原因。”

孩子用概率性模型形成各种假设,这些假设将概率、可能性结合在一起,得出结论。当大脑越来越成熟,为了执行复杂的任务,大脑越来越专业化,结果导致大脑的敏捷性下降,随着时间的推移越来越难改变。当人渐渐长大,对世界的理解加深,某些神经连接会更强,大脑就会形成基本观点,此时大脑形成假定的能力、从少量信息提取理论的能力会受到压制。一般来说,5岁以下的婴儿和孩子都会经历这一转变过程。

AI机器人必须跨过一道难关:至少比婴儿聪明

“有得必有失,你知道得越多越难考虑新的可能性。”高普尼克表示,“你知道越多,你对已知知识的依赖也就越大,不再那么开放。从进化的角度来看,婴儿知道的东西不多,所以学习新东西的能力更强。”

在孩子出生的前几年,每几秒钟就会有700个新的神经结形成,大脑极富弹性,可以处理迅速增加的信息,这些信息来自环境、社会互动。大脑早期的可塑性很强,与成人相比,小孩重新构建大脑架构更容易一些。在孩子的成长过程中,贝叶斯学习已经成为一种强有力的工具,计算机科学家现在用它重新设计智能学习机器。

MIT大脑认知科学教授、计算机认知科学家约书亚·泰拉贝尔(Joshua Tenenbaum)表示:“贝叶斯数学努力理解孩子学习的秘诀。”他与高普尼克携手合作,将计算机与心理学融合在一起。泰拉贝尔说:“孩子进入一个新世界,那里已经有基本建造块,这些块可以帮助我们理解一些复杂的概念,然后我们还要学习获得最初建造块的机制和原理,根据零散数据做推断,得出因果推论。”

AI软件有多聪明?

不论处在怎样的发展阶段,人脑都需要通过一系列感知系统了解世界:视觉、听觉、嗅觉、味道、触觉、空间方位、平衡。如果获得的数据有限,大脑会填充空白区。虽然婴儿的大脑可能会缺少一种或者几种感知功能,但是它们在处理信息时更加敏捷。

泰拉贝尔说:“孩子像科学家一样学着理解世界,比如形成理论、做实验、玩耍、看看自己能发现什么,积极思考,寻找验证理论的最佳方法,对预料之外的事情做出反应,努力搞清什么是错误的什么是正确的。”

泰拉贝尔与一个研究团队合作,这个团队的成员来自纽约大学、多伦多大学,他们携手设计AI软件,该软件可以用更高效、更复杂的方式获得新知识。2015年12月,团队的研究成果发表在《科学》杂志上,论文谈到了如何编写机器学习算法,让计算机可以像人一样处理信息。

看了一个范例之后,新的AI程序可以识别手写字符,精准度和人类一样。通过贝叶斯程序学习框架,凡是之前看过至少一次的手写字符,软件都会为它们生成一套独特的程序。当机器面对不熟悉的字符时,算法的独特功能才真正显露出来。

此时算法不会查找自己的数据库,看看有没有匹配的,相反,它会将字符(之前看过的字符)的部件和子部件结合起来,形成一种新的字符,然后用概率程序测试假定的正确性。婴儿也是这样学习的,虽然数据有限,当婴儿看到的字符或者对象是之前没有看到过的,他会从有限数据中提取丰富的概念。

孩子可以形成原假设,并在形成的过程中自动学习,目前软件还无法模拟这种能力。一旦科学家设计出软件,可以生成原假设和真正目标,例如,程序自己产生“欲望”,渴望识别手写字符,而不是在研究人员的指引下进行,此时AI就会出现巨大的飞跃。如果不能用自己生成的目标驱动,AI系统的自动化能力始终会受到限制。

“用越来越多的数据持续学习,这是每一个AI系统都想达成的目标。”泰拉贝尔表示,“问题在于自动学习很困难。总会有一个人掌控一切,他决定给予系统多少数据,给予哪类数据。”

婴儿自己会做出选择。让AI自己为学习流程组建架构,这是一个公开的挑战。目前的AI系统没有任何目标,如果没有任何目标,就没有办法自己学习。在人类的指引下,机器人可以捡起盒子,看到他们完成任务,我们会赞叹,因为它做了人类正在做的事。尽管如此,机器人无法像孩子一样进行复杂的思考。

泰拉贝尔与同事在虚拟神经网络上部署机器学习算法,它可以深度模拟人类大脑的运行原理。当机器识别对象时,它需要搜索庞大的数据集,寻找匹配的数据,从而达到识别对象的目的。人类不同,人类依赖更高形式的感知功能解释对象的内容。

“我们正在尝试编写计算机程序,它相当于大脑软件,我们也可以管它叫意识。”泰拉贝尔表示,“意识就是软件,它在大脑硬件上运行,我们试图在软件层面上构建它。AI中的神经网络相当于软件层面的计算机程序。”

2013年,美国国家科学基金会向MIT提供2500万美元赞助资金,为期5年,让它建立一个脑、意识和机器研究中心(Center for Brains, Minds and Machines)。来自不同领域的科学家、工程师携手合作,深入研究大脑执行复杂运算的原理,他们希望能够开发出智能机器,让它接近人类智力。

“直到最近,我们才有了可以达成目标的数学理论和计算机模型。”泰拉贝尔说,“我们需要更多的资源、聪明人、企业、技术,可能还需要更快的计算机。我们可能需要等待,或者依赖其它工程突破才能获得年轻小孩一样的智力。”

AI机器人必须跨过一道难关:至少比婴儿聪明

模拟婴儿BabyX

新西兰奥克兰大学生物工程研究所也在努力缩小大脑与机器的差距,它开发了一个模拟互动婴儿。马克·塞格尔(Mark Sagar)是生物工程研究所动画技术实验室的主管、创始人,他曾为《阿凡达》、《金刚》等电影制作动画,获得了许多奖项。在实验室内有一块3D电脑屏幕,在屏幕上,塞格尔与一个金发孩子玩躲猫猫游戏,这套系统名叫BabyX,它可以学习、思考、生成面部表情、自主做出回应。

最开始时,塞格尔在MIT工作,从事身体组件医学模拟研究,在那里,他对数字面部技术深入研究,并利用该技术开发了BabyX。塞格尔开发的动画AI可以模拟他的面部表情,可以将简单的单词大声读出来,可以识别对象,可以玩一些经典视频游戏,随着时间的推移,BabyX越来越聪明。事实上,BabyX不只是塞格尔的“大脑婴儿”,它还是塞格尔女儿的模型。

为了构建BabyX,在女儿6个月、18个月、24个月大时,塞格尔为女儿做了扫描,然后将信息上传到系统。通过动画技术(相当于早期AI技术),他复制了女儿的行为、面部表情、声音。在谈话过程中,塞格尔将BabyX称为“她”,他还解释了BabyX的能力,BabyX通过光纤线缆运行,线缆由模拟神经活动驱动,类似于连接大脑的脊髓。因为BabyX是一个AI互动替身,它可以学习,获取信息,与之前的系统不太相同。

塞格尔表示:“我们的开发方法与大多数人不同。在神经系统科学、感知科学中,有许多理论彼此竞争,我们目前掌握的知识只是冰山一角。一些方法受到了生物学的启迪,在研究过程中最困难的部分(也是最有趣的部分)在于:按不同程度进行交互作用,从中能够生成多高程度的认知能力?”

团队测试了BabyX对人类互动的反应。BabyX可以处理人类情绪,可以理解动作背后的意义,过去BabyX与塞格尔有过互动,它会从过往互动中学习,然后给出正确的回应。屏幕上面显示的是BabyX的脸,脸的背后是脑部实时模拟系统,它可以提示面部模拟图像,让它向观众眨眼或者微笑。塞格尔相信,要开发出有效的互动AI,面部是关键,因为它可以反应脑部和意识的状态。例如,即使只是一个简单的微笑,也是由复杂、互相编织的系统控制的,这些系统与大脑连接在一起。

“通过将用户的动作与BabyX的动作联系起来,BabyX不断学习。”塞格尔解释说,“例如,在学习过程中如果听到婴儿发出的咿哑声,BabyX会控制引擎移动脸部或者手臂。如果用户给出的反应很相似,代表BabyX动作的神经元就会与响应用户动作的神经元联系起来,通过一种名叫Hebbian学习的方法联系在一起。神经元彼此交互,融为一体。”

流程不断重复,新的神经连接就会在BabyX的模拟大脑中构建图谱,将BabyX的动作与用户的动作匹配,为更高层次的模拟奠定基础。人类大脑的运作形式与此类似。每完成一个动作,大脑都会形成新的连接,这种连接会在重复过程中强化。

在处理环境的过程中大脑会生成信息,最终模拟婴儿不断学习,利用信息形成回应。从本质上讲,BabyX就是在利用不断改进的代码持续学习。

人类大脑处理信息,在大脑内部产生化学反应,比如生成多巴胺或者催产素,BabyX的算法需要模拟、解释这一过程。当BabyX无法理解某个词汇或者动作时,它会表达自己的困惑,如果正确读出一个词汇,它会愉快地笑起来。神经系统由算法控制,在算法的支持下,BabyX可以模拟、形成一套奖赏系统,通过互动、演示学习新的信息。

“生物式行为、情绪、认知运算模式如何与动画整合,尤其是在面部整合,这是我们想探索的领域。”塞格尔说,“对于人类体验的许多方面来说,面部都是关键连接点。未来我们可能会与更复杂、更自主的技术互动,使用它们,探索学习、心智发展的基本面对于这一目标的实现相当关键。”

面部是沟通的主要手段之一,塞格尔希望自己的“孩子”可以为未来的健康、教育应用奠定基础,程序可以与患有孤独症、存在社交障碍的孩子互动。开发一套系统,它可以识别人类的情绪并进行处理,理解人类的感受,这就是AI研究的目标,我们渴望建造一个大脑,让它可以自己思考,正如我们从出生那天起所做的一样。
AI机器人必须跨过一道难关:至少比婴儿聪明