AI机器人必须跨过一道难关：至少比婴儿聪明

智东西（公众号：zhidxcom）
文｜海中天

机器已经可以理解语音，可以识别面部图像，感知汽车安全性，看起来最近一段时间技术取得了很大突破，已经变得相当强大。如果AI希望获得革命性的突破，制造出像人类一样的机器人，首先AI必须像孩子一样学习。

“最近一段时间，AI行业的思考重点开始转移：以前大家试图设计出一套系统，让它可以做成人能做的事，现在大家意识到如果想开发系统，让它灵活强大，可以做成人做的事情，首先要开发出可以像婴儿、孩子一样学习的系统。”加州大学伯克利分校发展心理学家阿里森·高普尼克（Alison Gopnik）说，“如果将现在电脑所能做的事与10年前对比，就会发现电脑取得了很大的进步，如果将它与4岁的孩子对比，就会发现差距还很大。”

婴儿与孩子会构建与世界有关的理论，科学家用同样的方法构建科学理论。婴儿与孩子会不断努力，这种努力是系统性、实验性的，它对学习至关重要，孩子用这种方式探索自己所处的环境，了解环境中的人。

孩子越小学习能力越强

最近，高普尼克与一个研究团队携手合作，发现在相同的统计数据条件下，15个月大的婴儿比年长的孩子更容易理解因果效应。婴儿和年轻孩子的学习能力更强，因为它们的大脑更具弹性，可塑性更强，他们没有被预先存在的知识所污染，因此在接受信息时更加开放。大脑并不是一成不变的，每学习一次就会改变一点。

将发展心理学、计算机科学结合起来，人类也许可以搞清世界上那些最棒的大脑是如何运行的，并将这种计算能力放进机器。就目前而言，AI需要庞大的数据来提取模式、获得结论。

孩子对周围世界的了解很少，他们用统计评估方式学习——也就是所谓的“贝叶斯学习”。换言之，孩子的理解并不是根据结果的已知频率做出的，相反，它以现有知识推断可能性，当接受到新信息时，孩子会不断调整。

高普尼克说：“孩子第一次看到新东西时，或者第一次听到新单词时，他们已经对新单词的意思有了不错的理解，对单词的使用也有了不错的理解，这才是最惊人的地方。即使没有太多的数据，孩子也可以有效学习，贝叶斯方法能够很好解释原因。”

孩子用概率性模型形成各种假设，这些假设将概率、可能性结合在一起，得出结论。当大脑越来越成熟，为了执行复杂的任务，大脑越来越专业化，结果导致大脑的敏捷性下降，随着时间的推移越来越难改变。当人渐渐长大，对世界的理解加深，某些神经连接会更强，大脑就会形成基本观点，此时大脑形成假定的能力、从少量信息提取理论的能力会受到压制。一般来说，5岁以下的婴儿和孩子都会经历这一转变过程。

“有得必有失，你知道得越多越难考虑新的可能性。”高普尼克表示，“你知道越多，你对已知知识的依赖也就越大，不再那么开放。从进化的角度来看，婴儿知道的东西不多，所以学习新东西的能力更强。”

在孩子出生的前几年，每几秒钟就会有700个新的神经结形成，大脑极富弹性，可以处理迅速增加的信息，这些信息来自环境、社会互动。大脑早期的可塑性很强，与成人相比，小孩重新构建大脑架构更容易一些。在孩子的成长过程中，贝叶斯学习已经成为一种强有力的工具，计算机科学家现在用它重新设计智能学习机器。

MIT大脑认知科学教授、计算机认知科学家约书亚·泰拉贝尔（Joshua Tenenbaum）表示：“贝叶斯数学努力理解孩子学习的秘诀。”他与高普尼克携手合作，将计算机与心理学融合在一起。泰拉贝尔说：“孩子进入一个新世界，那里已经有基本建造块，这些块可以帮助我们理解一些复杂的概念，然后我们还要学习获得最初建造块的机制和原理，根据零散数据做推断，得出因果推论。”

AI软件有多聪明？

不论处在怎样的发展阶段，人脑都需要通过一系列感知系统了解世界：视觉、听觉、嗅觉、味道、触觉、空间方位、平衡。如果获得的数据有限，大脑会填充空白区。虽然婴儿的大脑可能会缺少一种或者几种感知功能，但是它们在处理信息时更加敏捷。

泰拉贝尔说：“孩子像科学家一样学着理解世界，比如形成理论、做实验、玩耍、看看自己能发现什么，积极思考，寻找验证理论的最佳方法，对预料之外的事情做出反应，努力搞清什么是错误的什么是正确的。”

泰拉贝尔与一个研究团队合作，这个团队的成员来自纽约大学、多伦多大学，他们携手设计AI软件，该软件可以用更高效、更复杂的方式获得新知识。2015年12月，团队的研究成果发表在《科学》杂志上，论文谈到了如何编写机器学习算法，让计算机可以像人一样处理信息。

看了一个范例之后，新的AI程序可以识别手写字符，精准度和人类一样。通过贝叶斯程序学习框架，凡是之前看过至少一次的手写字符，软件都会为它们生成一套独特的程序。当机器面对不熟悉的字符时，算法的独特功能才真正显露出来。

此时算法不会查找自己的数据库，看看有没有匹配的，相反，它会将字符（之前看过的字符）的部件和子部件结合起来，形成一种新的字符，然后用概率程序测试假定的正确性。婴儿也是这样学习的，虽然数据有限，当婴儿看到的字符或者对象是之前没有看到过的，他会从有限数据中提取丰富的概念。

孩子可以形成原假设，并在形成的过程中自动学习，目前软件还无法模拟这种能力。一旦科学家设计出软件，可以生成原假设和真正目标，例如，程序自己产生“欲望”，渴望识别手写字符，而不是在研究人员的指引下进行，此时AI就会出现巨大的飞跃。如果不能用自己生成的目标驱动，AI系统的自动化能力始终会受到限制。

“用越来越多的数据持续学习，这是每一个AI系统都想达成的目标。”泰拉贝尔表示，“问题在于自动学习很困难。总会有一个人掌控一切，他决定给予系统多少数据，给予哪类数据。”

婴儿自己会做出选择。让AI自己为学习流程组建架构，这是一个公开的挑战。目前的AI系统没有任何目标，如果没有任何目标，就没有办法自己学习。在人类的指引下，机器人可以捡起盒子，看到他们完成任务，我们会赞叹，因为它做了人类正在做的事。尽管如此，机器人无法像孩子一样进行复杂的思考。

泰拉贝尔与同事在虚拟神经网络上部署机器学习算法，它可以深度模拟人类大脑的运行原理。当机器识别对象时，它需要搜索庞大的数据集，寻找匹配的数据，从而达到识别对象的目的。人类不同，人类依赖更高形式的感知功能解释对象的内容。

“我们正在尝试编写计算机程序，它相当于大脑软件，我们也可以管它叫意识。”泰拉贝尔表示，“意识就是软件，它在大脑硬件上运行，我们试图在软件层面上构建它。AI中的神经网络相当于软件层面的计算机程序。”

2013年，美国国家科学基金会向MIT提供2500万美元赞助资金，为期5年，让它建立一个脑、意识和机器研究中心（Center for Brains, Minds and Machines）。来自不同领域的科学家、工程师携手合作，深入研究大脑执行复杂运算的原理，他们希望能够开发出智能机器，让它接近人类智力。

“直到最近，我们才有了可以达成目标的数学理论和计算机模型。”泰拉贝尔说，“我们需要更多的资源、聪明人、企业、技术，可能还需要更快的计算机。我们可能需要等待，或者依赖其它工程突破才能获得年轻小孩一样的智力。”

模拟婴儿BabyX

新西兰奥克兰大学生物工程研究所也在努力缩小大脑与机器的差距，它开发了一个模拟互动婴儿。马克·塞格尔（Mark Sagar）是生物工程研究所动画技术实验室的主管、创始人，他曾为《阿凡达》、《金刚》等电影制作动画，获得了许多奖项。在实验室内有一块3D电脑屏幕，在屏幕上，塞格尔与一个金发孩子玩躲猫猫游戏，这套系统名叫BabyX，它可以学习、思考、生成面部表情、自主做出回应。

最开始时，塞格尔在MIT工作，从事身体组件医学模拟研究，在那里，他对数字面部技术深入研究，并利用该技术开发了BabyX。塞格尔开发的动画AI可以模拟他的面部表情，可以将简单的单词大声读出来，可以识别对象，可以玩一些经典视频游戏，随着时间的推移，BabyX越来越聪明。事实上，BabyX不只是塞格尔的“大脑婴儿”，它还是塞格尔女儿的模型。

为了构建BabyX，在女儿6个月、18个月、24个月大时，塞格尔为女儿做了扫描，然后将信息上传到系统。通过动画技术（相当于早期AI技术），他复制了女儿的行为、面部表情、声音。在谈话过程中，塞格尔将BabyX称为“她”，他还解释了BabyX的能力，BabyX通过光纤线缆运行，线缆由模拟神经活动驱动，类似于连接大脑的脊髓。因为BabyX是一个AI互动替身，它可以学习，获取信息，与之前的系统不太相同。

塞格尔表示：“我们的开发方法与大多数人不同。在神经系统科学、感知科学中，有许多理论彼此竞争，我们目前掌握的知识只是冰山一角。一些方法受到了生物学的启迪，在研究过程中最困难的部分（也是最有趣的部分）在于：按不同程度进行交互作用，从中能够生成多高程度的认知能力？”

团队测试了BabyX对人类互动的反应。BabyX可以处理人类情绪，可以理解动作背后的意义，过去BabyX与塞格尔有过互动，它会从过往互动中学习，然后给出正确的回应。屏幕上面显示的是BabyX的脸，脸的背后是脑部实时模拟系统，它可以提示面部模拟图像，让它向观众眨眼或者微笑。塞格尔相信，要开发出有效的互动AI，面部是关键，因为它可以反应脑部和意识的状态。例如，即使只是一个简单的微笑，也是由复杂、互相编织的系统控制的，这些系统与大脑连接在一起。

“通过将用户的动作与BabyX的动作联系起来，BabyX不断学习。”塞格尔解释说，“例如，在学习过程中如果听到婴儿发出的咿哑声，BabyX会控制引擎移动脸部或者手臂。如果用户给出的反应很相似，代表BabyX动作的神经元就会与响应用户动作的神经元联系起来，通过一种名叫Hebbian学习的方法联系在一起。神经元彼此交互，融为一体。”

流程不断重复，新的神经连接就会在BabyX的模拟大脑中构建图谱，将BabyX的动作与用户的动作匹配，为更高层次的模拟奠定基础。人类大脑的运作形式与此类似。每完成一个动作，大脑都会形成新的连接，这种连接会在重复过程中强化。

在处理环境的过程中大脑会生成信息，最终模拟婴儿不断学习，利用信息形成回应。从本质上讲，BabyX就是在利用不断改进的代码持续学习。

人类大脑处理信息，在大脑内部产生化学反应，比如生成多巴胺或者催产素，BabyX的算法需要模拟、解释这一过程。当BabyX无法理解某个词汇或者动作时，它会表达自己的困惑，如果正确读出一个词汇，它会愉快地笑起来。神经系统由算法控制，在算法的支持下，BabyX可以模拟、形成一套奖赏系统，通过互动、演示学习新的信息。

“生物式行为、情绪、认知运算模式如何与动画整合，尤其是在面部整合，这是我们想探索的领域。”塞格尔说，“对于人类体验的许多方面来说，面部都是关键连接点。未来我们可能会与更复杂、更自主的技术互动，使用它们，探索学习、心智发展的基本面对于这一目标的实现相当关键。”

面部是沟通的主要手段之一，塞格尔希望自己的“孩子”可以为未来的健康、教育应用奠定基础，程序可以与患有孤独症、存在社交障碍的孩子互动。开发一套系统，它可以识别人类的情绪并进行处理，理解人类的感受，这就是AI研究的目标，我们渴望建造一个大脑，让它可以自己思考，正如我们从出生那天起所做的一样。

孩子越小学习能力越强

AI软件有多聪明？

模拟婴儿BabyX

相关推荐