上门体验!扎克伯格家花150小时打造的人工智能助手Jarvis

海中天人工智能2016/12/23

智东西(公众号:zhidxcom) 编|海中天 导语:最近,fastcompany记者来到扎克伯格家中,看他演 […]

智东西(公众号:zhidxcom)
编|海中天

导语:最近,fastcompany记者来到扎克伯格家中,看他演示AI助手Jarvis。扎克伯格花了100-150小时开发Jarvis,它可以播放音乐,朋友来到家中可以提前知道,可以打开关闭灯泡。Jarvis并不完美,它还不是一个成型的产品,无法提供给所有人使用,不过扎克伯格从中找到了许多乐趣。

新工程师加入Facebook,不论是刚毕业的大学生,还是VP级别的老人,前6个星期都要参加“Bootcamp”培训,Bootcamp是一个强化培训项目,主要帮助新人了解公司庞大的代码库,还有一直在进化的编程工具。

扎克伯格是Facebook最早的工程师,在公司最初的几年里,他贡献的代码比其它任何人都要多。现在扎克伯格已经32岁,Bootcamp于2006年启动,他自己从没有参加过,2004年,扎克伯格在哈佛寝室创办了Facebook。

去年1月,扎克伯格宣布,他准备用Facebook工具开发一个AI系统,在家中运行,这是去年他为自己挑选的个人成长挑战项目。扎克伯格的挑战涉及到尖端AI技术,AI对Facebook的未来至关重要,项目还迫使扎克伯格改变了控制公司编程工具和程序处理的方式。扎克伯格管理着几千名工程师,作为世界最重要的科技公司之一,工程文化是Facebook的核心,扎克伯格再次与工程师的日常生活、工程文化联系在一起。

为了了解公司,你可以花6周时间学习,作为Facebook CEO可不能这样做。上周,我们到扎克伯格的家里采访他,住宅位于加州Palo Alto,这是一幢拥有113年历史的木制房屋,客厅超级大,采访扎克伯格正是为了虚拟助手Jarvis,他要向我们演示Jarvis。扎克伯格说:“我没有经历过正式的Bootcamp培训,不过如果我问别人问题,他们会很快回应的。”

1

扎克伯格认为,工程存在着“决定性”的特性,他很享受这种特性。这种特性到底是什么呢?就是你可以坐下来,开发一些东西,让它做你想要它做的事情。Facebook是一家大公司,员工超过1.5万人,拥有十几亿用户,而扎克伯格正是这家公司的老大,虽然可以做一些野心勃勃的事,但是他却失去了其中的乐趣。

正因如此,扎克伯格才会利用闲暇时间做一些小的编程项目,2012年,他制定的个人挑战任务就是每天都要写代码。在过去几年里,他几次参加公司组织的“黑客马拉松”活动,在实践过程中,他开发过一套系统,能够将Facebook的组织架构图与内部社交图匹配,看看公司内部哪个团队的社交联系最紧密。

扎克伯格告诉我说,写代码带给他的感觉如同当年学汉语一样,2010年,扎克伯格将学汉语当成自己的挑战,他觉得自己的大脑突然激活了。

按照Facebook工程文化的要求,如果工作出了问题,你必须马上停下手上正在做的事情,先去解决问题。扎克伯格是公司的CEO,他超级忙,在全球到处飞,要求他这样做不太实际。扎克伯格说:“有时我会退出会议,有时其它人会来修改我的代码,当然,修改我的代码是一种禁忌。”许多代码正在运行,要等到扎克伯格亲自检查往往需要很长一段时间。

在过去一年里,扎克伯格花了100-150小时在家里从事自己的项目。虽然名称取自《钢铁侠》电影中的Jarvis AI,但是扎克伯格开发的产品类似于自制版、个性化Alexa服务,有了自制AI助手,扎克伯格和妻子普莉希拉•陈(Priscilla Chan)可以用定制iPhone APP、Facebook Messenger打开或者关掉灯泡,根据个人品味播放音乐,为到访的朋友打开前门,烤面包,或者用汉语课程的声音叫醒1岁大的女儿Max。

在非工作时间的实验

扎克伯格的房子占地1.7万平方英尺,位于一条静谧、枝繁叶茂的街道,靠近硅谷,当你前去拜访时,Jarvis会提前知道你是谁,抵达之后,他会通知扎克伯格。当你走过木门与走廊,扎克伯格已经前来欢迎你,真是很怪异。

场面的确有点古怪,眼前的人还是那个人,棕色短发,灰色T恤,牛仔裤,和照片视频中一模一样。我们花了片刻才确定眼前的人不是化身,而是真人。

谈论Jarvis是一件相对轻松的事。我们坐在客厅的深绿色沙发上,旁边是Beast,它是一头匈牙利牧羊犬,扎克伯格看起来很轻松,他告诉我们过去一年系统为生活带来了哪些便利,当然,在某些情况下系统反而让生活变得更复杂。

1月份,扎克伯格在博客中披露Jarivs项目,他说自己要开发一个系统,可以控制家里的一切,包括音乐、灯泡、温度、自己的声音。

2

(用语音命令播放音乐)

当朋友来到家里,扎克伯格希望Jarvis看到朋友的脸之后就会让它进门,如果有东西进入Max的房间,Jarvis可以通知扎克伯格。扎克伯格还想设计一个系统,将VR数据视觉化,帮助自己开发出更好的服务,让Facebook的运行效率更高。

12月份,上述任务基本完成,除了VR之外。AI助手可以使用。当他向我展示Jarvis时,我发现工具还需要改进。

最开始时,扎克伯格演示Messenger机器人,它是系统的前端。扎克伯格拿起iPhone,输入一个简单的命令让灯打开关闭。扎克伯格开发的系统还可以响应语音命令,通过定制iOS APP控制,APP是扎克伯格开发的,系统的表现时好时坏。扎克伯格向系统下达了四次命令,告诉它关闭电灯,然后灯才变黑。

扎克伯格尴尬地说:“这样的失败过去也曾发生过。”

让系统播放音乐成功率更高一些。扎克伯格向系统下命令:“放点音乐吧。”几秒之后,《Would I Lie to You》开始播放,通过客厅的音响播放。扎克伯格又说:“将音量调大一些。”说了两次,系统做到了。为了让音乐停下来,扎克伯格也说了两次。

有一点最让扎克伯格感到自豪:Jarvis知道扎克伯格和他妻子的音乐品味,当妻子普里西拉要它播放音乐时,Jarvis会根据普里西拉的参数选择音乐,而不是扎克伯格的。系统还可以播放某种类型的音乐,比如轻音乐或者家庭音乐,或者与特定艺术家风格相似的音乐。

扎克伯格告诉Jarvis:“播放一些像红辣椒乐队一样的音乐。”几秒之后,Jarvis在客厅播放Nirvana的《Smells Like Teen Spirit》。扎克伯格评价说:“风格很接近,你认为呢?”

扎克伯格还希望Jarvis能够理解语言的细微差别,他说:“当你想到音乐,如果你命令它‘播放一些东西’,可能播放的是一首歌曲,可能是一系列歌曲,也可能是一个艺术家的作品,或者是一张专辑,还可能是推荐乐曲。”

有一个地方扎克伯格发现很有挑战力:让Jarvis解析非常相似的短语。扎克伯格举了个例子:“告诉系统,让它播放‘Someone Like You’,意思就是让它播放这首音乐。如果说:‘Play Someone Like Adele’,意思就是说找一些推荐歌曲,演唱者与Adele相似,播放他们的一些好音乐。如果说‘play some Adele’意思就是找出Adele最好的一些音乐,制作成播放列表。”

“命令中出现一些短语,比如‘Someone like you’‘someone like Adele’‘some Adele’,它们十分相似,意思却完全不同。因此,要让系统可以做不同的事情,不只是调亮调暗灯光那么简单,而是让它根据反馈信息理解差异,这才是开发过程中最有趣的地方。”

3

(通过Messenger机器人欢迎朋友来到家中)

要让妻子恼火,用这个办法不错

让Jarvis正确播放音乐是一回事,要确保普里西拉不生气又是另一回事。

当我们向系统下命令,让它关灯或者打开灯,播放音乐,如果它不知道具体指向的地方是哪里,就会引起许多误解。例如,有时扎克伯格与妻子会使用不同的短语,他会说“客厅”,而妻子说的却是“家庭房”。Jarvis必须理解同义词。光是让Jarvis理解不同的短语,扎克伯格还不满意,他要教Jarvis学习短语,理解语境上的细微差异,这是一个更有趣的挑战。

扎克伯格说:“你可能会碰到这样的问题,你告诉系统:‘将这个房间的灯打开。’结果灯太亮了,普里西拉会说让房间的灯暗一些,此时系统需要知道我们在哪里,如果搞错了语境,比如让它播放一些音乐,它可能会在Max的房间播放,因为之前我们在那个房间。”

如果播放音乐的时候Max刚好在睡觉会怎样呢?扎克伯格说:“系统完全在帮倒忙,要让你的妻子对你发火,用这种办法很不错。”

还有一个例子可以证明位置的重要性:为了创造最佳的电视观看体验,Jarvis可以关闭灯光。扎克伯格说:“有一个房间靠近电视房,它是普里西拉的办公室。曾经有一段时间经常发生有趣的事,我们准备看电视,Jarvis关闭了楼下所有的灯,普里西拉正准备工作,她会大喊:‘Mark。’”

比预想的容易,但是……

一般来说,扎克伯格只会选择一个年度挑战项目,2016年却选了2个,第二个就是跑365英里。

事实上,开发Jarvis的时间比跑步的时间还要少,主要是因为扎克伯格可以从Facebook获得工具,帮助自己完成任务,比如图像和语音识别工具。

有一点超出了预料:如何让Jarvis与家中的各种系统连接。扎克伯格的家里安装了Crestron家庭自动化系统,可以控制灯、门、温度,还有三星电视、安全系统、Sonos流媒体盒子、Spofity音乐应用,扎克伯格希望Jarvis可以控制这些东西。

4

严格来讲,扎克伯格的家庭网络是Facebook企业基础设施的一部分。如果要保护它,连接到家庭网络的所有东西都必须获得Facebook的安全认证,从本质上讲,安全认证就是一个数字验证密钥,它确保特定设备是安全的。

正因如此,扎克伯格能够控制的东西有限,比如联网冰箱,它没有获得Facebook的安全认证。对于大多人来说这不是一个问题,因为大家不是扎克伯格。保证他的家庭安全是一件重要的事。

扎克伯格找到了一种方法完全控制某些家电,用网络交换机控制,他可以远程打开或者关闭电源。扎克伯格希望Jarvis可以用面包片制作早餐面包,面包片是扎克伯格提前放进去的。问题在于当烤面包机关闭时,你不能压低面包,现在烤面包机都是这样设计的,主要出于安全考虑。扎克伯格只好购买一台老式低科技烤面包机,跟1950年的产品差不多,它可以根据命令烤面包。

最终,为了让所有东西按照自己的设想互联,扎克伯格花了许多时间对软件进行逆向工程研究,这些软件是他所使用的产品和服务附带的。当扎克伯格开始编写AI程序时,上述工作就已经启动了。

它不是一个产品系统,还没有准备好

在记者面前,虽然Jarvis的表现并不是特别完美,扎克伯格仍然为项目取得的成就感到自豪,他还将自己的成果与市场上可以买到的产品对比,比如亚马逊Echo、谷歌Home。

“这不是一个产品系统,它还没有做好准备,无法让其它人使用。”扎克伯格表示,“如果我不能开发一个系统,Echo、Home能做的事它也能做,那么我可能会对自己相当失望。”

扎克伯格补充说,像亚马逊、谷歌一样开发系统,让无数人控制无数设备,比为单一家庭设计AI更加困难,他无意抹杀两家公司的成绩。Facebook会不会推出类似的产品?暂时没有计划。

扎克伯格还说:“AI可以推荐音乐,识别面部,如果我不能用多种方式拓展其功能,当我在房间移动时,如果它不能理解情境,那么我可能就会认为自己并没有让技术出现多大的提升。”

事实上,扎克伯格还准备发表一份总结报告,谈谈自己的工作,如果某些见解可以用于公共系统,他会很高兴。这种态度与Facebook的哲学是一致的,Facebook的许多项目是开源的,尤其是AI。

我们如何与文本与语音互动,扎克伯格从中学到了一些经验。当我们向Jarvis讲话,它回话,在播放音乐时很有效。但在某些场合文本更好,如果周围还有其它人用文本更好。

5

(Jarvis告诉扎克伯格它已经打开房门 当时扎克伯格正在用系统控制音响)

“如果门前有人来了,我让他进来,这种事情与我身边的人没有关系。”扎克伯格说,“此时我可能更愿意使用文本。”即使他发布了语音命令,内心有时还是渴望Jarvis能用文本回复,显示信息而不是读出来。扎克伯格认为,Jarvis说话有时会是一件烦人的事。

扎克伯格只花了不到150小时开发Jarvis,他没有幻想自己的产品能与Facebook AI专家开发的产品相提并论,他们可能会花一千小时开发,一名工程师可能会在某个项目投入一年时间。

一年来,世人对扎克伯格开发的东西很好奇,现在Jarvis终于可以拿出来向世界展示了。扎克伯格还在改进产品,因为他每天都会使用,总会有一些小地方需要修复,有一些新功能要添加。

“早上醒来,可以对它说:‘早上好。’或者醒来时让房子跟着醒来,真的很棒。”扎克伯格表示,“同样的,晚上我们上床去睡觉,睡觉之前没有必要先关掉一切,只需要说一句‘晚安’,就能关闭整个房子,确保门已经上锁。”

作为丈夫和父亲,扎克伯格想让自己的家庭生活变得更美好,但他的目的不只如此。他还是Facebook的领导者,Facebook的命运就是帮助技术人员创造新产品。在开发Jarvis项目时,有一点很美好:扎克伯格可以对Facebook工程经验有进一步的了解。

“我花了如此多的时间为Facebook工具编写代码,作为公司的CEO,我就没有时间这样做了。”扎克伯格表示,“开发Jarvis,让我可以像Facebook新工程师一样拥有完整的体验。我们开发了许多内部工具,它们是文化的一部分,我直接与这些内部工具接触,有了更多经验,有了更多理解。”

zhidx