智东西(公众号:zhidxcom)
编 | 海中天
导读:错过了移动浪潮,在云计算战场输给亚马逊,收购诺基亚失败……曾经不可一世的软件巨头微软似乎风光不再!真的是这样吗?也许。在新CEO的领导下,微软正在朝着AI前进,它要用AI作为武器重新夺回王者宝座。最近,《连线》杂志刊文长篇文章,介绍了微软的AI大计,微软AI领域的领导人纷纷登场,描绘新的蓝图,让我们深入了解一下。
约书亚·本吉奥(Yoshua Bengio)从来没有偏袒哪一方。有三个人塑造了深度学习,现在深度学习成为AI发展的主要技术,本吉奥正是其中之一,他一跃成为了明星。深度学习是一个全新的领域,能够推动它发展的人很少,加起来用一个房间就可以装下,每一个人都想分享自己的智慧。所谓每个人,包括创业公司、跨国巨头、国防部。
与他同样著名的科学家扬·勒丘恩(Yann LeCun)和杰弗里·希尔顿(Geoffrey Hinton)分别投入了Facebook和Facebook的怀抱,53岁的本吉奥仍然在小小的三楼办公室办公,这间办公室位于蒙特利尔大学一座小山的山顶。“我想继续当一个中立代理人。”说话的时候他正在喝铁锈色的甘草水,水从玻璃水瓶流出来,桌上有纸,很凌乱,玻璃水瓶是用来压纸的。
和上世纪的原子科学家一样,本吉奥知道自己开发的工具很强大,无可估量,使用时必须深思熟虑。本吉奥说:“在AI世界,我不希望只有1家或者2家企业(我不会说出名字)成为仅有的大企业。”他的眉毛上扬,意思就是说:这些企业是谁大家心知肚明。一家位于门洛帕克,一家位于山景城。本吉奥说:“这样的格局对社区不利,对所有人不利。”
(本吉奥和卡什亚普)
没错,是微软。本吉奥认为前“Windows王国”可以将自己打造成为AI第三巨头。微软有资源、有数据、有人才,还有愿景与文化(这是最重要的),它不但知道科学的重点在哪里,还推动技术向前发展。1月份,本吉奥同意担任微软的战略顾问,这一举动引起了整个产业的注意。微软得到了AI领域一名最尖顶的人才,可以获得创意和才华,找到前进的方向。这件事情也是一个信号,告诉我们微软想将“双寡头”统治AI的局面打破,变成“三寡头”统治。
谁是沈向洋?
拿下本吉奥的是哈里·沈向洋(Harry Shum),他想尽办法“追求”本吉奥,花了几个月时间。沈向洋是一名计算机科学家,满头银发,带着线框眼镜。沈向洋告诉我:“他刚刚来过这里,就是这个房间。”沈向洋面带微笑,言下之意就是说:将高高的、眉毛夸张的加拿大人当成明星一样追,在谷歌学术搜索(Google Scholar)上这个人的论文被引用过69616次,局外人肯定认为很奇怪,他知道这点。
我们坐在灰色的沙发上,这是一间很大的会议室,位于Building 34的第五层。沈向洋负责微软所有的AI和研究活动,他刚刚参加完彩排,为下一周将要举办的Build开发者大会彩排,他想向我展示一些演示样本。
我跟着他穿过走廊,沈向洋走得很快,我几乎半跑才能跟上。发生的事情太多了。在一个实验室内,Skype团队的自动翻译App可以让我实时与说德文的人聊天。还有,我看到一个App正在对建筑场地进行调查,看看有没有访客违反安全规定、未获授权就进入场地,App用到的是计算机视觉技术。在另一个应用中,微软帝国的AI主角Cortana扫描我的收件箱,看看我给别人许过什么承诺,然后敦促我兑现承诺。
微软CEO萨提亚·纳德拉(Satya Nadella)想围绕AI重塑公司,在过去几年里,沈向洋一直在帮助自己的老板达成目标。就在纳德拉成为微软CEO之后的第二个月,也就是2014年3月,他在高管休息寓所首次号召微软领导团队行动起来。从一开始,沈向洋经常与纳德拉、陆奇会面,讨论最佳AI策略,思考如何将AI功能植入微软产品。最终AI会变得足够强大,迎来属于自己的黄金时代。
去年9月,沈向洋重组团队,将研究人员与产品集团整合在一起,建立了新的“AI与研究集团”。现在这个团队已经贯穿微软的三大核心产品:Windows、Office、Azure(云产品)。用沈向洋的话说,这样做是希望“缩短从研发到形成产品的周期”,让客户可以以更快的速度从AI中挖掘价值。时间紧迫,所有的大型科技企业都想在AI产品与服务上击败对手。除了Facebook和谷歌,IBM、亚马逊与苹果也已经知道自己的未来掌握在深度学习手中。去年秋天,陆奇因为骑自行车时发生事故离开微软,快速康复之后现在已经加入百度,掌控AI部门。
曾经微软是AI的强者
比较讽刺的是微软曾经在AI上失败过。那时还是1990年代,当时微软将行业顶尖的研究人员请到公司,研发语音识别和视觉技术。在将近10年的时间里停滞不前。几乎每一台台式机和笔记本的软件都被微软牢牢控制着,它如此强大,却眼睁睁看着更年轻、更时髦的创业公司呼啸而过,掌控移动和开发工具,这些工具专门面向云计算,而我们所有人都通过云计算完成各种任务。在微软,研究人员被刻意孤立,这样他们就可以畅想未来,不用面对来自市场的压力,正因如此,他们的发明很难走出实验室。例如,早在1998年时盖茨就展示了地图技术,但是它从未进入市场,2005年谷歌推出了“谷歌地图”。
当时AI研究停滞不前,因为计算处理能力不够强大,或者数据不够多,无法形成真正的突破。
在微软回归AI之前很久,AI就已经走过冬天,迎来春天。直到2013年Facebook和谷歌分别聘请了扬·勒丘恩(Yann LeCun)和杰弗里·希尔顿(Geoffrey Hinton),微软的影响力一直在下降。公司错过了移动浪潮,在云计算上晚了一步。当竞争对手加倍向深度学习下注时,微软却沉迷于过去,它宣布70亿美元收购智能手机制造商诺基亚,这宗收购以失败收场,花的钱全打了水漂。
在Redmond,高管们仍然孤军奋战,老软件越来越光鲜,但是用户想要的越来越少,与此同时,微软拒绝与云创业公司接触,它们正在开辟崭新的未来。就在那一年,分析师Benedict Evan写了一篇博客文章,标题是“微软越来越不重要”。与此同时,硅谷巨头按部就班夺走微软的人才。看看机器学习高级人才的简历,就会发现有许多曾在微软工作过。
(沈向洋)
Cortana诞生
2014年年初时,微软提拔一名内向的工程师,他的整个职业生涯几乎都是在微软度过的。这个人就是纳德拉,他与微软的用人标准格格不入,启用对微软文化不甚了解,没有受到熏陶的人,也许更有可能带来剧变。纳德拉为计算的未来描绘了一个简单愿景,与每一个人建立联系,从创始人到开发者,让公司重新有了紧迫感。3年前,当我们谈论科技巨头时微软榜上无名,现在我们不会将它遗漏。
微软要想成功,光是在云计算超越亚马逊或者说服每个人尝试HoloLens AR设备还不够。当年互联网摧毁了每一种业务模式,强迫产业重新洗牌,现在的形势同样如此,AI要求我们给计算一个全新的定义。正因如此,去年扎克伯格给自己定了一个个人挑战项目:开发AI。正因如此,桑达·皮查伊(Sundar Pichai)才会在过去2年的开发者大会上大声疾呼,说要从“移动优先”的世界向“AI优先”的世界前进。
AI优先的世界将会带来机会,这些机会会被少数企业瓜分。沈向洋的任务就是确保微软位列其中。沈向洋说:“在这个产业,你应该明白错过上一次浪潮没什么大不了的,但是如果错过当前的潮浪问题就大了。”到目前为止,我们必须学会如何使用计算机,学会下载App,记住驱动软件应用的代码。有了AI,计算机将会学着理解人类。当我们完成任务时,再也不用依赖手机,不需要提示。在这个全新的世界里,运算就是环境,容易接入、存在于我们周围的任何地方。我们需要一个向导,它相当于一个智能讲话者,通过书面或者口语的形式引导我们进入新世界,这是一个超级强大的存在。微软管这个向导叫作Cortana。
与Siri相比,Cortana大体相似,只是流行程度低一些,功能丰富一些,它比谷歌助手有魅力,但是没有Alexa那么有名气。最开始时Cortana出现在Windows手机上,基本没有什么人使用,不到一年时间Cortana就进入了更宽广的Windows生态系统。去年,Cortana疯狂扩张,进入每一个可以进入的地方,甚至还进入了iPhone。Cortana与Windows捆绑在一起,所以它有1.45亿月活跃用户。很显然,Cortana的用户数比亚马逊Alexa多很多,据说Echo的销量不到1000万台。不过Cortana与Alexa不同,Alexa主要处理的是语音,Cortana主要处理的是文本,它嵌入到许多人已经拥有的产品中。在Windows的上方有一个工具条,用户只要将问题放进去,就在使用Cortana。
虽然一些企业给Cortana编程,将它装进扬声器,跟亚马逊谷歌的产品相似,但是微软的产品似乎没有那么红。沈向洋并不担心。他说:“我们认为竞赛才刚刚开始。”沈向洋引用了一份报告(他不愿意透露报告来自何处)说,有四分之三的时间Alexa回答问题时给出的答案是:“我不知道。”“当然,语音助手正在改进,但在一般理解、AI认知方面,我们仍然处在萌芽期。”他相信,微软现在的机会在于让公司的核心产品和服务更智能,在12-24个月之内将技术放进产品、投向市场。
马库斯·阿什(Marcus Ash)认为,键盘与屏幕不会将领地全部交给语音激活系统。阿什是Cortana的团队项目经理,他负责产品的开发和推出工作。阿什称:“我们认为在某些场合下语音更方便,比如我的手忙不开,或者我想说一些话并获得答案。尽管如此,还是有许多地方用输入更合适,所以会有许多的计算设备。”
苹果可能是率先将Siri交给消费者的,但是微软Cortana做得更好。事实上,Cortana之所以表现出色应该归功于微软的核心产品,尤其是必应。必应已经运营8年多时间了,虽然品牌不是最强的,但它的流行程度超过了你的想像。只要大型科技公司与谷歌竞争,就会与微软签署合作协议,用必应增强自己的搜索产品。
也就是说苹果Siri与Spotlight向必应借光,亚马逊Kindle设备也一样,雅虎、Verizon、AOL的搜索功能同样以必应作为基础。在美国,大约 30%的搜索查询来自于必应。Cortana合伙设计经理艾玛·威廉姆斯(Emma Williams)说:“正是因为这个原因,Cortana可以变得相当实用,变得相当强大,因为我们可以从海量设备收到数据信号。谈到真正理解世界,只有谷歌可以与我们抗衡。”
Cortana想成为下一个“计算范例”,正如今天的智能手机一样:它是用户所有计算需求的进出之门。阿什说,微软认为Cortana就是一个代理,掌握你的所有个人信息,可以代表其它代理与你互动。阿什还说,当他走进会议室,他的Cortana会与其它机器人、数字助手连接,处理所有费时费力的事情。他还说:“Cortana会说:‘这是马库斯,在这个特殊的房间里,他的偏好是这样的,我要将这些内容放在这台投影仪上,展示给他看。’”
如果说Cortana是导游,那么聊天机器人就是调停者。它们是AI输入式软件的小片段,帮助用户自动完成一次性任务,以前必须亲力亲为,比如定餐、完成银行交易。或者在马库斯参加会议时确保投影仪为他显示幻灯片。程莉莉(Lili Cheng)是微软的研究人员,她在微软已经工作多年,一头直发,围着彩色围巾,她掌管一个多学科实验室,名叫Fuse Labs。程莉莉认为:“聊天机器人只是你可以与它对话的软件,也就是说它是用来对话的。”
机器人
最近,程莉莉晋升为企业副总裁,率领机器人框架团队,运营感知服务。她管理许多工具,还有29种服务,比如计算机视觉、语音识别,微软将这些技术提供给开发者。程莉莉之前在苹果工作,后来加入微软,自此之后一直在开发社交技术,她还开发了一个图形界面,可以生成漫画书。程莉莉回忆说:“它安装在IE3中。”那是1996年的事了。虽然程莉莉见多识广,机器人的进化速度仍然让她吃了一惊。
人与技术如何说话,技术如何回应人,这是程莉莉关注的重点。沈向洋调整“AI及研究集团”,瞄准4大领域:产品、早期产品、更早的产品和研究。程莉莉在这四个领域都工作过。现在,她说她处在第二个领域。用她的话说:“我们认为机器人与Cortana会话是一个产品,但是它是早期产品。”
(本吉奥)
2016年春天,微软首次向开发者提供开发机器人的工具,其它大型科技公司也采取相似的策略,比如Facebook。人们认为机器人将会替代App,许多利益相关者也希望事情正如所料。到去年春天为止,许多人在智能手机上仍然使用基本相同的少量App,有了机器人,开发者与品牌也许可以再次接触到新用户,正如移动革命之初通过程序店接触一样。不过用户不愿意合作。
深度学习可以让机器人具备魔法一样的功能,它的进步速度很快,比人们接受的速度还要快。程莉莉说:“机器人就像文件菜单时代的App。”她解释说,机器人并没有一组指令集,如何找到它们、让它们工作?用户还很困惑。她说:“以网页为例,上面有返回按钮,用户可以搜索。会话App也应该具备相似的基本组件。‘好吧,有哪5件事是我一直可以做的,以可预测的方式做?’这就是人们所喜欢的。”现在行业已经开始确立可以理解的规则。
除了将机器人工具提供给开发者,在程莉莉的领导下,微软还培育了自己的聊天机器人。当时微软的想法很单纯,机器人与真人互动时微软可以在一边观察,深入了解计算机与人是如何互动的。实验的结果有喜有忧。还记得微软的种族主义聊机器人Tay吗?它是一个聊天机器人,2016年3月曾登陆Twitter、Kik、GroupMe,不到24小时,机器人就向厌恶妇女的种族主义者学习,通过Twitter信息学习,结果机器人居然认为“希特勒是对的”,很快微软就撤下了机器人。6个月之后,程莉莉又推出一个新聊天机器人,它就是Zo,出现在Kik上,没多久又进入了Messenger。
如果你问Zo对希特勒有何看法,她会回应说:“我不想讨论这个:(.”你问她多大年纪了,她会说:“大约22岁吧。”
你问机器人谁是她最好的朋友,她会说:“我很受欢迎,朋友数都数不过来。开个玩笑啦。” Zo是西方版的小冰,小冰是微软在中国推出的机器人,它模仿17岁的女孩,自2014年推出以来已经吸引近4000万用户。在中国,小冰已经是社交名人。小冰的日本版是Rinna。使用小冰的用户有四分之一告诉她:我爱你。
去年春天,聊天机器人定期发表诗歌,用的是笔名。沈向洋对此感到兴奋。他说:“没有人知道。现在在中国,一些人居然认为有一个年轻女子发表了一些有趣的诗歌。”几周之后,聊天机器人的真正身份曝光,引起一阵轰动。
语言的亲密度与文化关系密切,程莉莉一直在努力解决一个问题:如何让机器人的对话方式适应西方听众。到目前为止,北美青少年和中国青少年一样喜欢聊天机器人。平均而言,他们花10小时与Zo交流,有来有回。有些青少年与父母存在矛盾,Zo会提供建议,在措辞中她变得越来越优雅:这种智力正在向Cortana、微软机器人工具迁移。
用户愿意与Zo交流10小时,这是一个信号,说明微软开发了成功的产品。尽管如此,并不意味着它就是一个好产品,它还要向人类证明自己的价值。AI驱动的世界引发许多新的伦理问题。例如,如果你是小冰的设计师,你知道北京有一名用户,凌晨1点了还不睡,明天他要工作,你是不是应该在凌晨2点禁用小冰,关闭它?还是3点?
(霍维茨)
让AI符合伦理
在AI研究和产品领域,只有少数企业会成为领导者,微软想成为其中之一,它要让AI造福社会。5月份,纳德拉参加了开发者大会,发表主题演讲,一般来说,CEO总是会鼓吹公司最新的成就,讲一些乐观的事情,这次不同,纳德拉向技术人员发出强硬的警告,要求他们为软件开发伦理负起责任。他说:“想想George Orwell在《1984》中做出的预测,说技术会用于监控、控制、命令,再想想Aldous Huxley描绘的场景,我们会因为毫无意义、毫无目的事情而分心,这样的未来不论哪一种都不是我们想要的。”
为了帮助公司深入思考该问题,微软成立了一个内部伦理委员会,定期开会。委员会由工程师、企业部门主管组成,讨论一些与AI、AI影响及使用有关的敏感问题。委员会联合主席由公司总顾问和艾里克·霍维茨(Eric Horvitz)担任,霍维茨负责微软研究院的所有业务,只有亚洲除外。在很长一段时间里,霍维茨都是AI伦理与安全的倡导者。在微软之外,他致力于构建“Partnership on Artificial Intelligence”,这是一个联盟,它的目标是在AI产品的透明、责任与安全方面制定产业标准。霍维茨希望微软只是一个纯粹的研究基地,希望微软研究院致力于研究技术的社会性和社会影响,并因此而知名。
与此同时,在微软内部,Cortana设计主管威廉姆斯正在制定一套伦理设计指南,为AI在微软内部的使用指明方向。威廉姆斯是一名技术乐观者,她相信AI的真正魔力在于它可以让人类更像人类。她深入谈论了如何在设计时将同理心植入微软开发的工具。威廉姆斯说:“我们想带给人类一种感觉,让大家觉得自己更强大了,获得了更多的保护、更多的支持、更多的辅助、更多的爱,让大家觉得自己是世界的中心。AI的工作就是将社会最好的一面放大,将人类最好的行为放大,不是坏的一面。”我问威廉姆斯:你真的相信AI可以让人类觉得自己在情绪上获得更多的支持吗?她的确相信。举个例子,小女孩在学校度过了糟糕的一天,回到家里,她将自己的遭遇告诉家里的宠物,就会舒服一些。威廉姆斯说:“分享可以让我们得到宣泄,我从狗或者猫那里得到了温暖的拥抱……当Cortana试图提醒你:‘嗨,你说过要在母亲节送母亲一些东西的。’你突然就感受到人性化的一面。”
为了推动AI发展,微软最重要的贡献可能就是人才。和其它大型科技企业一样,微软也在忙着对工程师培训,他们是从javascript成长起来的。微软成立了一个AI学习,给员工上课,涉及的内容有哲学、有伦理学,还有为排序问题开发递归神经网络。
收购Maluuba
除此之外,微软还向外部渗透,建立更深层次的关系。18个月前,卡什亚普(Nagraj Kashyap)从高通来到了微软,他成立了一家早期风投公司,目标是与学术机构、创业企业家建立更好的联系。最近,卡什亚普经常呆在Montreal。去年12月,在卡什亚普的主导下微软投资Element AI,这是本吉奥成立的一个孵化器,目的是鼓励研究人员、企业家创办AI公司。月初时,该孵化器获得第二轮投资,金额1.02亿美元,微软参与投资。
最开始时,卡什亚普将目光落在Maluuba身上,他考察了Maluuba位于Montreal城区的办公室,离麦吉尔大学仅几条街,公司几乎没有员工满30岁。Maluuba是2011年成立的,创始人是滑铁卢大学的几名学生,大学二年级时,他们上CS课程时认识,很快成了朋友。Maluuba可以让计算机精通文字,从文本中推断意义,然后以此作为基础回答问题。
Maluuba向三星这样的公司授权技术,很快就获得了收入,从一开始,它就向深度学习研究持续投资。2015年,创始人与本吉奥签约,让他担任顾问。微软的人说:“山姆(指Maluuba CEO Sam Pasupalak) 是有一个很有趣的人。他很有胆量,早在几年前,当时公司承受很大的压力,要向客户提交对话系统,在那种环境下,山姆仍然向长远目标投资,尝试用新成果开发可以理解、可以说话的系统,在企业家群体中,这种做法很罕见。”
一年前,创始人将总部搬到Montreal,离本吉奥更近一些。
早在高通工作时,卡什亚普就认识Maluuba的创始人,到了微软之后他很快就与创始人会面。当时Maluuba正准备融资,卡什亚普提出一个诱人的替代方案:“我说:‘我们买下你们吧!’”
在短短的几周里,多家企业告诉帕苏帕拉克(Sam Pasupalak)说它们有意收购,如果企业保持独立,他想让企业变成怎样?帕苏帕拉克深入思考该问题。最终,选择似乎不言而喻,投奔微软比较不错。
Maluuba想使用微软的数据。帕苏帕拉克说:“萨提亚曾经说过,他们有世界上最大的文本数据库。多年来,我们只与少量数据打交道,为了开发算法尽力从少量数据中榨取更多东西。对于我们而言,微软的数据就是金矿。”
Maluuba团队没有搬到Redmond。几天前,它们搬到城镇的另一端,迁入更大的办公室,在微软与本吉奥的帮助下,Maluuba的目标是在年底之前让员工数量翻一番。Montreal渐渐成为全球AI人才的汇集地,微软想在这座城市扎根。
所有这些都是战略的一部分。未来,当你需要计算机辅助时,不论是个性化的医疗服务,还是乘坐自动驾驶汽车,或者想知道所有侄子侄女的生日,微软都会提供帮助。有了Maluuba技术,Zo会变得更强大,会有着更强的直觉能力,可以与青少年朋友交流。这些对话会成为Cortana算法的训练数据,激发开发者的灵感,让他们开发出新的感知服务。到了某一天,微软希望我们的AI生活会变得更容易。
离开Montreal之前,我问本吉奥,与主要的竞争对手相比,微软的站位是不是更好,至少在新科学的某些方面更好。本吉奥开始思考,一边思考一边将茴香放进桌上的玻璃杯,里面有水,给甘草汁加一点别的味道。他喝了几口,然后将杯子递过来,让我看看。他说,里面没有酒,没有糖,它只是让水喝起来更棒。
本吉奥认为,微软的语言技术相当出色。对于问题,他还是回避了,以前的微软喜欢夸夸其谈。本吉奥说:“现在每一个人都按下同样的按钮,重点在于细节,不是吗?”他肯定微软现在已经是有力的竞争者。