960-microsoft-corporation-to-subject-the-chinese-population-to-its-own-turing-t-850

解码微软AI战略:用聊天机器人与AI替代APP

海中天人工智能2016/07/11

智东西(公众号:zhidxcom) 文 | 海中天 在华盛顿州雷德蒙德(Redmond)的微软总部,公司CEO […]

智东西(公众号:zhidxcom)
文 | 海中天

在华盛顿州雷德蒙德(Redmond)的微软总部,公司CEO萨提亚·纳拉德告诉我,未来微软将会开发更多的智能APP和服务。每天早上,纳拉德都会戴上HoloLens头盔,他可以在家中住宅的墙上查看虚拟互动日历。系统很智能,生产力高,代表着未来:纳拉德已经是微软的领导者,HoloLens寄托了他的所有希望。

纳拉德宣称,未来不管我们在哪里工作,微软都可以占据一席之地。微软认为“聊天式界面”将会替代APP,成为使用互联网的主要方式:我们会用新方法查找信息、购物、接入服务。有了“认知API”(微软提供这种API),APP将会变得更加智能,可以识别面部表情、情绪、照片和视频中的其它信息。

微软认为自己拥有最棒的“大脑”,它以过去20年取得的机器学习、自然语言处理成果作为基础,可以创造一个AI驱动的未来。

很显然,微软为自己的AI工作深感自豪,它渴望向外人传达一种感觉:这一次微软会成为赢家。6月份,微软邀请我前往办公园区采访纳拉德的副手,他们开发AI产品,将AI植入业务的各个方面。在随后的2天里,微软向我展示了许多应用,证明公司在自然语言处理和机器学习上取得了进步。

1

在开发聊天机器人方面,微软取得的成功可能比其它任何一家美国公司都要多。只是我们可能没有意识到这一点,因为微软的成功是从中国开始的。

2016年1月,微软AI产品出现在东方卫视,它以天气预报员“小冰(Xiaoice)”的身份亮相。

为什么微软如此看好聊天机器人?要知道答案,小冰正是其中的一部分。必应搜索工程主管康奈尔(Derrick Connell)说:“我们不敢拍着胸脯说自己开发了杀手级机器人,但是我们的确已经开发了一个机器人,它可以用全新的方式工作,完成许多对话。”

在康奈尔看来,小冰的目标指向了下一代搜索。当我们搜索时,传统搜索引擎会返回一个页面,上面有10个蓝色超链接结果;如果会话机器人足够完美,只会给出正确的答案。

当然,在中国取得成功,并不意味着在美国也能成功。在小冰推出2年之后,微软还没有开发出英语版本,短期之内也不会出现。微软高管称,小冰的后台架构对于公司而言是一个大机会。

成为生态系统

“现在已经是新时代了——你没有必要成为语音和语言理解专家。”康奈尔说,“只要用我们的工具就行了,你可以用我们的工具开发机器人,放在哪里都可以,可能是Slack,可能是Facebook Messenger。当然,我们希望应用能够放在Skype或者Windows上,由你选择。”

开发者担心各大企业将会围绕机器人标准展开大战,这一次微软一反常态。6月份,微软在旧金山召开会议,呼吁机器人开发商彼此合作。微软高级工程师程丽丽 (Lili Cheng)是会议(这次会议名叫Botness)的组织者,她说:“我们对协作很感兴趣,我们想成为生态系统的一部分。如果我们发现了什么问题和挑战,大家可以一起解决。”

想为下一代计算建立主导性平台的不只有微软,几乎每一家大型科技公司都有AI部门,许多创业公司也有,一些企业已经取得了骄人的成绩。要比较各大公司的AI有点困难,几乎是不可能的事。许多公司(比如谷歌、Facebook、亚马逊)到底在开发什么还没有公布。

VC公司Andreessen Horowitz的未来学家Benedict Evans最近在博客中表示,AI的未来仍然不明朗。他写道:“AI领域发展很快,很难说清最强的领导者会出现在哪里,也不知道哪些东西会成为商品,最大的差异点是什么。没错,在AI技术方面,大多的计算机科学成果都已经发表,都是开源的,但是这些产品都不太重要,这些技术并不一定能成为商品。”

Verge_Chips.0

APP并不是正确的模式

陆奇(Qi Lu)试图为微软建立竞争优势。纳拉德的高管团队有几十个人,陆奇是其中之一,他掌管微软应用和服务集团。陆奇获得过计算机博士学位,名下有20项专利,我曾经和陆奇的同事有过交流,他们很尊敬陆奇。很快我就知道了原因,陆奇极为聪明,说话的时候脚打着拍子,好像自己说话的速度跟上不思维。见面的时候,陆奇穿着凉鞋和袜子,大口袋短裤,T恤上写着三个单词:“Make epic shit。(意思是创造伟大的东西)”

在第一波移动互联网浪潮出现时存在一些缺陷,陆奇最开始时就是要解决这些问题。陆奇称,移动设备网络流量从未超过桌面流量,因为用户对体验感到沮丧。“我们都知道,网页在手机上的运行效果不怎么好。”陆奇说。除了少数几个大类,用户不愿意下载其它APP。西雅图市民可能会被迫下载一个APP,用来查看渡轮的票价,实际上他们一年只用几次,这种模式并不好。陆奇称:“我们的产业还没有找到一个体验平台,真正释放移动和云的价值。APP并不是正确的模式。”

当APP崛起时,它是用来替代HTML网页的,就当时来看APP是最好的办法。我们不能朝着手机大喊大叫调出互联网内容,开发者只好开发精致的隐藏管道,让用户可以通过图形按钮互动。尽管如此,在完成许多任务时,按钮仍然是最有效的方式。

由于自然语言处理技术取得了进步,现在我们可以朝着手机叫喊,将互联网内容喊到手机上来。陆奇认为,下一代“体验平台”将会由此起步,当中包含了对话。这种体验方式更加符合人的行为举止。只要使用正确,随时都可以回到按钮。陆奇称:“语言的全方位使用将会成为基准,图形互动可以通过更周到、更有意义的方式提升体验。”

5大关键资产

要想成为赢家,陆奇认为公司必须拥有5大“关键资产”。第一项资产是“会话层”,也就是提供一个地方,让用户可以谈话、输入文本。微软拥有Office、Outlook、Skype和Cortana。第二项资产是AI大脑,也就是为世界打造复杂精致的心智模式。早在20年前微软就已经涉足AI开发了。第三项资产是社交图,用户在互联网上进行的活动许多时候都与朋友、同事有关。果不其然,与陆奇交谈之后没过几天,微软就宣布262亿美元收购LinkedIn,该网站拥有4.33亿注册用户。

第四项资产就是建立一个平台,让AI在上面运行。微软拥有Windows和一大堆设备,特别是Xbox。最后一项资产就是建立一个开发者网络,让他们为自己的平台开发产品,向平台付费。

如果单看各项资产,微软碰到了强大的竞争对手。例如,Facebook拥有强大的会话平台,拥有信息APP,它还拥有最大的社交图。谷歌的“大脑”可能更聪明一些,它有无数Android设备。如果将所有资产组合在一起观察,就会知道微软为什么这么自信了。陆奇称:“将所有资产加在一起,我相信我们有资格引领未来。”

microsoft-build-2016-event-verge_433.0.0

Skype翻译器的故事

2年前,微软曾经召开Code Conference大会,由此开始,微软全面拥抱AI。当时纳拉德刚刚成为微软CEO只有3个月,他现身讲台,谈论了微软的未来。在讲话结束时,纳拉德展示了Skype新功能。两位微软员工在讲台上讲话,一个用英语,一个用德语,Skype实时翻译,尽管两人的语言不同,但是可以用Skype交流。演示很惊人,纳拉德还宣布,到年底时新功能就会出现在产品中。

最开始时,Skype翻译器(Skype Translator)的开发团队有两大担忧。首先,微软研究院一直以来没有承担将产品推向市场的义务,研究人员担心他们可能会失去追求科学突破的自由。

还有一个担心在演示时已经出现,当时的Skype翻译器不够好。微软的语言模型是根据大量的正式语音开发的。Skype需要翻译的双向交流大不一样,翻译时会出现“不流利”的现象,当讲话者卡在一个词汇上,或者退回去重新说一个句子时,不流利的现象更严重。还有“代码混用”问题,也就是说讲话者在单个句子中使用多种语言,在英语之外这种现象很常见。如果用户在唱歌系统也难以处理,当一个人不断向另一个人唱歌时,计算机难以解析。

“基本上没有什么效果。”陆奇称,“我们必须重新训练所有模型。”尽管如此,在纳拉德的鼓励之下,当年12月陆奇团队还是发布了预览版产品。第二年,产品开始大规模部署,供用户免费使用。陆奇称纳拉德是一名“激进主义者”,项目最终让人很满意。陆奇称:“当你知道产品没有什么用时,团队士气会变得很低落,会感到恐惧,我们必须帮助团队走过低谷。一旦走过去,就会发现有惊人的新东西开始出现。”

现在,微软的系统可以在8种不同的语言之间翻译会话,也就是说,系统可以支持56种不同的组合。系统的底层技术影响的不只是翻译。微软正在测试软件,它可以记录企业会议,实时翻译成文本。如果有两个人在对话,软件也可以提取语音记录,生成文本,还可以辨别两人的讲话。

“当翻译器第一次亮相时并不怎么好用,你不知道我们当时有多沮丧。”陆奇称,“现在我们正在向高峰不断迈进,我们正在处理语音和翻译模型,尤其是语音模型,它们已经相当不错了。”

Delve-5.0

让AI进入Windows和Office

与此同时,微软还将AI资源倾注在最大的几个产品中:Windows和Office。AI有一项功能很强大,它可以预测用户的需求,Google Now也具备类似的功能。

微软正在加快步伐,将AI植入桌面平台。马库斯·阿什(Marcus Ash)负责Cortana的研发工作,他向我展示了模型版Windows,在很大程度上它是根据云计算开发的。当阿什进入开始(Start)菜单,Cortana弹出一些提示:对你而言有意义的名字,你经常使用的文档,常用法语词汇的翻译。只要你允许,Cortana可以将你的个人数据纳入进去,比如通讯录、网络搜索历史。

Cortana每时每刻都在变化,例如,APP开发者可以知道程序到底是在早上最有用,还是在晚餐时最有用。阿什解释称:“只要你允许,利用与你有关的对话,有关的环境信息,Cortana可以加快操作速度,让你感觉到一切尽在掌握之中,这才是我们真正感兴趣的。在我们的用户体验工作中,有许多与简约、消除摩擦、展示智能的威力有关。”

有一个功能深受阿什的喜爱,它叫作“Commitments”。只要你允许,Outlook可以为你做笔记,到了周末时发给老板,如果发送不成功它会自动提醒你。阿什说:“我的生活相当复杂,我经常会忘了一些事情,尤其是电子邮件。”他还举例说,最近他也曾忘记老板交待的事,幸亏Cortana及时提醒。

智东西PC结尾