微软AI大会:小冰早就能给用户打电话 还能让孩子成为故事的“主人公”

寓扬人工智能2018/05/21

智东西(公众号:zhidxcom) 文 | 寓扬 智东西5月21日消息,今天,微软在中国召开首届人工智能大会。 […]

智东西(公众号:zhidxcom)
文 | 寓扬

智东西5月21日消息,今天,微软在中国召开首届人工智能大会。它与微软Build开发者大会类似,可以算作Build大会的中国版。会上微软也对Build大会中AI方面的进展进行呈现,比如Azure IoT Edge(边缘计算)、AI会议系统、微软小娜与亚马逊Alexa的“联姻”等。

而今天的微软AI大会也重点介绍了微软小冰的最新进展,包括底层技术框架的改变、AI打电话、语音韵律改善、与人类协同创造等。此外,微软还展示了机器翻译技术在小米生态链产品魔芋翻译机中的落地。

有趣的是,在谷歌I/O大会上展示AI打电话后,微软(亚洲)互联网工程院就发布技术声明,人类历史上第一次与人工智能进行全双工语音电话是在中国发生,在2017年9月微软小冰就主动给人类打了第一个电话。

在展示AI会议系统时,微软黄学东博士还在现场diss了一下同行谷歌的全双工技术,戏称如果谷歌的是全双工,那么微软的就是“全五工”,微软的AI系统可以同时支持5人对话。

今日,微软还宣布收购对话系统创业公司 Semantic Machines,它由对话式AI知名研究人员UC Berkeley 的 Dan Klein 教授和斯坦福大学的 Percy Liang,以及前苹果首席语音科学家 Larry Gillick等人共同创办。

此外,微软还推出在线人工智能学院,目标是一年内培养10万余名AI人才,免费提供AI课程,还可以申请微软专业学位课程作为职业技能认证。

会后,微软全球高级副总裁、云计算与人工智能事业部负责人郭昱廷接受了智东西等媒体的采访,介绍了微软在物联网终端的布局,制造业、工业、智能家居等会是微软的重要场景,并通过边缘计算和云计算共同实现智能化。

一、推出AI看图 落地机器翻译

今天的微软AI大会与2周前微软在美国召开的Build开发者大会类似,可以理解为Build大会的中国版,在展示中更加侧重与中国企业的结合,并且重点介绍了微软小冰的一些新进展,毕竟小冰就是诞生在中国的微软亚洲研究院。

现场,微软资深副总裁、大中华区总裁兼CEO柯瑞杰做了一个开场白,他介绍到,微软中国已经有25年的历程,目前有5000名员工,17000合作伙伴,是美国以外最大的研究院。微软的开发者超过40万,有超11万企业客户,在美国以外认知服务使用量第一。

微软全球执行副总裁、人工智能即微软研究事业部负责人沈向洋博士也展示了一下Build大会中重点介绍的内容,比如重点介绍了微软在边缘计算的布局Azure IoT Edge,与高通、大疆、Roobo等推出视觉AI、智能家居等领域的解决方案。

每年新增90亿台基于微控制器的设备,但是联网的不到1%。微软最新推出的Azure Sphere,通过联网,为设备提供安全的云端服务、微控制器、和安全的操作系统,也希望与中国公司合作,建立这个物联网端的生态系统。

微软在四个关键领域进行研发,包括认知服务、对话式AI、开放的平台与工具、实时人工智能基础设施。后面的演讲也主要围绕这四个方面展开。

在认知服务上,全球已有100万开发者在使用这项服务,微软目前提供全面可定制的24项服务,其中17项已经正式商用。微软还重点介绍了AI图片描述功能与OCR光学识别引擎。其中当你给机器一张照片时,它能够像人类一样对图像进行描述,目前已经支持中文。比如在这张图片中,AI描述到,这位女士在桌前吃蛋糕,并且表情很开心。

微软还重点展示了魔芋翻译机,它由小米生态链企业香蕉出行推出,采用了微软翻译系统,算是微软机器翻译能力在翻译机这一硬件产品上的落地。这款产品可以在14中语言中进行切换,现场进行了较为流畅的中英互译,但在语音切换的演示中出现了一些乌龙,微软黄学东笑称“网络问题”。

此外,微软还展示了“AI会议神器”,它今天以中文的形式更直观的进行了现场展示,应用于会议场景,目前可支持5人的实时对话记录。在现场Demo展示中,AI会议系统会对会议中每个人的发言进行实时的记录,并标明了发言人,不知道是否是搭载了声纹识别?在左侧呈现会议记录的同时,右侧也会呈现会议中的待办事项。

二、小冰早就能打电话 还能让儿童成为故事的主人公

微软小冰可以说是今天的主角,一方面它代表了微软对话式AI的进展,也是主场参战,毕竟小冰诞生于中国,现场重点介绍了小冰的最新进展。

目前微软小冰已经有1亿用户,累计对话量超过300亿,它可以观察人的语音、语调以及情绪,还可以实时预测人所要说的内容。近几年小冰也是频频化身主持人、歌手、诗人等进入人们视野。沈向洋称:“小冰的粉丝数量,比其他聊天机器人的用户加起来还要多”。

微软亚洲互联网工程院副院长李笛先介绍了微软最近更新的全双工技术,之前的对话更多的是基于单个任务的对话,而小冰则采用了面向对话流程的底层技术架构,即他所说的Session-oriented,可以理解为像河流一样的对话,小冰关注的不在于一个任务的完成,而在于整个对话的效果。

针对谷歌最近秀出的AI打电话,他称微软小冰去年9月就给用户主动打了第一个全双工电话。现场微软展示了一个用户向小冰倾诉工作生活中的烦恼,在聊天过后,小冰还主动打电话给用户进行安抚。

近期,微软小冰还落地小米生态链企业Yeelight的智能音箱,李笛介绍了一个用户与小冰进行了长达6小时的对话,涉及8个领域,53个话题,小冰完成了16个任务,来展现小冰的对话能力。

他称,尽管到今天小冰依然存在前言不搭后语,但是它可以像河流一样与用户进行对话,只有有机会保持对话和引导对话,才能探索更多落地应用。比如小冰在日本提供打折券,4日内平均到店完成率达到57%。今年秋季微软会在中国和日本开放全双工语音交互。

今天微软还介绍了小冰的两项新进展:韵律训练与协同创造。韵律训练主要是小冰像人类学习语言的声调韵律,比如小冰对凯叔(就是凯叔讲故事的凯叔)的声音进行学习,展示的声音在声调、韵律等方面已经与凯叔十分接近。

另外一项协同创造已经是小冰“创造”能力的展示了,微软分享了小冰的两项新进展,一项是近期小冰会推出一本新的诗集,与上一本不同的是,这本诗集是由小冰和人类共同创作。

另外一项是与家长一起为孩子讲属于他们的个性化故事。家长可以设定主人公的名字(比如你的孩子),和设定故事的走向(比如更倾向教育)。然后小冰会采用专门的深度学习模型,能够对故事文本进行个性化定制,自动分配声音角色和背景音乐等,利用约 20 秒时间即可生成一个10 分钟左右的童话故事。该技能将在今年儿童节前夕正式发布。

这个技能可谓是众多父母的福音呀, 不但可以让孩子成为故事的主人公,还可以由家长设定故事倾向,实现寓教于乐的目的。

结语:深入落地的微软

无论是今年微软的Build大会,还是今天微软的中国首届AI大会,我们都可以感受到,微软十分重视边缘计算,重视物联网终端的布局,并提供终端解决方案、操作系统、云端服务等来打造物联网端的生态系统。而此次微软在中国举办AI大会,则意味着微软更加注重AI能力在中国企业的落地。

微软小冰作为一款主打情商路线的对话式AI,一方面是交互能力更强,另一方面微软也开始了探索小冰的行业应用和商业落地,比如落地小米生态链企业Yeelight智能音箱,在日本进行商业场景的探索。

这样一款主打情商的对话式AI,当其交互能力进一步提升后,又会带来多大的商业价值呢?

zhidx