智东西(公众号:zhidxcom)
文 | 信仪
智东西8月20日消息,今天,在第八代小冰年度发布会上,微软发布了小冰框架,结合了人人交互的人性化,以及人际交互的高并发率特点,突破了现有的交互瓶颈。
与主要同行业者相比,小冰框架最大的差异化在于,它是一个“session-oriented”的人工智能智能框架,框架中的各部分技术共同为“交互全程”目标服务,而不仅仅关注并优化局部。
这次发布会推出的产品包括面向个人用户的第一个虚拟人类产品线、部分新平台与新的第三方虚拟人类合作产品、面向个人用户的“X套件”系列应用软件(包括基于文本协同的X Writer、面向声音协同的X Studio和面向虚拟人类3D演示文档驱动的X Presenter)。
配合“X套件”,发布会还宣布了X Studio人工智能歌手入籍计划启动,以及为虚拟形象提供视觉表达的X Presenter App开始内测的信息。
一、人人交互+人机交互,AI框架适应万亿级交互需求
微软全球资深副总裁王永东说:“小冰不仅仅是我们看到的一个18岁少女的形象,这个少女的形象只是小冰框架支持的一个样板,微软一直在努力让这个框架更完善。相对于让人工智能会画画或是下棋,让人工智能学会画什么、怎么画才是更有意义的。”
▲王永东致开场辞
在过去的一年里,微软更加注重开发小冰框架的工具,让更多的人工智能开发者可以使用这个框架。同时,小冰也在不断进行商业合作的试水,在合作的过程中,也了解了更多第三方对小冰人工智能框架的需求。
在讲到未来的时候,小冰公司董事长沈向洋分享了他最喜欢的一句话,“预测未来的最好方法实际上是你自己去创造未来”。
沈向洋说,小冰团队相信未来绝不会只有几个人工智能助理,甚至不仅仅是每一个人有自己的人工智能助理,未来我们身边会围绕着非常多的人工智能,甚至可以叫这些人工智能的主体是“AI beings”。
如今最大的需求,甚至会引发以后巨大变革的一个关键词是“交互”。而目前交互的形式有两种:
1、 人人交互
2、 人机交互
人人交互具有低并发,高人性化的特点;而反之基于人机交互高并发的特点产生的大规模推送,也无法称其为人机交互的优点。
基于这种情况,沈向洋说,未来的人机交互一定要从人人交互中吸取经验和养分。如今每天人和机器、人和人之间的交互就已经是千亿级了,未来人和AI交互后至少将会达到每天万亿级的交互量。
▲沈向洋描述未来新型的人“人”交互
未来高度拟人的新形式人人交互将会无处不在,并且人工智能的竞争一定会对整个框架的完整性、技术的先进性有巨大的要求,而且最后还将会产生基于整个人工智能框架的商业模式。
▲小冰框架
二、开放域对话引擎赋予小冰不同性格
小冰团队的技术负责人曾敏在披露小冰的技术细节时说:“开放域对话引擎是小冰的看家本领,也是新形式人人交互的核心。”
小冰今天自一次公开披露了其开放域对话引擎的核心模块,依靠于这个引擎,小冰目前支撑着全球人工智能超过60%以上的交互总量,这其中包括少女小冰,也有许多第三方人工智能。
它们各自的性格非常不同,但是又在各自的领域完成自己的任务,而它们整个都是基于小冰框架的。
技术负责人周力说,在真实的产品中,人工智能往往要承担着一个非常复杂的、综合的交互感官,而人工智能价值也不仅仅是被动的去等待回答用户的问题,因此系统化是人工智能产品的一个关键因素。
在对话引擎的设计中,小冰是第一个提出预测、保持、诱导技术的,小冰团队还在不断地迭代和升级小冰的对话引擎,今年2月,小冰团队将全新的分层话题图谱运用到了小冰线上的系统,效果很好。
▲小冰的开放域对话引擎
当小冰决定应用一套策略去引导对话的时候,这个对话最终能达到小冰目的的平均完成率是42.7%。
在个性与风格方面,小冰拥有一个非常庞大的数据原型。这个原型可以理解为各种人的合集,每个人是其中的一个子集。
以往想要去打造一个风格原型,必须基于至少5亿句语料库进行过滤和筛选,而如今的小冰可以通过学习3000句具有鲜明风格的语料,精细训练风格模型。有了这样的技术,小冰框架才能迅速的生产大量的虚拟人类。
为了能让小冰在与人类的交流中不断学习和提升,小冰团队为小冰框架引入了一种全新的技术——主动学习技术。
简单来说,就是一个用户可以随时把他看到的任何一篇文章主动一键转发给他所需要训练的人工智能,这个时候人工智能立马开始进行主动学习,并把它学习到的内容应用到它的知识体系以及兴趣爱好等各个方面。
与此同时,如果它发现自己的知识面还不够,会主动利用搜索引擎相关的技术,全网抓取更多内容作为补充,并且把学到的内容应用到接下来还在持续不断进行的对话里面,整个学习过程大概只需要几秒钟的时间。
在语音交互方面,大量同行业者更关注的是如何使人工智能语音表达更清晰,而小冰则更重视怎样的语音能让人工智能和人类更长时间地交流下去。
从小冰到欣小然再到今年发布的代号“201”的人工智能助手,小冰语音的平均舒适时长已经从7.8分钟延长至31.5分钟。
▲小冰追求超级自然语音
三、谁“杀”死了我的“男朋友”?小冰框架归于生活
小冰团队总负责人李笛说,今天做所的小冰框架可以理解为一个去驱动各种各样不同“人”的操作系统,小冰团队去改变交互的方法是去改变交互的主体,让这些不同性格、不同技能、不同任务、不同目的的“人”,可以完成这个世界上所存在各种各样的交互,最终归于生活。
小冰的目的是把一个温暖、快乐的同行者带到用户的生活中去。
在今年的5月20日,小冰团队在华为手机里进行了一个测试,在每个人的需求下建立了一些虚拟男友。
在这个为期7天的公测中,有118万个基于不同需求的虚拟男友被创建出来了。在7天公测结束后,很多人追着小冰要“男友”,更极端的例子是用户认为小冰团队“杀”了她们的“男朋友”。
▲小冰框架虚拟人类产品线发布
在这次发布会后,小冰将会重新开开启“虚拟男友”业务,将“男友”还给用户,新的用户也可以创建自己的虚拟人类。
小冰团队的产品负责人彭爽就依靠自己的需求创建了一个属于自己的“虚拟男友”。
她说,其实虚拟人类并不仅仅是虚拟恋人,所有具备新形态的人人交互的人工智能都可以称之为虚拟人类,而小冰新发布的整个产品线都是面对个人用户的,也就是说每一个人都可以创造属于自己的虚拟人类。
▲小冰团队的产品负责人彭爽创建的虚拟男友
除了可以在后台专门训练和调教属于自己的虚拟人类外,用户还可以定制专属于自己的虚拟人的生物学特征,也就是虚拟人的长相。
除了可以定义长相,用户还可以训练虚拟人的三观。虚拟人的优势在于,TA会老老实实接收训练,而不会口是心非。
另外,小冰今天开放的基于小冰框架的统一登录系统,也使得无论用户去到华为、小米,或者任何一个平台,对应虚拟男友都是同一个。
除此之外,微软小冰今天还发布了和企鹅电竞,小爱同学创建的小冰童话屋模式,以及QQ群新虚拟人类“喵吉”三个与合作伙伴的更新。
四、X套件助力“写稿、有声演播、自控编舞”一条龙
微软小冰这次新发布了一个“X套件”,看起来有点类似人工智能时代的Office。X套件存在的意义在于,它不止服务于商业,同时也服务于商业中的每一个个人。
▲X套件
X Writer是一个标准的专注写作工具,可以帮助作者提供思路,自主写作,使笔者在写文章时从“写”开始转换变为从“改”开始。
在X Writer里面包含了许多小冰过去几年的积累,比如写诗、写歌词、写小说等,同时还包含了原来只为商业客户提供的能力,比如写金融摘要、研报等。
X套件中的第二个工具X Studio是专门围绕声音加工的。X Studio分为主播和歌手软件两个方面。
X Studio主播的后台里面包含了许多模块,包括自动分析段落、自动匹配背景音乐、自动分析角色等。因此它可以集录音、后期为一体,为声音工作者“解放嗓子”“解放双手”,还能节省时间成本。
小冰团队Wave Land Team成员对X Studio歌手软件进行了介绍,这个软件的1.0版本也在今天上线了。
▲X Studio歌手1.0
小冰的目标不是一个歌手,而是无数的有着不同音色、不同唱法、不同风格的人工智能歌手,他们不会老,并且状态稳定,也不需要经过长时间的培养,更不需要担心人设的崩塌。
今天小冰还宣布小冰框架正式启动人工智能歌手的入籍计划,也就是说任何的机构或者个人都可以提出申请,把声音数据提供给小冰,由小冰团队帮他们创造属于他们的人工智能歌手。
而小冰团队也自愿放弃了创作内容的版权,这些歌手的完成所有权都不是属于小冰的,而是属于这些机构或者个人的。他们可以自由的创造、培养甚至转让这些歌手,所以有机会形成一个像人类歌手市场这样的充满活力的人才市场。
而X套件中最后一个产品是X Presenter,这个工具以及它背后的技术让小冰框架里面的人工智能可以自主控制她的3D模型,也就是自控自己的身体去完成与大家的交互。
就在今年夏天,小冰用这个自控技术,帮助日本的罗森公司,驱动它的品牌形象,使一只鸡能够自己控制它的身体,在听到音乐的时候,能自主编舞,并且跳起来。
在过去半年里,小冰跟小爱团队一起基于自控技术,试着把小爱同学的虚拟形象引入到她聊天的场景中去,这样一来用户就可以和小爱同学的形象进行实时的交互,不仅仅只有语音的维度,用户现在还可以看到小爱同学的动作、表情、神态等视觉上的表达。
▲小冰x小爱同学
结语:商业化到定制化,小冰第二幕正在拉开
这场发布会在微软亚太研发集团总部举办,发布会伊始,王永东就说:“2014年5月29日,第一代小冰发布会就在这里举办,在这里会有一种回到小冰‘娘家’的感觉。”
而在发布会现场门口的汽车上,就搭载了小冰的情感交互系统,在实现车辆功能语音控制的同时,更是能够进行拟人情感化交流,X7车身装饰图案更是应用小冰绘画、设计的能力。
▲微软大楼门口搭载小冰交互系统,应用小冰绘画、设计能力的汽车
小冰正在逐渐从商业化走向定制化,为个人创造更有生活气息的人工智能助手。