11091-1

四大场景十大新品 科大讯飞让AI这样落地

寓扬人工智能 智东西智能音箱产业系列报道 智能音箱重磅选题2017/11/09

智东西(公众号:zhidxcom) 文 | 寓扬 智东西11月9日消息,今天,科大讯飞在京召开年度发布会。如果 […]

智东西(公众号:zhidxcom)
文 | 寓扬

智东西11月9日消息,今天,科大讯飞在京召开年度发布会。如果说刚刚过去的讯飞全球1024开发者节,是讯飞讲了一个拿10.24亿人民币扶持1024个优质项目的故事,那么今天发布会则真的是在发布产品!

首先科大讯飞董事长刘庆峰公布了核心技术在2017年的进展,包括语音合成、语音识别、医疗影像、图像理解等,并讲解了讯飞的AI技术落地在教育、医疗、司法、家庭中的进展。

如果刘庆峰的演讲还不够“干”,科大讯飞轮值总裁吴晓如则直接围绕教育、医疗、客服行业一口气带来10款产品。紧接着科大讯飞执行总裁胡郁则又围绕AIUI平台和翻译、移动、车载、家庭四大场景发布/升级若干产品,来抢占AI场景。

一、核心技术决定AI产业进程

刘庆峰走上讲台,先公布了一个刚刚取得的好成绩。科大讯飞智医助理通过国家医师资格考试,该考试满分为600分,分数线为360分,专业毕业学生只有一半通过。而讯飞AI助理考了456分,超分数线96分,已超过绝大多数人类考生。

IMG_20171109_142114

接着他引入了演讲的主题“核心技术决定AI产业进程”。而从人工智能的发展和技术可以分成三级推进的体系,第一级是各种基础算法,随着深度学习DNN、CNN、RNN等技术的不断突破,在这个基础上就集成出了技术成果;通过感知、理解和推理,将原始数据进行决策呈现;有了这二级推进体系,就可以将技术落地到教育、医疗、客服等各种应用领域。

IMG_20171109_142834

接着他讲述了讯飞在语音合成、语音识别、医疗影像、图像理解等各个技术领域在2017年取得的进展。

在科大讯飞的强项语音合成上,讯飞已经在语音合成大赛blizzard challenge上12连冠, 在5分制中,语音合成效果达到4.0分,已经很接近自然语音的4.8分。此外,在今年的无监督学习的语音合成比赛中,讯飞再次获得第一名。

IMG_20171109_142855

这意味着机器可以在不需要数据标注的情况下自己来学习语音数据,讯飞也将通过这项技术来应用于方言保护。之后刘庆峰又展示了一段对美国总统特朗普的语音合成音,再次秀了一下肌肉,毕竟是自己的看家本领。

在语音识别的准确率上,讯飞已经达到98%,并且拥有1.2亿月活用户。方言识别方面也持续突破,目前讯飞已覆盖22种方言,相对2016年提升了50%以上,方言识别准确率超过90%的已达到10种。

IMG_20171109_143220

在图纹识别准确率上,讯飞在英文手写识别上由去年的92%提升到了97%,混合图纹识别也达到了92%,可以应用到试卷、作业以及个性化学习中。

在医学影像上,讯飞在今年8月刷新了国际医学影像领域权威评测LUNA的世界纪录,对影像肺结核的判断达到94.1%。

IMG_20171109_143512

在图像理解方面,讯飞在由奔驰发起的国际自动驾驶比赛中取得第一名,包括谷歌在内的44家企业参与其中。比赛任务为自动驾驶中的场景分割,即分清物理世界中的人和物,讯飞的图像理解能力达到81.4%。

而在最难的阅读理解能力上,斯坦福机器阅读理解比赛是时间最难的比赛,谷歌、微软、Facebook、IBM等都参加挑战,讯飞也获得了该比赛的第一名,阅读理解准确率达到86.45%,刷新了世界纪录。

IMG_20171109_143752

另一方面就是刘庆峰一开始谈到了医学推理,讯飞的智医助理通过了国家医师资格考试,并取得了456分的好成绩。刘庆峰谈到,这个技术是很有挑战性的,必须让机器学习海量的医学知识、国际论文和案例,需要对问题进行深度理解、语义证据抽取、多尺度推理获取答案,而其中的关键点就是语义理解。

二、AI落地4大场景

谈完了科大讯飞的技术进展,刘庆峰又谈起了技术落地,只有AI+场景才能实现AI的价值。而讯飞优先布局的场景是教育、医疗、司法、家庭等领域。

在AI+教育中,讯飞通过大数据分析和评价进而“发现你”,基于AI知识图谱与个性化推荐来帮助你学习,进而“成就你”。目前讯飞已经和12000所学校合作,帮助1500万师生学习,并诞生出了14位省状元。

IMG_20171109_144335

在AI+医疗上,讯飞从发病率最多的肺结核、乳腺癌等疾病做起,推出医疗影像、医考机器人,开展AI辅助诊疗中心,辅助医生决策。

第三块是赋能司法,讯飞的语音卷宗录入,语音庭审可以达到98%的准确率,节省司法机构28%的时间,进而辅助判案。目前讯飞已经覆盖了31省,360家法院,100家检察院。

IMG_20171109_144803

最后则是用AI赋能家庭,讯飞的输入法、学习软件、配音阁、叮咚音箱、阿尔法蛋等越来越多的产品进入亿万家庭,从而将智能带进家庭。

最后,刘庆峰又抒了一下情,希望通过AI+时代,从而赋能每个人,让人们更聪明更有创造力。

三、一连串发布3大行业10款产品

如果说刘庆峰从宏观上谈了讯飞技术在场景中的落地,那么科大讯飞轮值总裁吴晓如则一口气带来了10款产品,围绕教育、医疗、客服三个领域,其中仅教育就占了5款,可见讯飞对这块业务的看重。

vbox4052_CY7A7675_151058_small

(科大讯飞轮值总裁吴晓如)

1、AI+教育

吴晓如谈到,在优质教育缺乏的情况下, 可以用AI来实现精准教学、因材施教的目标。为此,科大讯飞一口气为教育发布5款产品,分别为智慧微课工具1.0、智慧纸笔课堂1.0、智慧作业平台1.0、智慧组卷工具1.0、智学2.0,12月份全国首发。

IMG_20171109_153546

智慧微课工具1.0:通过一个小的麦克风,可以把老师的声音同步转换成文字,并使讲解过程和PPT同步化,录制课程,形成课件。

通过内容语义理解,能够标记关键点。此外还支持一键分享,智能检索功能。目前课堂语言撰写准确率超过95%,可在课堂环境抗噪大于70dB的环境下使用。

IMG_20171109_151314

智慧纸笔课堂1.0:学生通过手写设备,在纸笔书写后,点击下方按钮,可以同步上传,进行手写识别,老师就可以看到每个学生的答题情况。该智慧纸笔课堂可支持课堂人数多达100人,手写设备的手写识别准确率可达到97%,并且该设备续航时间可达一周。

IMG_20171109_151944

智慧作业平台1.0:在学生作业做完后,通过简单拍照上传到系统,就可以得到效果反馈,从而实现智能批改,互动反馈。目前作文拍照识别准确率可达95%,作文批改与专家评分相关度也达到了95%。

智慧组卷工具1.0:该工具可以选择模仿样卷,通过AI对知识点覆盖、难度系数的分析,抽取关键特征,进而从后台800万的试题库中进行生成试卷。老师通过它可以在3分钟生成一个知识点覆盖、难度系数相当的试卷。

IMG_20171109_153109

智学2.0:在智学1.0中,科大讯飞已经在全国1万多家学校采集了350多亿评测数据。现在将智学升级为2.0,通过AI把握各个知识点重要度、习得顺序,就可以建立学生的知识图谱,针对学生的薄弱知识点、以及相关知识点进行有针对化的学习。

2、AI+医疗

讯飞将AI应用于医疗的目的是打造一个医疗辅助平台,进而帮助医生高效决策。在医疗方面,讯飞发布了语音电子病历、医学影像辅助诊断系统、智医助理、人工智能辅助诊疗平台四款产品。

IMG_20171109_154449

语音电子病历:在医生诊治过程中进行语音的全程录制,医生经过简单的处理,就可以打印电子病历。该产品可以让病历处理效率提升4倍,医学术语识别准确度可达98%。

医学影像辅助诊断系统:这块在前面已经有所介绍,讯飞靠着它刷新了国际医学影像领域权威评测LUNA的世界纪录,对影像肺结核的判断达到94.1%。目前这项技术主要应用在肺部诊断、乳腺癌诊断等发病率稿的领域。该系统诊断效率可达1秒/例,系统诊断质量可达94%。

IMG_20171109_155116

智医助理:根据病情信息,智医助理能够对电子病历进行理解处理,给出诊断建议,辅助医生参考,缩短诊疗周期。它还能根据诊断结果进行学习,改进自身的诊断建议。

人工智能辅助诊疗平台:讯飞还将语音电子病历、影像辅助诊断和智能辅助诊疗相结合,推出AI辅助诊疗平台,应用在三甲医院、体检机构,以及基层医疗结构。并提供1000万AI在线诊疗服务,开展贫困、边缘地区的医疗公益。

IMG_20171109_155720

其中,语音电子病历将在今年11月发布,医学影像辅助诊断系统将在今年12月发布,智医助理将在2018年3月发布。

3、AI+客服

在智能客服1.0 的基础上,讯飞推出了智能客服2.0,搭载全语音门户和智能客服助手。

吴晓如谈到,全语音门户将会在未来3年替代按键式电话服务,通过语音提供更好用户体验。而智能客服助手,可以为客服人员提供第二个大脑。在客服与用户的对话过程中,该智能助手可以推荐更合适的话术、产品推荐,辅助推荐与营销,真是人机搭配,干活不累。

四、AIUI 2.0落地四大场景

在一系列教育、医疗、客服产品发布后,显然科大讯飞意犹未尽。科大讯飞执行总裁胡郁又针对翻译场景、移动场景、车载场景、家庭场景这4大场景推出数款产品。昏晕中······

vbox4068_5K9A3028_160536_small

(科大讯飞执行总裁胡郁)

作为科大讯飞消费者BG的总裁,胡郁则把目光聚焦到了讯飞开放平台上。他谈到,在过去1年中,讯飞的开发者团队数量从原来的23万涨到了46.5万,接入设备数从原来的9亿台增加到现在的15亿台,语音日服务次数也从原来的29亿次增长到40亿次。可见过去一年,讯飞开放平台确实取得不错的进展。

IMG_20171109_160827

接着他先宣布了AIUI的升级。在AIUI的1.0系统中,它支持自动纠错、方言识别、全双工交互、远场降噪以及多路对话。而在AIUI 2.0中,该系统还支持主动式对话、语种自适应、多模态交互、个性化识别。而这些能力也将赋能翻译、移动、车载、家庭四大场景。

IMG_20171109_160959

1、翻译场景

首先在晓译翻译机1.0的基础上,讯飞推出了晓译翻译机1.0+。胡郁谈到,尽管第一代产品销量也很好,但面临3大问题:网路不佳、面对多语言环境、紧急联络,即在离线状态下无法使用。

IMG_20171109_161426

针对这一状况,1.0+版本支持离线翻译、多语言、一键求助,满足用户在通用场景下的使用。一键求助能够在3秒和讯飞的后台相连接,从而获得帮助。“是不是很酷”,胡郁笑称到。

其次,针对儿童,讯飞还推出了译呗产品,从而帮助儿童随时随地学习英语。

2、移动场景

讯飞输入法也是讯飞的一款明星产品,目前已拥有5亿用户,1.2亿月活,98%通用场景准确率。针对讯飞输入法,讯飞又增添了语音个性化和语音修改功能。

通过对通用场景98%准确率的分析,讯飞发现23%的用户需要定制识别来优化效果。在600万个性化服务灰度测试中,通过语音个性化,识别效果可以再提升20%。接着,胡郁又展示了前天锤子发布中的语音修改功能。

3、车载场景

车载场景也是讯飞重点布局的一个场景,目前车载的飞鱼系统装机量千万,在线用户量超300万,语音月活90%。在车载场景中, 讯飞也将飞鱼系统升级为2.0,具备主动询问、智能说明书等功能。

IMG_20171109_163221

主动询问是指,在车中打通了用户的后台账户系统,了解用户的喜好,猜测你的意图,才能发起主动询问,从而实现“更懂你”。

智能说明书则是,通过让机器自主学习,读取汽车说明书,从而形成自己的知识体系,满足用户自由问答,对汽车知识的获取。此外,针对没有搭载飞鱼系统的车辆,讯飞还推出一个小飞鱼外设硬件,通过这个硬件就可以使用飞鱼2.0的系统。

4、家庭场景

胡郁谈到,讯飞要做的还不仅如此,未来讯飞还将进入家庭。而让家居智慧起来面临4大难题:技术难度大、开发周期长、声学结构难、场景局限性。

IMG_20171109_164138

为此,讯飞推出了魔飞麦克风系统,该开发套件采用立体构型、分布式拾音,并提供极简开发以及更强的交互效果。讯飞魔飞还支持声纹识别、手势控制以及语音购物。

One more thing !最后胡郁还秀了一下自家的脑机接口技术,即通过脑电波控制家具技术。现场胡郁远程指挥着操作人员执行,一个又一个控制家居的指令,也引得现场一阵掌声。但胡郁也指出这种科幻进入家庭还需要一段路程。

IMG_20171109_165129

结语:一场干货发布会

写到最后,不禁感慨一下这真是一场发布会!科大讯飞一连串的抛出了近15款产品。

通过这么多产品的发布,可见科大讯飞在教育、医疗、车载、家居等场景下的深入布局,通过AI+场景的策略来谋得更多的发展。

如果说刚刚过去的1024开发者节是为了构建生态,那么今天科大讯飞的发布会则传达一个声音:抢占场景!

zhidx