思必驰新技术发布会:以语音为入口 引领人工智能革新

智东西(公众号:zhidxcom)

文|坚果壳  AISPEECH

智东西2015年7月29日讯,思必驰“语声纪元”新技术发布会在深举行,来自智能硬件业内的朋友以及中小创业者等500多位专业观众参加了此次智能语音技术盛会。

 思必驰新技术发布会:以语音为入口 引领人工智能革新

本次发布会由思必驰CEO高始兴主持,联合创始人、首席科学家俞凯教授与大家分享了思必驰最新的语音技术。本次活动也邀请了易观智库的高级分析师封莉做关于“智能硬件用户画像解析”的主题演讲,同时邀请了映趣科技CEO王小彬、欧瑞博CEO王雄辉、威仕特CEO闻政几位嘉宾亲临现场,分享他们的产品经验。

 思必驰新技术发布会:以语音为入口 引领人工智能革新

此次思必驰新技术发布会到底给行业带来了什么?智东西(公众号:zhidxcom)将发布会的核心要点浓缩如下:

一、远场及抗噪技术突破

在国际通用的噪声标准测试库上,思必驰的最新结构化抗噪语音识别技术刷新了国际记录,取得目前世界单系统最好成绩。模型算法的优化突破,使得思必驰仅用软件解决方案就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。

二、更先进的回声消除和麦克风阵列算法组合

先进的回声消除算法和麦克风阵列算法结合,可以有效的跟踪用户位置,增强语音信号质量,实现高性能的通用语音识别。软硬件结合的多种解决方案,更给出了更多的选择和可能性。仅靠软件且单麦克风条件下,通过大数据整合以及智能算法,思必驰仍然可以达到极为优秀的使用体验,识别速度与准确率均处在世界领先水平。

三、基于统计的参数化语音合成方法

传统语音合成是采用拼接技术,录制大规模的语音库,切片后在合成的时候把片段拼起来,这就往往需要大量的标准语音。思必驰采用最新的基于统计的参数化语音合成方法,可以实现模型规模的大幅压缩,语音连贯性的大幅提升,能够自由训练个性化的语音。

四、多轮交互和根据上下文的语义解析

在真实场景下,传统语音识别加自然语言处理的方案并不能很好地实现自由的“人机交互”。思必驰在领先的传统语音识别合成技术的基础上,引入交互认知智能,通过情境理解和多轮交互,面向最终任务完成度和用户体验进行系统设计和优化。

思必驰信息科技有限公司作为国内最顶尖的智能语音解决方案商。认知型的对话技术是语音交互的发展趋势,智能硬件更是语音交互的爆点。此次新技术的发布,不仅给行业带来一场革新,更是对现今“智能硬件”所谓之“智能”进行的一次重新定义!