智东西(公众号:zhidxcom)
编 | 竭渴

智东西5月17日消息,亚马逊今日开始将允许Alexa语音应用的开发者免费使用8种来自于Amazon Polly的自然语音,让Alexa的语音应用程序能更具特色。这8种自然语音中,男女声都有,全部采用美式英语发音。

8个口音

(Alexa支持的8个自然语音)

一、自然语音?有多自然?

Alexa新拥有的自然语音,是通过Amazon Polly提供的。Amazon Polly是亚马逊提供的基于深度学习技术将文本转换为逼真语音的服务。

Amazon Polly支持语音合成标记语言 (SSML),它是一种基于XML的W3C标准标记语言,适用于语音合成应用程序,且支持使用通用 SSML标签进行断句、重音和语调。

简而言之,Amazon Polly合成的语音有语气和声调的高低起伏、有语速的快慢交替,也会在讲话的过程中适时的停顿断句。

那么,Amazon Polly是如何将它合成的语音发送到搭载了Alexa的智能设备上的呢?

Amazon Polly可以为开发者提供一个 API,借助此 API,开发者可以将合成语音快速集成到智能设备的应用程序中。开发者只需将要转换成语音的文本发送到 Amazon Polly API,Amazon Polly便会立即将音频流发送回应用程序中。有了这个API,开发者可以选择让用户在应用程序中进行即时语音交互,或将 Amazon Polly发送回来的音频流以MP3的格式储存下来。

Amazon Polly支持的语音、语种不止8种,它可以提供几十种逼真的语音并支持多个语种。此次亚马逊仅向Alexa语音应用的开发者提供8种美式英语语音,或许是出于Alexa的很大一部分用户目前集中于美国的原因。

多语种

(Amazon Polly支持的部分语音、语种)

二、亚马逊为何要让Alexa听起来不一样?

首先,让Alexa能发出更多不同的声音,有助于提升用户使用Alexa的感观,消除人与机器之间的距离感。例如,当小朋友使用Alexa,让其读故事时,不同的语音和起伏的语调会更让小朋友有代入感。

其次,科技巨头们为了抓住更多用户,在技术应用上竞争激烈,亚马逊此举应该是回应谷歌上周于I/O大会上宣布Google Assitant将支持6种不同语音一事。谷歌I/O大会上,谷歌CEO Sundar Pichai向大家展示了Google Assitant上通过WaveNet合成的超自然语音,其中一个语音甚至来自于著名R&B歌手John Legend。Sundar Pichai说这是为了适应Google Assitan用户各种不同的发音习惯。

可见,语音助手们为了获得用户的“芳心”可谓煞费苦心。我们是不是可以期待,有一天,语音助手能开口就对我们讲出一口流利的四川话/东北话呢?