亚马逊不服谷歌 Alexa要支持8种自然语音

智东西（公众号：zhidxcom）
编 | 竭渴

智东西5月17日消息，亚马逊今日开始将允许Alexa语音应用的开发者免费使用8种来自于Amazon Polly的自然语音，让Alexa的语音应用程序能更具特色。这8种自然语音中，男女声都有，全部采用美式英语发音。

（Alexa支持的8个自然语音）

一、自然语音？有多自然？

Alexa新拥有的自然语音，是通过Amazon Polly提供的。Amazon Polly是亚马逊提供的基于深度学习技术将文本转换为逼真语音的服务。

Amazon Polly支持语音合成标记语言（SSML），它是一种基于XML的W3C标准标记语言，适用于语音合成应用程序，且支持使用通用 SSML标签进行断句、重音和语调。

简而言之，Amazon Polly合成的语音有语气和声调的高低起伏、有语速的快慢交替，也会在讲话的过程中适时的停顿断句。

那么，Amazon Polly是如何将它合成的语音发送到搭载了Alexa的智能设备上的呢？

Amazon Polly可以为开发者提供一个 API，借助此 API，开发者可以将合成语音快速集成到智能设备的应用程序中。开发者只需将要转换成语音的文本发送到 Amazon Polly API，Amazon Polly便会立即将音频流发送回应用程序中。有了这个API，开发者可以选择让用户在应用程序中进行即时语音交互，或将 Amazon Polly发送回来的音频流以MP3的格式储存下来。

Amazon Polly支持的语音、语种不止8种，它可以提供几十种逼真的语音并支持多个语种。此次亚马逊仅向Alexa语音应用的开发者提供8种美式英语语音，或许是出于Alexa的很大一部分用户目前集中于美国的原因。

（Amazon Polly支持的部分语音、语种）

二、亚马逊为何要让Alexa听起来不一样？

首先，让Alexa能发出更多不同的声音，有助于提升用户使用Alexa的感观，消除人与机器之间的距离感。例如，当小朋友使用Alexa，让其读故事时，不同的语音和起伏的语调会更让小朋友有代入感。

其次，科技巨头们为了抓住更多用户，在技术应用上竞争激烈，亚马逊此举应该是回应谷歌上周于I/O大会上宣布Google Assitant将支持6种不同语音一事。谷歌I/O大会上，谷歌CEO Sundar Pichai向大家展示了Google Assitant上通过WaveNet合成的超自然语音，其中一个语音甚至来自于著名R&B歌手John Legend。Sundar Pichai说这是为了适应Google Assitan用户各种不同的发音习惯。

可见，语音助手们为了获得用户的“芳心”可谓煞费苦心。我们是不是可以期待，有一天，语音助手能开口就对我们讲出一口流利的四川话/东北话呢？

亚马逊不服谷歌 Alexa要支持8种自然语音

一、自然语音？有多自然？

二、亚马逊为何要让Alexa听起来不一样？

相关推荐