智东西(公众号:zhidxcom)
文 | 寓扬

在刚刚过去的百度世界大会,一款智能音箱raven H经过立项、ID设计、原材料选择、工厂制造约8个月的时间最终出世,百度创始人兼CEO李彦宏、COO陆奇亲自为它站台,它的发布在万千瞩目下占据大会近一半时间,以至于不少媒体调侃到百度世界大会变身智能音箱大会!

这款由渡鸦科技打造的raven H智能音箱凭借个性化的外观设计、多元的色彩以及具有想象力的顶部Touch模块受到业内关注。

独家:87天,百度渡鸦智能音箱诞生记

根据智东西从产业链参与各方的初略估计,百度这款智能音箱打造的近8个月过程中,至少有数千人参与其中。无论是渡鸦、度秘、材料商还是工厂,无论是前方一线还是后方,所有人加班加点追赶时间;无论是长达45天攻克材料难题,还是87天将设计图纸快速落地产品;无论是“备战会议室”,还是凌晨3点半随打随通的电话,都呈现了百度这款智能音箱诞生背后的故事。

独家:87天,百度渡鸦智能音箱诞生记

(百度硬件事业部总经理、渡鸦创始人吕骋)

智东西访遍百度硬件事业部总经理、渡鸦创始人CEO吕骋、渡鸦首席体验官阿不都力木·阿不都热依木(以下简称阿不)、Tymphany中国事业部总经理刘晓彤一干人等,并深度体验raven H智能音箱,为你复盘百度智能音箱诞生全过程,以及这款音箱究竟有何特殊之处。

一、数千人组团参战

首先,我们不妨沿着时间轴回到原点,看看这款智能音箱何时立项、如何诞生,从ID设计到工厂生产又经历了怎样的故事,百度内部以及产业链到底有多大投入。

这还要回到今年2月份,百度宣布全资收购主打家居场景智能设备的创业公司渡鸦科技,渡鸦创业早期,智东西就曾对创始人吕骋和该项目进行过深度报道。吕骋携团队正式加盟百度,并担任百度智能家居硬件总经理,向COO陆奇汇报。据智东西产业链人士消息,百度为渡鸦投资几亿元来打造一款智能硬件,渡鸦也不负使命,在11月16日百度世界大会前完工了raven H智能音箱。

独家:87天,百度渡鸦智能音箱诞生记

同渡鸦团队成员沟通中得知,智能音箱这个项目3月份开始立项,5月底第一个设计方案出来,然后在工厂实验材料、落地产品,10月初第一批样机出来,11月生产线上的样机完成。Tymphany中国事业部总经理刘晓彤与吕骋团队一起见证了渡鸦raven H从想法到诞生整个过程后,也感叹不已,据其估算,从拿到敲定的设计图纸,到产品最终落地并在11月16日公之于众,前后只用了87天,这个速度在智能音箱打造过程中是很了不起的效率,和渡鸦团队交流中,每次提到这个点,团队成员都表现出自豪和激动。

为了这款raven H,渡鸦近百名员工全部All in 智能音箱,百度内部也有DuerOS语音团队和AI团队等进行内部配合,而外部还有庞大的供应链体系,包括材料商、工厂的声学、结构、制造团队等,据渡鸦团队透露,加起来至少几千人组成的大团队参与到了这个硬件的开发生产中。

渡鸦团队2月份加入百度,为了这个项目团队不断扩充,目前已到近百人。据产业链人士透露,渡鸦做硬件的团队之前曾参与过旗舰手机的生产,在硬件领域呆了很多年,圈内都很知名,很专业也很拼!

立项并扩充团队后的第一件事就是ID设计,渡鸦找到了北欧的著名设计公司Teenage Engineering共同设计出了今天我们看到的ID。渡鸦首席体验官阿不谈了色彩的来源,现在年轻的潮流人群,在购买家居时以宜家为首选,而宜家的家居除了暖色系外,就是按照橙、红、蓝、绿四个色系搭配的,这给了渡鸦很多参考。

渡鸦方面还谈到,raven H的目标用户就是那些年轻的潮流人群,追求的就是特立独行,因此采用了独特的外观和丰富的色彩,很容易辨别也很时尚。渡鸦被百度收购前上一代智能家居控制设备Raven H-1的模块化设计也被用到了raven H的设计理念中。

此外,在raven H类似“积木”的模块化分体设计,尤其是顶部的Touch模块可以在功能上叠加更多设想,渡鸦团队为人们保留了更多想象空间。

二、87天:从图纸到产品

当ID构想好之后形成方案,便开始跟工厂开始沟通,并进行产品落地。苦不堪言的材料试验、没日没夜的赶工、87天从图纸落地产品成了这一阶段故事的核心。

关于raven H智能音箱由图纸落地到产品背后的过程,我们从渡鸦团队、Tymphany中国事业部团队等那里获取了更多的信息。

独家:87天,百度渡鸦智能音箱诞生记

(百度世界大会现场)

Tymphany中国事业部总经理刘晓彤对智东西讲到,这款智能音箱正式动工是在8月份,之前的接触则是谈好产品的设计,并由百度提供方案。为了这个项目,Tymphany前前后后投入约50人的团队进行配合,包括声学、结构、电子以及模具组等,最终87天完工,产品落地。

87天究竟是一个什么样的速度呢?出口国外的蓝牙音箱从设计交付到产品落地的时间周期大概是6~9个月,包括国外的验证期、时间差、假日等。智能音箱按道理说应该更加复杂,按国外的做法基本上生产要1年,如Echo研发了2年,后来生产基本也需要1年1款。尽管国内团队都很拼,正常情况下产品的落地仍需半年左右的时间,而渡鸦以及Tymphany团队在87天将产品落地,可以说效率很高。

“他们的团队(渡鸦)很专业,执行能力很强,大家都很拼”,这是刘晓彤对整个产品生产过程的感叹。

然而首先面对他们的就是痛苦不堪的材料打磨。可以说这份痛苦要来自Teenage Engineering这家设计公司提出的高温尼龙玻璃纤维复合材料 Kalix,它非常适合用于智能硬件,一方面摸上去它的质感要比普通的PC材料好很多,另一方面这种材料也可以减少震感,有利于提供更好的音质。

独家:87天,百度渡鸦智能音箱诞生记

(高温尼龙玻璃纤维复合材料 Kalix)

但问题是这款材料很贵而且最初很难落地到产品,苹果也只是在iPhone的边框部分使用了这个材料,来使手感更顺滑。渡鸦曾身处一线的工作人员谈到,这个材料成本很高,坑很多,当时从台湾、欧洲、美国调来了几十个博士到工厂就为攻克这个材料。

“这完全是化学实验,同样的配方同样的模具,1号机出来OK,2号机出来不OK,控制变量都不行,我们都快崩溃了”,当谈到材料时,渡鸦工作人员明显情绪有些波动,“当时我们在生产线搭了帐篷,用了45天就为调试这个材料!”

Tymphany一位技术负责人也谈到,这也是他们遇到最大的坑,做到几近要放弃。一般产品加玻纤10%~15%的时候,表面就很难做漂亮,容易坑坑洼洼,为了它模具、设备都要从新改造。

“最难的在于外面的玻璃纤维材料与音箱中间的黑色材料是两种不同的材料,但需要同时进模具,两种材料的熔点什么都不一样,没有人做过实验,为了这个工艺我们做了45天的实验”,吕骋感叹到。

而且我们看到raven H丰富的色彩并非喷漆后的颜色,而是玻璃纤维材料直接调出的原色。可见,为了让外观更好看,材料质感更舒服,渡鸦以及各方团队费了一番功夫。

独家:87天,百度渡鸦智能音箱诞生记

材料问题解决了,接下来依旧是艰辛的产品生产环节。刘晓彤谈到,为了这款音箱,各方还在工厂设了一个“备战”会议室,能够坐20多人,就从来没空过。无论是渡鸦、百度、材料还是工厂人员都很拼,为了这个产品,基本上只要有一个人在现场没有下班,合作方的几个核心负责人都会陪着,“前线待到几点,后方老大就坐镇到几点”,这位Tymphany技术负责人表示。

而这其中还有一个小插曲,渡鸦的一个结构负责人从北京奔赴工厂,一呆就是两个月,全身心参与到硬件打磨生产的全过程,由于长期熬夜以及工厂生活直接工作到心律不齐,为的是能够尽快赶出产品。

“这些互联网公司的人大多是大公司出来的,对产品流程的严谨性、验证的科学性要求很高,但遇到更注重速度的互联网企业,他们又放不下职业里的严谨性,就只能把时间投入进去”,刘晓彤总结到。

同时拼搏在一线的不止渡鸦团队,还有Tymphany团队以及百度等团队。Tymphany这位技术负责人感叹到,最长的一次是4天3夜都待在厂房里,当赶一个东西时需要一个持续的过程,机器一旦开就不能停,同事累的不行了就直接睡在机器旁边,为了产品体验、细节打磨,大家投入很多。

百度内部也是如此,“我们经常半夜随时电话渡鸦和度秘,凌晨3点半以前都可以打通,随时保持沟通”,刘晓彤这句话恰好反映出为这款产品,各方付出的心血。

实验室的样机第一次出来大约是在9月底10月初,为了隔天就能让渡鸦拿到机器,刘晓彤又讲述了一个有趣的故事。为了让渡鸦、度秘等团队来验证技术,保证隔天早上可以送到,他们想尽了邮递、托运的办法。尽管是靠飞机托运也不能完全保证第二天早上可以送到渡鸦团队,为此,刘晓彤最终选择派人连夜“人肉”把样机送到北京,后来都是如此。可见为了产品准时交付,Tymphany也在近可能避免一切风险。

独家:87天,百度渡鸦智能音箱诞生记

(百度世界大会现场)

就这样多方团队奋战到11月初,产品线上的样机出来了,赶在了11月16日百度世界大会之前完工。87天,渡鸦智能音箱从图纸到产品落地,从硬件层面来说,他们值得自豪。

三、北京三里屯洲际酒店智能客房体验

再回到2017年11月21日,智东西作为少数特邀媒体,来到了渡鸦与战略合作伙伴洲际酒店共同打造的位于三里屯通盈中心洲际酒店首个AI智能客房(样板间),参与了渡鸦raven H的深度体验。

这款智能音箱给人的第一印象是外观的新颖时尚。不同于市面上的“桶型”智能音箱与黑白灰的配色,raven H采用积木式的8层级结构,并配以橙、红、蓝、绿四种颜色,给人以层次感和鲜活感。

整体来看,raven H方方正正,边长8厘米,高为11.3厘米,可“安稳”立于手掌之上,可见小巧。raven H采用分体设计,整体可分为两部分,顶部的Touch模块相当于音箱的“主机”,而下面7层则是“机身”。

独家:87天,百度渡鸦智能音箱诞生记

顶部的Touch模块由一个19×19的LED点阵屏构成来呈现基本的视觉信息,同时可以进行长按、双击、滑动触控操作。它通过一个磁性接口和音箱本体连接,可进行上下滑动以及“拆卸”。在家庭中,你可以随意携带Touch模块,并像使用微信APP一样,进行长按模块中部发出语音指令,Touch模块背部也有一个小的扬声器,但主要作为提示音存在,具体的播放任务以及远场交互则由音箱本体来承担。

独家:87天,百度渡鸦智能音箱诞生记

(顶部Touch模块)

原来raven H的Touch模块和音箱本体各自带有一个4麦克风阵列,两部分都可以拾音并进行独立使用,不同的是Touch模块满足触摸近场语音交互,音箱本体负责远场语音交互,等于说这就是“两套”智能音箱,而这无疑增加了成本。而在具体工作中,渡鸦团队谈到,音箱会通过传感器感知Touch模块倾斜的角度,通过算法进行动态工作,判断使用麦克风的数目。

智能音箱小巧容易,但难的是如何在小体积下保证音质以及实现有效唤醒。在这方面,raven H使用了国际音响知名品牌Tymphany定制的Peerless 2寸全频喇叭来保证音质,并在7.2厘米的间距中做到麦克风阵列与扬声器共存,实现远场5米唤醒。

独家:87天,百度渡鸦智能音箱诞生记

通过raven H智能音箱的现场体验以及渡鸦工作人员的讲解,我们对这款产品有以下了解:

1、拿到产品激活的第一步就是配网,目前国内新一代的产品中都开始使用更简便与快捷的蓝牙配网。而raven H则采用了WiFi配网,不超过45秒。不过,有趣的是,渡鸦并没有给自己的智能音箱做APP,而是直接通过微信公众号的形式联网、管理使用,减少了用户下载应用的成本。

2、raven H在约3米和5米的距离内均可保持较高的唤醒率。唤醒是我们进行人机交互的第一步,只有良好的唤醒才能实现后面的交互。我们现场进行了3组测试,第一组是在据智能音箱3米处,通过正常人声3次均可唤醒;第二组智东西为了进行5米测量,特意站到了由一面玻璃墙格挡的洗漱间,并在约5米处以近似相同的声音呼喊“小度小度”,3次也都实现唤醒。

独家:87天,百度渡鸦智能音箱诞生记

(约5米环境实测raven H唤醒率)

第三组测试中,raven H还可以在高分贝音量下实现唤醒。该组测试可分为两种情况,一种是当raven H自身播放音乐时,在接近100分贝的音量下(回想一下装修中电钻机的声音吧),可实现在1米内无障碍唤醒,可见raven H在回声消除等方面下了一番功夫;另一种情况是用另一台音箱就近提供一个约70分贝的噪声(闹市街道声),raven H同样可以实现唤醒。

3、机器对指令的响应时间也是影响用户体验的一个重要因素,raven H可以做到平均1.4秒的响应时间。目前1~1.5秒的响应时间较为理想,1.5~2秒有灯光显示声音反馈,效果也不错。渡鸦工作人员指出,在考虑网络环境以及用户体验,做到较为均衡的1.4秒响应。

4、做为一款音箱,好的音质同样十分重要。raven H尽管体型“娇小”,但在音质上同样有不俗的表现。它采用音响界知名品牌Tymphany定制的Peerless 2寸全频喇叭,通过现场分贝仪的测试,可以达到120分贝的高音,相当于你趴在汽车头部鸣笛的声音。通过《加州旅馆》这首专用于低音测试的歌曲,我们还能感受到raven H声音的饱满、低沉、自然。

5、与其他家智能音箱通过APP来实现管理不同,raven H通过微信公众号实现技能商店等服务。为了降低用户的使用成本,渡鸦直接跳过APP,将应用做在微信公众号中。微信公众号内置技能商店,渡鸦预装技能大约五六十个,其他技能(DuerOS目前已有200多项技能)用户可以自行添加使用。

独家:87天,百度渡鸦智能音箱诞生记

6、海量数据有了,智能化仍需发力。在内容方面,渡鸦主要展示了体育、音乐、视频三方面的语音交互,可以发现在限定边界的场景内,以任务为导向的指令可以做到不错的理解和交互,体育领域可以做到尽管问,显示了渡鸦在这方面的深耕。但在音乐方面,raven H接入了百度音乐、太合音乐,还可支持喜欢/收藏功能,但考虑当下音乐版权的现状(大部分在腾讯),流媒体音乐仍是渡鸦下一阶段要重点攻克的一关。而在智能音箱早期,渡鸦给出的解决办法是通过蓝牙与手机相连播放,作为音频资源的补充。

此外,尽管百度有着海量的数据以及强大的搜索能力,但raven H在问答领域的多轮对话仍需改善,DuerOS的潜力还没有完全释放出来。可见落地到智能音箱时,在NLP(自然语言处理)方面仍需进一步打磨。渡鸦团队也谈到,百度有海量的数据,但主要是应用在网页搜索中的, 针对语音搜索还需要对数据进行清洗,更深层的交互还在进一步打磨,后续会有更多进展。

7、有趣的“如意说”功能。所谓的如意说是指,raven H可以根据语音语义给出不同的回答。在语义上,当你给出一个完整的提问“今天天气怎么样?”,它会给你完整的答复,包含气温、空气质量、生活提示等。但是当你只抛出2个字“天气”,它也会很简短的回复你气温状况。在语音上,raven H可以根据用户的语速来选择合适的语速进行应答。此外,小孩和成人讲出的“讲个笑话”,raven H也会给出不同的回复。

独家:87天,百度渡鸦智能音箱诞生记

8、在方言方面,raven H已支持部分大众方言(与普通话接近的)。现场我们用重庆话和河南话对raven H进行“调教”,它都准确给出了回答以及实现了家居控制。

9、家居控制也是智能音箱应用的一个核心点。目前raven H已支持34个品类共120款设备的家居控制,包括爱奇艺电视果、飞利浦、SONOS、苏宁等。目前百度已经和洲际酒店集团达成了战略合作,渡鸦首阶段已在三里屯通盈中心洲际酒店行政楼层推出AI智能客房(样板间),之后将推广到全国40多家洲际酒店及度假村共计100间套房。

10、最后还有一个小细节,数据线本是一个很普通的东西,但为了差异化,渡鸦做成了复古式“电话线”版的数据线。

可以看出,渡鸦团队在产品设计、用料、产品结构、硬件打磨上的用心,包括顶部Touch模块和音箱本体两套麦克风阵列系统,昂贵的高温尼龙玻璃纤维复合材料Kalix(iPhone边框使用的材料),Tymphany打造了全频喇叭等这些都大大提升了这款智能音箱的成本。难怪渡鸦方面会说尽管我们定价很高(1699元),但也并不赚钱。

尽管DuerOS 2.0 被首发用到raven H上,让渡鸦的产品有了一个坚实的技术基础平台,但在音乐内容、语音交互尤其是多轮对话方面如何在落地时带来最佳体验,还需要不断打磨。

四、Touch模块上的“野心”

在体验现场,渡鸦团队和创始人吕骋还与智东西谈及了raven H的分体设计以及智能音箱产品定位上的一些看法。

所谓的分体设计,就是在顶部的Touch模块和音箱本体上同时使用相同的两套麦克风阵列、内存、主板等,这就相当于2套完整的方案,为什么渡鸦要采用这种较贵的方案呢?

独家:87天,百度渡鸦智能音箱诞生记

渡鸦方面称,在内部他们更倾向于把Touch模块称为智能音箱的“主机”,而把音箱本体称为“机身”。除了外观外,音箱本体和其他市面上的智能音箱并无本质不同,都用于远场语音交互上。

而与其他智能音箱不同之处正在于Touch模块,“Touch模块才是主角,单独拿在手中按住说话,不用唤醒词,就像微信语音一样”,吕骋演示到。单独的Touch模块则又在纯语音交互外,给了用户触摸交互的选择。

而渡鸦的“野心”显然不止如此,通过渡鸦团队的沟通以及渡鸦的两款产品raven R 和raven Q,可以看出渡鸦想要赋予Touch模块更多的想象力,通过磁性结构连接更多的设备,从而以模块化的方式兼容更多的设备,比如Touch模块+HiFi音箱、Touch模块+机械手臂等等。

但如果渡鸦想要实现这种“野心”,首先要做的就是铺开销量,只有获得更多的用户,才有可能发展成连接器,连接更多的设备。而1699元的价格则可能会成为它首先遇到的障碍。

独家:87天,百度渡鸦智能音箱诞生记

在既有的智能音箱中,无论是国外亚马逊的Echo、还是国内阿里的天猫精灵等都采取的是音箱这个形态,其中一点就是找到用户的一个既有品类认知,以此打开市场。可是渡鸦又为何将产品设计成一个非音箱的样貌,进而称自己为智能音箱呢,用户又能否接受这种认知?

渡鸦团队谈到,这款智能音箱定位的就是潮流的年轻人,他们追求的就是特立独行,无论是外观还是配色,raven H都是时尚的。

未来智能硬件的形态,音箱是一个很好的起点,但不是终点。吕骋判断音箱这个形态不会停留太久,因为音箱不会是一个定义性产品(相比iPhone)。对于未来的定义性产品,渡鸦也在探索,而此次他们给出的答案就是Touch,以Touch为载体,将更多的功能和应用接入Touch,比如六轴机器人。

结语:百度智能音箱诞生记

历时近8个月,百度这款智能音箱由团队组建到ID设计再到工厂落地生产,尤其是工厂环节,我们看到了这款高颜值智能音箱背后的故事,看到了百度为打造其首款智能音箱的付出。

李彦宏、陆奇亲自为其站台,百度世界大会近一半时间拱手相让,可见百度对这款智能硬件的重视。对于百度而言,它为百度将技术与生态落地到产品提供了一次机会,通过打造这样一个标杆产品来快速迭代技术,构建自身生态。

但百度能否像微软一样,成功打造一款引领潮流的Surface,仍是一个未知数,而产品的出现则至少让一个新的故事开始展开。


每日一头条

趋势·深度·犀利·干货,最专业的行业解读

深喉爆料、投稿:guoren@zhidx.com

独家:87天,百度渡鸦智能音箱诞生记