对话若琪CEO Misa:AI芯片已拿下数百万订单 AR眼镜年底量产

寓扬人工智能 智东西智能音箱产业系列报道2018/06/26

智东西(公众号:zhidxcom) 文 | 寓扬 智东西6月26日消息,今天人工智能创业公司Rokid在杭州举 […]

智东西(公众号:zhidxcom)
文 | 寓扬

智东西6月26日消息,今天人工智能创业公司Rokid在杭州举办成立4年来首场发布会,现场发布Rokid Me便携智能音箱、语音AI芯片以及量产版的Rokid AR Glass。

其中Rokid Me更像一款mini版的智能音箱,有手掌大小,其最大特色在于便携,并增加摇一摇、声纹识别、蓝牙电话等功能,但799元的定价已经赶超了市面上较多产品。

前一段Rokid就不断释放AI芯片方面的消息,今天果不其然带来了一款语音AI芯片KAMINO18,它具备高集成度、低功耗、低成本的特点。它采用40纳米工艺,由杭州国芯定制,台积电代工。

在2018年美国CES上,Rokid展示了其概念版的AR眼镜,今天则带来了量产版的Rokid AR Glass,它具备人脸识别、物体识别、室内导航、语音识别等能力。今年Q4季度实现真正量产,价格会与旗舰手机差不多。

(Rokid Me实拍图)

会后,Rokid CEO Misa(祝铭明)等人接受了智东西等媒体的采访,就智能音箱、AI芯片、AR眼镜等方面进行沟通。Misa告诉智东西,Rokid已经拿下几百万片芯片订单,是一款量产芯片。

一、四年首场发布会 先抛出一块“汉堡”

“我们为了今天准备了四年”,身着黑T恤、黑牛仔库、黑鞋子的Misa走上舞台,满怀激动的谈起了Rokid成立的初衷,就是探索人与科技交互的方式。

他介绍到,Rokid前面的“Ro”代表机器人,而“kid”有两层含义,一是代表他们这样一群对世界充满好奇的小孩,二是代表现在的AI还在幼年期。

而Rokid从成立的第一天起就为自己定下home AI、portable AI、personal AI这三个方向,之后就推出了市场所看到的智能音箱Rokid Alien、Rokid Pebble。Misa宣布,Rokid产品与用户实现了1亿次交互,这是产品对过去交出的答卷。

今天Rokid又发布了一款新的便携智能音箱Rokid Me,它的外形酷似一块“汉堡”,有没有。Rokid Me只有手掌大小,Misa称它的重量是一听可乐那么重,并抛出与可口可乐推出的联合产品,原来是为可口可乐做了一个广告。

在公布价格之前,他开始不断的抛出Rokid Me在硬件、设计、软件等方面的卖点。

Rokid Me在硬件上采用了独特的声学结构,扬声器朝向上,并且麦克风与扬声器间只有1厘米的距离,市面上大多采用麦克风与扬声器间隔较大距离的做法,来保证拾音效果。它采用了HiFi级的喇叭来保证音质,以及铝合金音腔的机身。

在Rokid Me小巧的身材中还塞进去了一块4000毫安的电池,Misa笑称可以听完周杰伦出道18年来的所有歌曲,来展示音箱的工作时间。

在软件方面,Misa展示了Rokid Me四个有趣的功能:

1、声纹识别,现场展示了一段“鹦鹉学舌”的视频,鹦鹉呼喊“若琪”也无法使用;

2、摇一摇/翻转,第一眼看到我还以为会是微信摇一摇,陌生人之间摇一摇就能加好友了呢。其实这个功能主要用于音乐,比如摇一摇音箱就会为你推荐一首歌曲。翻转就会暂停,再翻转继续播放等,这增加了智能音箱的可把玩性。

3、蓝牙电话,Misa称有了远场麦克风和高品质的扬声器,为什么不让它来通话呢?

4、语音游戏,Rokid推出一款角色扮演游戏,名叫《四月迷案》。

讲完卖点、功能、内容、品质后,Misa终于抛出了价格,799元人民币,赠送两年QQ音乐会员,7月26日全渠道开售。

接着,他又进一步宣布将Rokid Me的方案开放给开发者,并介绍了公司做产品的逻辑:Rokid最初在北京、美国成立研发中心,将语音、视觉的研究技术变成产品,当产品开发完成以后,再以平台及方案的形式进行开放输出,去实现产业赋能。

“很多人都问我Rokid到底是to B还是to C”,Misa今天解释到,“我们是to C的,不过这个C是community(社区)”。

可以发现若琪这三代智能音箱产品一代比一代小巧,价格也越来越平民化,可见其也努力在市场与用户之间寻找一个平衡点。

但799元的价格似乎对于用户也并不便宜,再结合国内当下的智能音箱价格战,89、99元智能音箱满街走。Misa则在会后谈到,“这是一个鸡血的战场,要么你变得很鸡血,要么很冷静”,他认为一个成熟的市场,用户最终会买跟自身调性相符的产品。

二、语音公司做芯片毋庸置疑

前一段,不仅有Misa在朋友圈晒的疑是AI芯片的开发板,接着Rokid也陆续传出前三星半导体(中国)研究所所长周军博士的加盟。果不其然,今天Rokid发布了一款KAMINO18语音AI芯片。

这是一款语音专用的SoC芯片,特点概括起来说就是高集成、低功耗、低成本。

它内部集成了ARM、NPU、DSP、DDR、DAC等多个核心元件,大小与一元硬币相当。软件方面,这款芯片支持相控阵技术、CTC模型、自定义唤醒词、离线语音指令、低功耗唤醒等算法,在整机工作状态下,产品功耗可降低30%-50%。此外,这款AI芯片的整体成本低于市场主流通用芯片方案30%。

会后Misa介绍到,这款芯片是由杭州国芯为Rokid定制的,采用40纳米工艺,由台积电代工生产。尽管这款芯片为40纳米,却比上一代Pebble音箱中16纳米的芯片算力提升1.5倍。

在这款芯片的具体打造上,Rokid主要做的是芯片的架构优化,以及NPU指令集的设定。Misa也谈了他们做芯片的理念,Rokid不是一家芯片公司,不是为做芯片而坐芯片,也不靠芯片赚钱。Rokid更注重通过芯片来提供足够的算力,实现芯片与算法更好的匹配,并降低成本,核心在于输出解决方案。

5月初云知声发布语音AI芯片,其CEO黄伟称,语音公司不做芯片必死无疑,Misa也回应道,“做语音的公司,毋庸置疑,一定要做芯片”,但他也指出两家芯片的不同,“Rokid芯片是一个完整的解决方案,云知声的芯片更偏向控制”。

他还透露,NXP很快也会宣布跟Rokid的合作。

在智东西看来,这款语音芯片与内容、服务方面结合的更加紧密。这款语音芯片内置喜马拉雅所有的能力,开发者可以直接对内容进行调用。此外,这款芯片还支持亚马逊Alexa,并且不需要切换,皆可以实现多语言交互。

这是如何实现呢?智东西会后将这一问题抛给了Misa,他介绍芯片中直接内置了Alexa与Rokid两个语音助手,通过language ID的技术,来判定用户的语种,英文就Alexa回复,中文就若琪回复,可以自由切换。

当智东西问及是否有足够规模的销量来支撑这款芯片时,Misa透露到,“已经订下来就有几百万片芯片了”,现场展示的小雅mini儿童音箱与甘布儿童产品都使用了这款芯片。

三、AR眼镜年底量产

在今年美国的2018CES上,Rokid展示了其概念版的AR眼镜,今天则带来量产版的Rokid AR Glass,它具备人脸识别、物体识别、室内导航、语音识别等能力。

美国研发中心负责人姜公略从光学设计、硬件配置、可穿戴性等方面介绍道:

在光学设计上,AR眼镜采用单镜片AR光学技术,光效率达到50%以上,提供更鲜明图像和续航能力,并搭配HD高清全彩影像。

硬件配置上,该AR眼镜采用旗舰手机配置的处理器高通骁龙835,搭配1300万像素光学防抖、惯性传感器、导音技术、麦克风阵列等。

而在重量上,这款产品为120克,姜公略那头戴式AR对比到,头戴式AR一般重量为500克,Rokid AR Glass轻了数倍。此外它还采用了类似墨镜的设计,“市面上最像墨镜的一款产品”,并且支持近视矫正。

在一段视频中,Rokid展示了AR眼镜对生活的改变,购物、相机、直播、人脸识别、物体识别、导航都可以通过它来实现。

会后,美国研发中心负责人姜公略透露道,AR眼镜今年Q4季度实现真正量产,价格会与旗舰手机差不多。

结语:四年来首场发布会

作为一家创业公司,第一场发布会就抛出了一款智能音箱、一款AI芯片、一款AR眼镜,确实不多见,可以说对这四年Rokid的发展做了一个交代。

在发布会的展示厅,我们也看到了Rokid团队做的一些有趣的“黑科技”,比如3D空中投影、通过脸部识别的心率监测、通过语音控制的烤翅机器人等等,都呈现了Rokid对于技术与应用的探索。

但另一方面,随着AI落地行业进入深水区。AI也开始到了向市场要销量,向行业要规模的阶段,这很可能将直接决定公司存亡。

而目前Rokid还在投入阶段,如其CFO王舜德所言,Rokid在2019年还会是一个投入阶段,但近两年随着装机量和解决方案上来以后,收入也会上去。Rokid今天画的这张饼会结出怎样的果,最终还要市场来说话。

zhidx