冯莉1

歌尔冯莉:AI浪潮下的家庭娱乐硬件升级

四月2017全球(智慧)科技创新峰会2017/03/10

智东西(公众号:zhidxcom) 文 | Lina 编 | 四月 时值人工智能第三次浪潮风起云涌、产业界大浪 […]

智东西(公众号:zhidxcom)
文 | Lina
编 | 四月

时值人工智能第三次浪潮风起云涌、产业界大浪淘沙之际,3月10日,由智东西、AWE、极果等联合举办“GTIC 2017全球(智慧)科技峰会”在上海证大喜马拉雅中心正式开幕。作为2017年上半年人工智能领域规格最高的峰会,GTIC聚焦“机器人产业”、“汽车新势力”、“家居物联生活”领域,探讨技术变革下的掘金机会、消费升级与生态建设,带来最前沿的实践经验和判断。

峰会上,NVIDIA、歌尔股份、科大讯飞、科沃斯机器人等AI行业领军企业的多位大佬轮番登台,共同感受时代脉搏,看见未来。

其中,歌尔股份副总裁冯莉发表了 “AI浪潮下的家庭娱乐硬件升级”的主题演讲,详细解构了人工智能时代,家庭娱乐硬件的交互升级趋势,以及歌尔在智能音箱、智能服务机器人等核心AI产品的发展和积累。

WechatIMG261

以下为冯莉演讲的要点精摘:

1、2016年AI产业不但在娱乐、金融、制造等行业得到广泛应用,而且其涉及的智能硬件如智能音箱、智能耳机、智能服务机器人等也开始应用到家庭生活中。作为ODM、OEM能力领先的智能制造企业,歌尔在提升人工智能技术的设计研发和自动化的生产制造等方面有了相当的积累。

2、目前的智能硬件产品中,主要包括智能音箱、智能耳机和服务机器人:

1)智能音箱作为初级形态的人工智能硬件,以语音交互为基础功能,Amazon Echo为代表产品,国内外厂商纷纷跟随;
2)智能耳机方面,苹果发布了新产品Airpods,受到广大消费者欢迎;
3)智能机器人,其关键技术则在于:视觉、听觉、触觉的统一应用。下一代交互能力提升的重点,将是加强机器人的语音、视觉、情感交互方面能力。涉及图像识别、数据分析、大数据积累等各项技术,同时包含个人形态、语言、相貌、行为分析等。未来我们能看到更多智能机器人的形态展示。

3、歌尔在如上三类硬件产品中均已有成熟解决方案和技术积累,对应的关键技术包括:

1)声学:语音识别、语义理解,其中包括麦克风阵列设计、远场拾音算法等核心技术。
2)光学:以激光微投为基础,增加交互能力,甚至与VR/AR融合,实现更多的产品形态。
3)电:短距离通信技术,提升产品与操控者之间的联系能力。

4、歌尔已在人工智能产品与技术的设计开发和智能制造能力上进行重点储备。

以下为冯莉在“GTIC 2017全球(智慧)科技峰会”上的演讲全文:

今天我们大会的主题是人工智能(AI),对于AI来讲,2016年是重要的一年。在这一年里,我们看到很多人工智能的业务领域得到不断拓展,比如AlphaGo战胜人类棋手、亚马逊产品的热销、刷脸支付等应用的推广使用等等。随着神经网络、深度学习、人工智能芯片等基础技术趋于成熟,人工智能相关的业务已经快步走入普通人的家庭生活中。
歌尔作为处于智能硬件上游的ODM/OEM厂商,在AI相关领域已经进行的规划与布局,并已有相应的产品和解决方案推出。我今天分享的主题是聚焦家庭娱乐硬件,包括我们已经发布的核心产品和相应关键技术的突破。

人工智能应用和实际生活紧密相关,语音识别、自然语音的处理,以及图像识别、人脸识别等技术都是人工智能发展的关键技术。这些技术的准确程度对用户体验是至关重要的。人工智能的应用领域非常广泛,包括医疗、家庭、娱乐、新闻,歌尔所处的制造行业,同样也是人工智能应用的重要领域。

说到人工智能的应用,最初的直接替代目标并不是制造领域的生产工人,而是华尔街上的证券分析师。有新闻报道说,人工智能设备几秒钟的数据分析量相当于资深华尔街分析师36000小时的分析量,这个对比非常惊人。同样,当人工智能快速走进家庭和相关行业的时候,对现有生产和生活方式的改变也将非常显著。

现在我们已经可以接触到很多人工智能产品,最典型的是智能音箱、智能耳机和服务机器人。智能耳机,有苹果刚刚发布的产品Airpods。智能音箱的典型产品是亚马逊的ECHO,得到了很多用户的强烈欢迎。服务机器人已经在医院、教育、机场、酒店等领域得到了广泛应用。

说到AI给我们带来的改变,可以通过回顾人机交互发展历史来看。第一代和第二代个人计算平台如电脑、手机的人机交互,主要是通过鼠标、键盘以及智能终端的触摸屏实现的,而AI的典型产品如智能音箱,则是通过语音交互实现,完全解放人的双手,实现更快更自然的人机交互。人们可以通过语音快速唤醒家庭中的各种智能硬件,通过语音操控实现各种应用的需求。

最基础的智能产品是音箱,其结合AI提供更好应用所必需最核心技术是声学、光学和电。在这三个领域,歌尔一直聚焦于相关产品和技术布局。众所周知,歌尔股份的前身就是歌尔声学。歌尔在声学领域耕耘了十几年,积累了很多经验,包括麦克风阵列、语音识别、远场拾音等核心技术。特别是远场拾音技术,已经可以在五米范围内实现了精准的语音识别。同时歌尔也与微软、科大讯飞等厂商合作,共同努力提供语音识别的准确度。同时,歌尔实现了360度环绕音效兼具双麦克风拾音技术的智能音箱产品平台,我们希望把这样的平台提供给更多的合作伙伴,快速提升其产品能力。在光这一部分,歌尔重点投入激光微投技术。在刚刚结束的2017年MWC上,Sony Xperia投影在去年基础上加入了更多交互应用,延伸出很多人工智能相关的使用场景。

WechatIMG262

在智能机器人方面,目前初级形态的智能机器人已经上市,可通过语音进行交互。未来的机器人会增加更多的语音、视觉、情感上的交互。在这其中,必然要涉及到很多包括图像识别、数据分析、大数据的积累等核心技术,以及对个人各种形态、语言、相貌、行为举止的分析。未来人机交互能力更强,将从感知到认知,再到控制。其中,视觉、听觉和触觉,是人自身感受世界的感知,需要机器人通过相应的传感器技术获取。在认知交互当中,语音的交互、投影的交互,以及下一步的深度学习,实际上是让机器人更多的理解指令的含义,并完成相应的动作和任务。其中,包括SLAM、传感器、控制算法、运动控制等等技术和应用。

歌尔将机器人作为未来人工智能重要的产品方向,并已经发布了三款成熟的机器人产品,包含了智能家居机器人、家庭陪伴机器人和智能办公辅助机器人。其中智能办公机器人Bell,通过与微软合作,集成OFFICE的应用,可以辅助日常办公、会议等工作需要。智能家居机器人在2016年CES已经发布,它可以实现整个智能家居的中控,同时涵盖触摸屏和语音的交互功能。家庭陪伴类机器人Noah,在2017年CES上正式发布,它内置3D摄像头,可以和孩子进行相互交流、教育和跟随,部署有两轮驱动,对于2厘米高度障碍物可轻松跨越。同时,SLAM技术在歌尔机器人中也得到了广泛应用。基于SLAM,机器人可以很好的进行图像扫描,包括位置定位等应用。

接下来我们将通过一段视频呈现歌尔智能机器人制造的全过程,从设计、开发、应用等各角度,呈现了歌尔良好的精密制造能力。对于智能硬件产品来说,设计、开发、制造都是重要环节。信息处理、自动化的控制、以及整个生产线的设计和开发,是考验生产制造厂商能力的关键指标。

第二段视频将展示歌尔的智能制造能力,视频中呈现的产品是歌尔与腾讯合作生产的智能手表Pacewear。这款产品的制造完全通过生产线自动完成生产和装配,在国内智能制造领域居于领先水平。十几年之前,歌尔在智能制造方面开始重点投入。多年来,歌尔一直致力于为客户实现高效的自动化生产制造服务。制造智能化,不仅节省人力,还可以提高产品质量和加工精密度。从过往的工业机器人到现在走进家庭的娱乐机器人,歌尔多年积累的零部件和整机研发的能力,对行业的整体发展起着重要的推动作用。到目前为止,歌尔已拥有了超过5000人的生产自动化团队,并在2016年被授予“国家智能制造示范单位”。

在智能硬件方面,很多的厂家在不同领域上做了很多工作。歌尔作为产业链上游企业,非常愿意与人工智能产业当中的各界朋友共同合作,推出更多的平台产品,服务于更多的品牌客户以及最终的消费者。

谢谢大家。

 

zhidx