智东西(公众号:zhidxcom)
文 | 心缘

智东西12月14日报道,本周三,英特尔中国研究院2018年媒体开放日在北京举行。英特尔中国研究院(以下简称“研究院”)定位为世界一流的工业研究院, 在过去的十年间,研究院紧扣计算为产业的发展做出很多贡献,其中大部分均转化到英特尔公司内部。

研究院拥有机器人创新实验室、认识计算实验室、智能驾驶实验室、通讯架构实验室和新技术中心等五大研究团队,共有60多位全职研究员,其研究目标是要有突破性的产业价值。

在横向上,该研究院有AI和5G作为横向的技术支撑,可应用到各个领域;在纵向上,该研究院把智能驾驶和机器人作为长期需要研究的主赛道,去当作应用的场景做科研。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

在本次活动上,英特尔中国研究院院长宋继强和多位明星研究员一起,全面介绍了研究院在AI、自动驾驶、5G、服务机器人等重点研究项目和成果。最后宋继强还与几位学界名师共同探讨了未来趋势和人才培养。

一、认知计算实验室:覆盖人、物、景的AI

英特尔中国研究院认知计算实验室聚焦前沿视觉认知和机器学习技术,实现智能计算新颖应用级用户体验。

其研究员基本来自于清华、北大等高校的博士和博士后,过去三年,他们在计算机视觉(CV)、机器学习等方面获得60余项专利申请批准,发表30余篇顶级学术论文,包括13项产品技术转移,来做一些来影响英特尔的软硬件的产品设计。

1、人

在人方面,他们通过三代技术的迭代,从二维演化到三维再演化到多模态。其第二代人脸分析技术已经被应用到英特尔的硬件、软件、解决方案和应用原型当中,帮助提升英特尔产品的优势。

去年他们介绍了三维人脸技术,只需一个普通摄像头和一个PC,就能实现三维人脸的建模、跟踪和增强技术,他们还能实时把特效叠加在人脸上。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

去年他们还介绍了领先多模态情感识别技术,并在年初时将相关技术转移给英特尔人工智能产品事业部,帮助产品事业部开发一些面向于基于情感的应用原型,比如基于情感视频内容的管理、分类帮助用户找到有剧烈情感的片段。

他们的研究也不局限于人脸和情感,希望能通过对人的属性、注意力和行为的识别,来实现对人全面的理解。

2、物

在物方面,由于深度神经网络本身的计算复杂性和空间存储复杂性都非常高,很难部署在资源受限的边缘和嵌入式设备里,对此,他们进行三方面的研究,包括高效CNN结构设计、DNN模型压缩、部署式网络结构优化。

他们曾提出世界首项采用卷积层的特征融合聚合——HyperNet,来提高检测小物体准确率的方法,到目前为止它的学术引用率已经超过200篇。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

去年他们推出了第一个辅助训练的物体监测器DSOD和基于DSCD的一个轻量级的检测解决方案Tiny-DSOD,在数据上远超同类解决方案。

他们提出的低比特和超低比特压缩技术,配合英特尔的FPGA、Movidius等低功耗硬件,帮助英特尔在雾计算和边缘计算上提高深度学习推断的速度和吞吐量。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

3、景

在场景方面,近几年基于深度信息的采集设备逐渐得到普及,推动了深度学习在3D领域的应用。但从3D神经网络做视觉理解面临两个挑战:

(1)巨大存储和计算需求。对于2D神经网络来说,用一个GPU就能在大规模数据集上训练一个152层的残差网络,但换成3D卷积神经网络,也许训练一个10层网络就会因显存溢出而挂掉。

(2)在深度学习尤其是CV领域,对于不同视觉任务而言,网络深度越深,通常精度越高,但当网络发展到两三百层甚至上千层,很难让它再变深。

为了在保证计算高效的同时让网络的学习变得更深,研究院设计了空域分组卷积——一个高性能三维稀疏深度神经网络。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

此外,他们还在场景的理解上做了一些视觉解析和多模态分析,目的是通过对视觉、语音、语言和知识的融合,能实现从视觉识别到视觉理解的跨越,具体研究包括了图像、视频描述、视觉问答、视觉关系理解等等。

其中视觉问答指的是给定一张照片,机器会针对该照片的某一个特定问题来回答。客观问题包括三类,一是显而易见的问题,如“这个运动衫是什么颜色”,第二类是难识别的需要根据知识来确认的问题,如“这个烤箱里是什么”,第三类是看不见的、需要外部知识进行推理的问题,如“哪一种动物爱吃这种水果”。

为了解决这一问题,研究所提出视觉知识记忆网络,将视觉内容与知识相结合。该网络有两个特点,一是将视觉内容和知识事实相结合,二是从问答对扩展的多重知识事实的选择。

基于领先的算法,其视觉问答得到广泛应用,如帮助盲人等视觉受限的用户,集成到图像索引系统影响社交媒体或电子商务,也可用于教育和娱乐的一些应用。

二、智能驾驶实验室:事故分析、场景重建、仿真和算法验证

英特尔中国研究院智能驾驶实验室则是最年轻的一个实验室,在今年元月份成立。在本次演讲中,该实验室主要讲了三个点:

(1)通过仿真的场景库希望用它去迭代实现自动驾驶车甚至超越飞机的安全性。
(2)希望通过环境智能,和其他无人车、人类驾驶的车以及路口的智能摄像头形成联动和闭环,增加实时分析的能力,实现更加高效和安全的自动驾驶。
(3)自动驾驶车的场景非常宽泛,非常复杂,文化、地域各方面都是挑战,我们希望通过合作来充分扩展这方面的研究。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

飞机从记录驾驶事故问题的黑匣子中学习经验,其事故发生率在百年间降低上万倍。而IT化后的自动驾驶同样拥有很强的记录和计算能力,通过对人类驾驶的错误中学习和分析,可以实现如飞机般的场景重建。

很多分析家认为现在的自动驾驶车的安全性没有太多能力,比如说特斯拉有自动驾驶能力,从统计数据来看没有太明显的提升。

该实验室的主要工作是自动化事故分析、场景重建、仿真和算法验证。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

为了避免在技术尚未成熟阶段造成试乘人员的意外伤亡,该实验室通过收集现有的交通事故的视频,对其进行自动的分析重建,让自动驾驶算法在更加安全、更加高效的环节里进行学习和测试。

自动驾驶所处的环境其实比飞机更复杂,有行人、非机动车,全球十字路口交通事故概率超过50%。在实现自动驾驶路径时,很多公司会先做相对简单的封闭道路,还有些公司会先做园区车,地图、环境事先会非常清楚,例外情况很少,便于控制精度。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

但到Level5时,交叉路口的复杂路况将成为必须解决的常态。对此,该实验室通过智能的路边基础设施和车路协同的方法,较好的来解决交通路口的安全性问题。

他们有一个愿景,希望自动驾驶和智慧城市、智慧交通可以相结合,将车上的传感器和路口的摄像头动静结合,使整个城市变得更加安全和智能。

目前自动驾驶道路仿真还是比较空白的领域。常用的环境模拟方法基本有两种,一种是脑门一拍,研究员凭空想象着建小镇,一种是将整个旧金山复制到虚拟环境中去,接近真实世界。旧金山地形的确很复杂,但是否能代表纽约、伦敦、北京仍存疑。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

三、通讯架构实验室:VR无线、5G云基站和大规模天线

英特尔中国研究院通讯架构实验室从2003年就开始从事无线相关研究,发表了200多篇论文,有10余个共享成果。目前其5G第一阶段的研究已基本完成,且较好的转化为产品。

他们在去年做了VR无线适配器的演示系统,今年和英特尔客户计算部门合作,将其软件转移成英特尔的参考设计的产品,和Trinus VR进行合作,开发一个应用,现在可以在安卓系统的应用程序商店中下载。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

他们认为下一个无线视频的应用很可能就是无线的云游戏,特别是5G到来时,会提供更高的带宽、更低的时延,非常适合无线云游戏的应用,

该实验室的5G研究主要集中在大规模天线和云基站。在5G的标准化中,他们的主要工作是集中在如何定义一个比较好的数据平面的分割,能够推动云基站在5G里的发展。

大规模天线是5G里面非常重要的技术,可将5G整个的设计目标频谱效率提高3到5倍。

为了从整个的基带单元和视频单元功能重新定义的基础上降低带宽,该实验室开发了能够进行多天线压缩的算法,能够进行一个有效的物理层基带的划分,解决大规模天线前端网络的问题和处理复杂度的问题。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

在研究员们标准化的工作和原型完成后,他们的成果将转化为英特尔FlexRAN的产品。他们下一步将探索如何设计更好更灵活的无线芯片,加速器无线处理的性能,同时也有雷达感知来做手势。

四、机器人创新实验室:自学机器人+HERO平台

英特尔中国研究院机器人创新实验室希望突破AI技术瓶颈,让机器人通过和用户交互或观察用户生活,不断改进功能。比如说通过不断学习把人认得更准确,再比如自适应物体检测识别,可以像人一样通过学习去识别一些新的物体。

他们在多模态的情绪理解方面也开始做探索。其三维环境语义和个性化知识图谱,使机器人增加更多对人和换件的高层知识,能够基于知识推理快速理解所处环境的物理结构以及用户行为、语句的含义,个性化理解用户的想法。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

他们还通过小样本的强化学习来实现两个功能,即无论何时都能认识主人和熟悉语义的环境。不过机器人强化学习也存在一些挑战:

一是教人用花洒倒水很容易,教机器人却很难;二是机器人的关节只能向一个方向旋转,和人类动作做不到完全一致;三是应用时还需考虑采样成本的预算,机器人必须一次学会一种新性能,而不是用某个方法跑一万次执行。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

为了推动服务机器人的快速发展,他们从安全性、交互性、自主性三个维度出发,打造了一系列的机器人研究平台(HERO平台)。适配多样化机器人产品需求,以期达到计算性能、功耗和尺寸的最佳平衡。

五、开放式创新与多元化人才培养

针对数据洪流中的开放式创新以及多元化人才的培养,中山大学副教授、青岛慧拓智能机器有限公司CEO陈龙博士,复旦大学计算机学院、博士生导师姜育刚教授,英特尔中国研究院宋继强院长和北京邮电大学信息与通信工程学院张琳教授共同参与本次论坛。

英特尔中国研究院超全解密!看四大团队如何造梦英特尔

姜育刚认为,随着AI在各行各业得到应用,AI系统安全就变得至关重要,需要防御措施。

张琳则提出两个技术挑战。雷达感知面临公共场合的隐私保护问题和如何用AI技术做出更有价值的应用两大挑战。另外,在移动通信中使用AI技术可能会是下一个热点。

陈龙则主要谈了无人驾驶的进展,他表示产业化落地是无人驾驶的核心问题,一方面因为资本原因,企业会走得更快;另一方面需要找到更好的应用领域去切入,做出实实在在的应用。

关于多元化人才培养,张琳认为把学生内心想要做事的想法真正挖掘出来是最重要的,比有多少知识积累都重要。另外文章的“可呈现性”也非常重要,即其他人能否根据这篇文章提供的材料复原实验。

张琳表示,如果十多年前没有开源代码这一行动,我们国家很多公司的技术实力很难那么迅速提高。

宋继强觉得最大的收获就是必须认识到新一代学生的思想逻辑和处事方法,要想办法一方面帮助他们做一些有挑战性的事情,另一方面告诉他如何走可以避免弯路,促使他们更快的产生创新的想法。

他相信,跨学科的合作、人才的交叉合作思维碰撞,一定可以产生出一加一大于二的效果。

结语:产学复合型人才的摇篮

坐拥垂直领域人才和行业资源,英特尔中国研究院掌握了覆盖算法、软硬件及全面跨学科的整合能力,培养出一批优秀的产学界人才。

而在前辈的指引下迅速成长的新一批研究人员,又将施展他们的才能和创新力,生产出更多前瞻性研究成果,并快速转化为市场化产品,为科技进步和社会发展创造了更多的价值。