000

对话英伟达智能机器副总裁:用VR训练机器人,开源IoT AI芯片,英伟达的端智能之路

Lina2017GPU技术大会 人工智能 智东西人工智能芯片系列报道2017/09/30

智东西(公众号:zhidxcom) 文 | Lina 不久前,英伟达2017 GTC China(GPU技术大 […]

智东西(公众号:zhidxcom)
文 | Lina

不久前,英伟达2017 GTC China(GPU技术大会中国分会场)在北京举行,在当天上午的主题演讲中,英伟达CEO黄仁勋再次介绍了ISSAC机器人训练平台,并且正式宣布推出了世界第一款用于自动机器人的处理器(芯片)Xavier,为机器人提供从软件到硬件的全方位支持。

与此同时,就在GTC China当天,英伟达也正式开源了完整版DLA(Deep Learning Accelerator,深度学习加速器),让厂商可以免费下载使用,打造属于自己的低功耗AI芯片(比如IoT芯片)。

002

(英伟达全球副总裁、智能机器事业部总经理Deepu Talla)

整场GTC China里,深度学习的训练阶段已经很少被提到,反而是端智能、智能机器等话题正当红。为了进一步了解英伟达的端智能/智能机器布局,智东西与少数媒体对英伟达全球副总裁、智能机器事业部总经理Deepu Talla进行了专访。

一、四大原因决定端智能兴起

深度学习分为训练(Training)和推理应用(Inference)两个部分,数据科学家们在将一个神经网络通过大量数据训练好之后,再将这个训练好的神经网络应用到硬件上,进行人脸识别、语音识别等的AI软件应用。

001

推理应用过程既可以在终端上进行,也可以在云端上进行。云端应用价格亲民、且能提供的计算量更大,所以为什么我们不在云上做一切应用,再将决策发至终端执行呢?Deepu Talla认为,原因有四个:

1)带宽小。目前,世界上的摄像头设备保有量已接近海量,而且在不断增加着。如果这些视频数据同时发送到云端,现有带宽并不能承受。

2)延时长。拿自动驾驶汽车为例,如果在行驶过程中发生紧急情况,必须要车子在5ms里就做出响应,而云端的响应速度达不到这么快。

3)隐私不安全。对于政府、医疗、金融等机构来说,它们对隐私与数据安全性有着极其苛刻的要求,并不希望将数据发到公共云上。

4)网络状况并不总是可靠。虽然我们正在推广4G、迈向5G的道路上大步前进着,然而还是会有偏远地区、隧道、电磁干扰等情况,造成网络状况的不稳定,数据无法正常发送的情况。

基于这四个原因,AI正在从云端慢慢挪到边缘设备上,也就是我们说的端智能。这次GTC China上,英伟达正式宣布推出了Xavier智能机器芯片。这是一个开展了两年的项目,于去年宣布,今年正式定位为世界第一款用于自动机器人的专用处理器(芯片)。

003

这款处理将于2018年第一季度提供给早期合作伙伴,2018年第四季度全面推出。与此同时英伟达还宣布,英伟达的的第一批Xavier芯片将会用在京东的仓储机器人jROVER+京东送货无人机jDRONE等一系列自主机器人当中。

二、四大核心技术打造ISSAC机器人训练平台

今年5月时,英伟达推出了一个用于训练机器人的增强学习世界模拟器——ISAAC机器人训练模拟世界(ISAAC Robot Simulator),创造出一个完全虚拟的、专为训练机器人而打造的世界。

IMG_5519

这是一个遵循物理法则但不遵循时间法则的世界,在现实生活中,你想要训练一台机器学会打冰球,你要将这个冰球放在机器前面,一遍一遍地教会它;而在虚拟世界里,机器可以在一秒内重复众多次这样的动作,而且你还可以同时训练一堆机器学习打球,然后找到里面最聪明的一个,将它的“大脑”程序复制出来,创建一堆同样的机器再继续训练筛选。

对于这个虚拟机器人训练平台来说,有四个重点要求:

1)图片需要有照片级别的真实性,让机器人尽可能地“看”见真实世界。

2)碰撞、压力、重力等物理规则必须要完全遵循真实世界。

3)需要有着超高的计算性能与AI性能。

demo

4)可以让人类进入到虚拟世界中进行测试,也就是VR,即使失败了也不会对人类生命造成影响。(详情可以参阅智东西此前的报道《马斯克又来搞事情 OpenAI要用VR训练机器人》,根据Deepu Talla透露,英伟达与OpenAI在ISSAC项目上存在合作)

而图片、物理定律、AI、VR,这四点恰恰都是英伟达十分擅长的领域。Deepu Talla说,今年年末的时候,ISSAC平台将会被提供给包括OpenAI在内的世界各地领先科研机构。而在5-10年里,这个ISSAC平台将成为全世界最顶尖的AI领域贡献者之一。

三、开源DLA框架

此外,Deepu Talla还向智东西提到了在GTC China当天正式开源的英伟达DLA(Deep Learning Accelerator,深度学习加速器)架构。

正如前文提到的,由于云智能的种种限制,目前我们来到了端智能兴起的时代(但这并不意味着云智能的衰落,未来绝对是云AI+端AI的)。

不过,目前英伟达主打终端的GPU板卡是Jetson TX2,这块搭载4核CPU的Pascal架构GPU标准功耗为7.5W,远小于英伟达其他动辄几十上百W的GPU,但对于功耗极为敏感的超小型设备,这个功率还是太大。

为了解决这一问题,英伟达于今年5月的GTC上推出了开源框架DLA,厂商可以下载这个专为IoT设备设计的AI架构,自己打造低功耗的AI芯片。

目前这套框架是免费提供的,至于未来是否会靠DLA框架来收取专利费,成为新型商业变现模式,那就是另一个故事了。

zhidx