智东西(公众号:zhidxcom)
文 | 心缘

AI芯片火得很快,但质疑声来得也很快。

突如其来的贸易纷争和资本寒冬,引得整个集成电路市场陷入一片低靡,随着市场环境和资本的支持力度骤然刹车,AI芯片的衡量标准从晒出高性能的参数转变为拼实际的商业落地与造血能力。

当热潮归于沉寂,一家AI创企的首款商用AI芯片才刚刚官宣。

它是云天励飞,是深圳AI圈的代表性独角兽,兼具AI算法、AI芯片与大数据平台。

从2014年8月成立至今,它为AI研发和产业化已经砸下1亿美元,协助多地警方破获数万起案件,落地机场、地铁、社区、商超等多种生活场景。在芯原微电子董事长兼总裁戴伟民眼中,它是“落地最扎实的中国AI公司”。

在算法落地安防的同时,云天励飞的AI芯片团队一直在紧锣密鼓地研发着他们的核心秘密武器。

2018年8月16日投片,同年10月回片,回片一周跑通人脸识别算法全链路,回片一个月跑通人脸识别业务完整Demo,回片两个月单芯片跑通100万人像搜索以及基于4K的200个人脸的抓拍与识别,算力达2 TOPS……自打投片以来,云天励飞的首款5AIoT芯片似乎步入快车道,一路走来顺风顺水。

然而直到今年11月13日,这款芯片才首次公布全部性能。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

这一年间,云天励飞究竟在筹备什么?他们打磨已久的AI芯片“憋”着哪些大招?是什么使他们不去争抢国内AI芯片大潮中的先发席位?他们又是如何不动声响地在一年内拿下国家三大部委的AI芯片重大课题?

通过对话云天励飞董事长兼CEO陈宁、云天励飞副总裁兼芯片产品线负责人李爱军、云天励飞首席科学家王孝宇,我们终于看到了这家创企造芯计划的全貌,芯片不是最终目标,他们所思考的是如何在硝烟弥漫的AI战事中走的更加长远,以及如何融入开源生态,为科技的演进与发展尽绵薄之力。

一、造一枚5AIoT时代需要的AI芯片

5AIoT,5G+AI+IoT,这个伴随着三类新兴技术热潮所演化出的新名词,正催生着新一轮科技红利。

越来越复杂的细分场景需要终端与边缘的计算来缓解海量数据所造成的通信压力,过去的硬件设计难以满足AI海量数据的处理需求,芯片与算法的深度融合成为挡在一众芯片公司面前的鸿沟。

芯片,成为云天励飞构筑AI时代护城河的核心技术支柱。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

经过397个日夜、每天16-18小时的奋战,其第一代芯片云天初芯DeepEye 1000一次流片成功。

这款异构多核芯片,采用22nm FD-SOI制程工艺,在1平方厘米见方的芯片上容纳了9亿晶体管,集成了自研神经网络处理器、阿里平头哥CPU、芯原微电子Video Codec、Vision DSP以及丰富的外设,峰值算力达2 TOPS,功耗仅1.6W

经测评,相比NNIE,该芯片平均性能提升10IPS,单位模型处理性能下的平均带宽降低40%,平均芯片面积和成本降低60%

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

我们不妨拆分来看Deep Eye 1000内部的各个组成部分,先看看除了神经网络处理器之外的其他部分。

在CPU方面,云天初芯DeepEye1000引入国产自主可控的阿里平头哥玄铁810嵌入式处理器,工作频率达到1.2GHz,处理器采用RISC指令架构,双发射10级流水线,性能高于2.5 DMIPS/MHz。

进一步,云天励飞与芯原微电子合作,通过引入Video Codec带来超强的视频和图像处理能力,支持H.264H.265解码,以及4K@30fps视频、4路高清视频并行的实时分析

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

DSP方面,其芯片采用了双核视觉Vision DSP处理器,内置硬件加速运算子ACC,支持超过20个高效算子,每秒可跟踪1200张人脸。

由于AI智能尚未实现通用,为此云天初芯提供面向不同场景的丰富外设与接口。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

芯片要最终赋能客户,不仅需要出色的性能指标,还需提供尽可能高的易用性,即客户可以方便的将自己的算法、应用、场景移植到芯片上。

对此,云天励飞打造了DETVM开源开放工具链,兼容TVM开源生态,支持所有主流算法框架,一键实现量化编译和部署,并提供通用编程接口,让算法移植更便捷。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

云天励飞副总裁、芯片产品线负责人李爱军认为,AI之所以发展势如破竹,与开源关系密切,走开源道路,在贡献自己成果的同时,云天励飞也会获得开源社区对自己的支撑。

这款芯片第一步会落地在云天励飞自己的摄像头中,很快将铺开到10万多台摄像头。未来,该芯片将铺开到合作伙伴的产品中,包括摄像头、智能家居、边缘盒子等等,保守估计将达到百万级的数量。

虽然当前这款芯片的核心价值在于终端传感器和边缘计算侧的处理分析,但云天励飞董事长兼CEO陈宁透露说,通过4~8颗芯片的级联,他们也设计了面向云端的加速处理板卡,并在联合中国电子信息产业集团(CEC)共筑安全可控的数据中心系统

李爱军还剧透了下一代芯片的规划:云天励飞AI芯片每一年到一年半迭代一次,下一代芯片面向端侧与边缘,将在2020年年底流片,在2021年上半年推出

二、造芯新概念:芯片即服务

当然,一颗AI芯片的核心能力在于面向AI算法的加速引擎,这也是云天初芯核心技术能力的集中体现之处。

云天励飞董事长兼CEO陈宁意识到,只追求一颗芯片的算力已经不合时宜,在AI时代,真正能衡量一个AI芯片价值的是面向场景的有效算力,即芯片、工具链、算法应用的累积。

因此,云天励飞提出一个新的概念“芯片即服务”。除了提供芯片算法基础,还将对行业的理解和云端赋能平台做结合,形成“算法+芯片+数据”的闭环,使得客户能基于芯片快速开发出完整的AI产品。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

而超强有效算力的芯片,被陈宁喻为未来发挥核心作用的“差异化战略武器”。

其第一代神经网络处理器NNP100从2015年底开始研发,2016年基于FPGA实现商用与部署,当时智能跑深度学习算法。

第二代架构NNP200则针对边缘计算场景需求做了优化,可通过级联扩展同时处理多路高清图像或视频。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

上图是云天励飞NNP的设计版图,采用800MHz、四核的自研第二代神经网络处理器架构NNP200,支持INT16/INT12/INT8混合精度量化数据峰值算力达2 TOPS

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

值得一提的是,在这颗处理器的背后,是由算法团队和芯片架构师团队跨界创新,基于AI神经网络和未来三年的算法框架的发展,提炼出来160多条深度定制指令集,支持多数主流神经网络模型。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

通过可重构计算阵列,该处理器支持灵活可编程的计算流,能实现高达99%的超强效率,将灵活性充分释放给软件。经过实验与分析,其AI芯片能满足海康、阿里等生态伙伴93%的算法需求

同时,它采用存算融合体系架构,使得DDR存储访问带宽下降77%,功耗下降60%

言之易,行之难,并非每一家AI算法公司都能游刃有余的涉足造芯,这与云天励飞创始团队的技术背景有密不可分的关系。

其董事长兼CEO陈宁是中国第一款商用矢量处理器芯片的设计者,曾任中兴美国技术总监、美国飞思卡尔半导体高级架构师、4G-LTE国际标准首席代表。

其副总裁、芯片产品线负责人李爱军曾任中兴通讯手机芯片研发负责人,主导研发了国内第一颗28nm手机芯片商用和国内首款LTE多模手机芯片商用。

包括创始团队在内,云天励飞的芯片研发团队拥有丰富的矢量处理器、复杂SoC设计经验,平均设计经验超过10年。

三、布局八大场景,首秀星云生态战略

既然云天初芯去年10月芯片就回片了,那为什么直到现在才正式发布呢?

陈宁为我们揭晓了答案。

在这一年期间,云天励飞都在准备一件事——贯彻“芯片即服务”,云天励飞不仅想做AI产业的参与者,还希望成为AI产业的推动者。

那么问题来了,一家年仅5岁的创业公司,能不能靠孤军奋战就显著推进整个AI产业化的进程?能不能凭一己之力就达到2035年AI驱动100万亿元人民币的生产总值这一目标?

云天励飞首席科学家王孝宇表示,这100万亿仅靠云天励飞是做不到的,需要千千万万的云天励飞共同推动AI产业的发展。

围绕生态建设,云天励飞主要在做两项建设。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

一方面,从芯片需与算法、场景深度结合的角度,云天初芯选择了八个走在AI落地前沿的领域,并率先与这些领域中的头部企业进行磨合。

面向智能安防、机器人AIoT、智能仓储、智能制造、智慧交通、智慧家电、智能超算八个场景,云天初芯分别已与海康、优必选、阿里巴巴平头哥、京东、迈德威视、深圳巴士集团、TCL、国家超级计算深圳中心建立合作。

比如在机器人方面,优必选的智能巡检机器人ATRIS(安巡士)通过接入云天励飞的AI芯片,可连接到云天励飞构建的AI数字城市大脑,使机器人快速获得AI能力。

再比如面向AIoT领域,云天励飞与阿里平头哥不单单在玄铁上合作,而且打通了在阿里巴巴经济体内部的合作,包括新零售、无人超市、软件生态链的合作开发。平头哥开放芯片平台也已经将云天励飞的芯片引入,未来会向能触达的方向推广这些系统和芯片。

云天励飞与这些头部企业合作,但不依赖他们,陈宁要求云天励飞在对场景的理解上,比芯片客户、方案集成商更专业。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

另一方面,云天励飞将芯片、算法、云服务这最关键的三类核心能力均全部开放给合作伙伴,以共享技术,共筑生态。

AI应用的典型技术架构是“前端设备+后端云服务”。如果将产业链条掰开来看,芯片、算法、云服务正式阻碍AI大规模应用的三个门槛。

对此,云天励飞提出了一个特殊的“双11开放AI生态计划”——1-1-1-1赋能计划。

四、另类11”:一个月搞定AI产品

所谓1-1-1-1计划,即一周做出硬件、一周适配算法、一周对接服务、一个月形成产品。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

以社区管理为例,当前市面上大部分AI企业不具备人员自动归档的能力,云天励飞则将高精度AI算法+自动归档能力开放出去,已经有几家企业在对接这一能力。

从芯片、模组、主板、硬件、算法、软件到云服务,不同企业可以根据自己的实际研发能力和业务需求选择不同的点接入。

其中最关键的是云天励飞的芯片、SDK、SIK和Open API。

云天励飞将很庞杂、高门槛的AI产业化环节提炼出最核心的成分,芯片仅有指甲盖大小,SDK是标准化工具包,SIK就是几条指令,Open API是一些模块化模组。

云天初芯的算力为2 TOPS,大约是正常笔记本电脑算力的50倍,功耗和成本也都很低,再加上芯片与算法部门面向实际应用场景联合打造芯片,其性能相较竞争对手有10-50倍的提升。

“我们的硬件是活的硬件,”王孝宇举例说明道,“今天可以是人脸识别的功能,第二天可以对它进行升级成为车辆的功能,第三天可以把所有的功能加进去,可以持续不断的升级和迭代,它是服务定义的芯片,它自身会带来大量的AI服务场景。”

为了加快研发进度,云天励飞已做出配合芯片的硬件模组。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

除了芯片平台外,云天励飞还提供算法平台Arctern,其算法目标是快、准、狠,芯片自带高度适配的100多种业界领先算法。其算法SDK实现了跨平台的即插即用,这些算法不仅能跑在云天励飞的芯片上,还可以跑在Android、Linux以及云端平台上。

有了芯片与算法,还需有设备端的软件应用来实现业务标准化。云天励飞开发了业务云平台商簿Vesionbook自带30种以上的业务场景支持,把设计端指令传到云端,自动拥有后台30种业务的功能。

这一标准化协议叫做SIK(Service Integration Kit),需要通过几条指令和云端通信可以自动生成各种业务,不需要再去开发,从而将云天励飞所有AI业务能力的接入压缩到一周内。

如果用户有自己的业务需求,还可以不接入云天的业务场景,直接用云天励飞的API来构造自己的应用,促成更广泛业务场景的开发。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

即便是再高端的算法研发人员,也无法覆盖所有的算法。考虑到这一情况,云天励飞与国家超算联合发布了一套无门槛一站式算法研发系统AIOS,实现算法无死角覆盖。

该系统只需鼠标点击操作,即可完成AI算法研发,将AI算法研发成本从几百万元降到一万元以下,将算法研发周期降至一个月内。

由于算法研发真正耗时之处是算法的迭代优化,AIOS系统已打造完整的自动化研发流程,只要接入SDK、SIK,便可拥有完整的云天励飞AI及业务能力。

王孝宇说,云天励飞成长为具备全方面能力的AI独角兽,花了五年时间,投入1亿美元,希望其他企业在云天励飞开放的生态环境下,一个月就可以拥有云天励飞所有的业务能力、芯片能力和算法能力,甚至完成自己的AI应用,最终促成共赢共生的生态。

五、国家三大部委AI芯片重大专项大满贯

经过五年的深度耕耘,云天励飞的造芯技术能力已经得到了国家项目的认可。

仅在一年之间,云天励飞已承担国家科技部、发改委、工信部三大部委的AI芯片重大项目。

2018年8月,云天励飞的“嵌入式视觉人工智能专用芯片的研发及应用”项目入选2018年工信部人工智能与实体经济深度融合创新项目,在核心基础产品方向,是广东省唯一一家入选企业。

今年6月,云天励飞承担国家发改委人工智能专项。

今年9月,科技部科技创新2030—“新一代人工智能”重大项目2018年度项目公示,云天励飞作为唯一一家企业,与清华大学、中国科学技术大学、中国科学院自动化研究所等高校和科研院所牵头承担的项目通过公示。

2018年是科技创新2030重大项目开局之年,拟向新一代人工智能基础理论、面向重大需求的关键共性技术、新型感知与智能芯片等3个技术方向启动16个研究任务。

在智能芯片方向,云天励飞承担的课题是“面向人工智能应用的神经网络处理器关键标准研究与芯片验证”,旨在解决AI芯片训练与推理指令集“不高效”、神经网络表示和压缩标准“不统一”、处理器工具链“不易用”、软硬件系统接口“不规范”等难题。

秀首款5AIoT芯片,推一周造芯服务!深挖云天励飞的生态“芯”法

据李爱军介绍,由云天励飞牵头、9家课题单位共同组成的项目团队,已具备AI芯片“研发+产业落地+国际标准构建”的全产业链能力。

课题团队将发挥在标准、技术、产业化能力的优势,打造一个具有国际水准的中国AI芯片标准,同时会设计出具有自主知识产权、自主可控的AI芯片,以芯片助力我国十年未来AI产业化的大规模发展,和面向2030年AI宏伟目标的实现。

结语:AI芯片下一步拼什么?

从云天励飞的芯片战略中,我们可以总结出AI芯片打法的三个关键要素,分别是创新、服务、合作。

云天励飞身上有很多的标签,但其中国家超算深圳超算中心主任冯圣中最喜欢的标签是创新。深圳是孕育创新型企业的沃土,30多岁的华为、20多岁的腾讯、10多岁的大疆,还有云天励飞等一批不到10岁的年轻创新企业代表。

云天励飞庞大的生态战略中,最核心的还是基础的芯片和算法能力,这些能力如果没有创新,无法走到业界前列,也很难具备长久生存的活力。

在芯原微电子董事长兼总裁戴伟民眼中,平台是第一境界,服务是更高境界,比产品的格局更大。不选择最高大上的应用,而选择最扎实的应用,这是成功很重要的一点。

我们还看到AI芯片提供商所应具备的一个关键词是“合作”。能靠单打独斗就拼出一番天地的人寥寥,在国家政策支持鼓励,多家企业、高校机构纷纷抛出橄榄枝的背景下,多方合作以及参与更多标准的建设,对AI芯片创企自己和整体产业发展而言都是益事。