智东西(公众号:zhidxcom)
文 | 心缘
在人工智能(AI)芯片的热潮中,有的人看见了落地机会,有的人却将目光投向遥远星空。
北京,这个国内AI芯片的沃土中,新的势力正在孕育。来自清华、北大、中科院的十五位科学家集结在一起,围绕智能芯片的核心技术展开基础研究。
借2019北京智源大会举办之际,智东西同少数媒体采访中科院计算所研究员、智源首席科学家陈云霁,试图从和他的交流中,了解AI芯片被看好的研究方向以及当下面临的挑战。
▲中科院计算所研究员、智源首席科学家陈云霁
一、凝结AI芯片人才的智源学者计划
在切入正题前,我们先来简单聊聊将十五位科学家凝聚在一起的背景。
为将北京打造成链接世界人工智能产业与学术资源的中心枢纽,2018年11月,北京智源人工智能研究院(以下简称“智源研究院”)成立,拟采用新的科研组织形式和人才培养模式,建成全球最优的人工智能学术和创新生态,推动北京成为全球人工智能学术思想、基础理论、顶尖人才、企业创新与发展政策的源头。
智源学者计划,正是实现这一目标的主力军。
这一计划将技术路线决策权和人财物支配权全部交于科学家,试点科技经费“包干制”,使科学家可以心无旁骛、潜心研究、创新突破。
依托北大、清华、中科院等优势高校园所,以及北京市人工智能骨干企业研究院,智源学者计划重点支持智源科学家首席(CS)、智源研究项目经理(PM)、智源研究员(PI)、智源青年科学家四类人才,拟三年内遴选超过300名智源学者,并在全球范围内紧密联系超过3000名人工智能领域顶尖学者。
就在1个月前,智源研究院公布“智能体系架构与芯片”方向及候选名单。
这是继“人工智能数理基础”、“机器学习”、“智能信息检索与挖掘”后,智源研究院公布的第四个重大研究方向,由中科院计算所研究员陈云霁任首席科学家,中科院计算所副研究员郭崎任研究项目经理。
入选候选名单的9位智源研究员(PI)与6位智源青年科学家来自北大、清华和中科院,均是这一领域具有国际影响力的中青年学术带头人。
通过将芯片设计方法、多种智能芯片、编程编译、智能终端云端系统等不同领域的学者连接在一起,智源研究院想以先形成内部生态的方式,之后逐步拓展,为之一研究方向创造更多的机遇与价值。
二、智能体系架构与芯片研究的四个层次
其他重大研究方向更偏向算法与应用,“智能体系架构与芯片”方向更多偏向硬件与系统。某种意义上来说,这一方向在整个智源研究体系里是最底层、最基础的。
这一方向有四个层面的研究:整机、编程、芯片、方法。
(1)整机,相当于交付一个完整的智能计算机。
(2)编程语言和编译,主要研究如何写智能程序、用什么语言、写出来的智能程序怎么编译到芯片。
(3)芯片,即做各种各样具体的智能芯片。
(4)方法,主要研究开源智能芯片的设计方法学,即怎么能够快速用开源工具设计出新的智能芯片。
关于研究方向的选择,陈云霁告诉我们,设置方向之处,源码资本投资合伙人、智源研究院首届理事长张宏江博士,北京大学教授、智源研究院院长黄铁军老师,均向陈云霁他们提供了一些建议。
他们认为,现在企业能往产品做的事情,已经有很多投入、很多人在做,智源不要做这些,而要看向更远的东西。
三、面向未来的四类AI芯片布局
据陈云霁介绍,在芯片方面,“智能体系架构与芯片”方向目前主要有四类布局。
这四个领域都具备学术前瞻性,或属于国际学术的前沿领域,或是未来很有潜力的学科增长点,或有非常实际的应用需求。
1、类脑智能芯片
类脑智能芯片的设计思路是,希望芯片能够像接近我们大脑工作机理去运转。
前段时间,清华大学施路平老师带队研发的类脑芯片,登上《Nature》封面,并创下中国人工智能和芯片论文在《Nature》上零的突破。
这说明在这个方向,北京在国际上都是处于比较前列的地位。
2、机器学习处理器
智源研究院未来想做的机器学习处理器,不仅仅是深度学习,还能够高效处理贝叶斯、决策树、信息回归等更广阔的机器学习方法,我们都能够非常高效地去处理。
3、可重构智能芯片
未来十年、二十年,智能算法还会快速发展,以后产生出来的智能算法可能是我们今天闻所未闻,甚至是想都没有想到过的。
如果未来的智能芯片不能支撑未来新的算法,业务面就会受限。因此智能研究院希望探索一种可重构的智能芯片的方法,可根据应用需求,去灵活进行动态配置,适配未来的算法。这样未来不管智能算法怎么演进,芯片都能较好地支撑。
4、应用驱动的芯片
在日常生活中,人们得到的信息都是时序信息。通常人们在外界收到的都是视频序列和语音的序列,面向视频的序列和语音序列的应用也非常多。
目前中科院半导体所在研发一类以应用为驱动的专门的芯片去处理时间序列的信息。
四、9位研究员和6位青年教师的研究方向
目前,“智能体系架构与芯片”方向共有9位智源研究员和5位青年教师。
研究整机的有清华大学教授陈文光和中科院计算所研究员韩银河。陈文光主要做智能云端计算系统,研究高性能稀疏张量编译器;韩银河主要做智能终端系统,研究方向是算控一体的机器人智能芯片。
研究编程和编译系统的有清华大学研究员张悠慧,他的研究方向是面向神经形态芯片的类脑神经网络建模与编译技术研究,清华类脑计算芯片天机芯中的编程和编译系统即是由他来完成的。
类脑芯片方面,有北京大学教授蔡一茂、中科院微电子所研究员刘琦。蔡一茂拟从事类脑神经形态智能芯片设计关键技术研究,刘琦的重点研究方向是基于忆阻器的类脑计算芯片研究。
机器学习处理器方面,任首席科学家的中科院计算所研究员陈云霁拟研究的是机器学习芯片统一分形体系结构,清华大学长聘教授尹首一研究可重构数模混合智能计算芯片。
在面向时间序列信号的类脑神经网络芯片方面,主要研究者是中科院半导体所研究员鲁华祥,他在神经网络硬件领域有很长时间的积累和传承,鲁华祥的老师正是我国著名半导体电子学家上世纪90年代就在做神经网络计算机工作的王守觉院士。
做开源芯片设计方法的有两位研究员,一位是北京长聘副教授罗国杰,研究开源智能芯片敏捷设计方法与工具,另一位是中科院计算所研究员包云岗,研究基于人工智能的开源芯片敏捷开发平台,他们均在国际上有一定影响力。
6位青年科学家中,清华大学副教授翟季冬在做面向人工智能芯片的编译器。
清华大学副教授李国齐研究异构融合类脑计算框架,他也是类脑芯片天机芯的主要参与者之一。北京大学研究员杨玉超也在做类脑芯片,他研究的方向是面向类脑智能的神经形态器件与系统。
中科院计算所副研究员陈晓明主要研究存算一体架构、EDA与模拟器。中科院计算所副研究员杜子东在做大规模异构智能计算系统架构研究,北京大学副教授孙光宇则聚焦于边缘计算场景低功耗加速器设计。
五、哪类芯片的发展潜力更大
陈云霁认为,“智能体系架构与芯片”方向着重研究的四类芯片都很有发展潜力,如果未来智源不断发展,完全可能再支出第五类、第六类芯片。
在他看来,基础研究的模式可能跟纯做大工程不太一样。
大工程如果说做一个原子弹,最后就是一个原子弹;而基础研究要同时平行探索好几条路径,到底哪条路径能成功,需要时间来检验。
这个过程中,路径可能有分叉,也可能有合并。现在是四条路径,有些青年科学家产生一些新的想法,可能有第五条、第六条,也有可能会合并,四条变成三条。
如果将目光放置三十年、四十年甚至更久,陈云霁认为类脑芯片将有很大的潜力,今天它还发展的并不成熟,但陈云霁相信,这是他们做科学研究的终极目标。
而如果从比较实际的角度来看,机器学习技术正被广泛使用,机器学习处理器是短期从基础研究变现应用的一个较快的手段。可重构芯片、时间序列的芯片同样也非常有价值。
至于陈云霁正研究的分型体系结构,与上述四个芯片方向是正交关系,对这个四个方向都能发挥价值。
分型要解决的问题是希望能有一种体系结构模式,既能够支持非常大的芯片和非常大的机器,也能够支持非常小的芯片和非常小的机器。这种体系结构的模式,在某种意义上,对现在这四类芯片都有裨益。
以类脑芯片为例,有时需要设计神经元数量等同于人脑的类脑芯片,有时则需设计只有几百个到几千个类脑芯片。为每个芯片都专门设计一个结构是不现实的,可能要靠分型的方法来解决这个问题。
陈云霁表示,现在判断这些芯片的未来发展情况还为时尚早,需要十年、二十年才能检验出来。
至于未来芯片设计上的变化,他认为,定义一个特定领域,然后较自动化地用一些EDA工具快速生成,这是十年内完全有可能实现的。而从更长远来看,或许有一天智能算法发展到非常好的程度,计算机完全从头到尾设计出一个芯片来,不需要人干预,这就可能是三五十年的目标,是非常有意思的尝试。
六、知识分层问题怎么解?人才培养是不是烧钱?
当下软硬件的知识分层很严重,做系统软件的不懂微电子,做底层硬件的又对上层应用于系统软件知之甚微,怎样才能对其他层有更多的了解呢?
陈云霁引用计算机领域的一句话:“没有什么是抽象解决不了的,如果抽象不够,就再加一个抽象层。”
他提到这种现象在高校中也非常严重,比如传统体系结构课中,面试本科生时,不管清华、北大还是中科大的学生,问体系结构的知识很清楚,问操作系统也很清楚,但是结合的时候基本说不明白。
为什么说不明白?这肯定不是清华、北大、中科大的学生不聪明,而是老师教的不对。
想到这一点,后来,陈云霁就开了一门叫智能计算系统的课,希望能将这些知识体系串联起来。比如以智能计算某一个特定任务为入手点,从上层的算法、系统软件、编程框架,到操作系统、芯片,把技术栈串起来。
这门课在全球十所高校均有开设,但还是不太容易,在不同学校上这门课的感觉不同。
在北大上课的效果较好,这些学生基础相对更好,能够比较快地理解如何将知识点串起来,而在有的学校,学生还没有完全理解单个的知识点,想解决综合问题就更加困难了。
中科院计算所研究员包云岗对这一观点进行了补充,除了建议更多学校将这种串联多个层次的课开设起来,他也提到,能跨通多个层次的人才毕竟还在少数,将所有人都培养成这样也不现实,关键是找到有这个能力的学生后好好培养,也许他们出来以后,能在顶层架构设计上有更多的贡献。
由于芯片流片封装都需要大量开销,但学生们设计出的芯片往往并没有得到应用,那么做流片、封装这些后续的流程是不是白白浪费钱?
包云岗认为,我们需要能有一种机制,帮热爱研究的学生找到成就感,模拟和最后真正流片出来是有差别的,他们希望通过这个方式起到两个作用,一是帮学生走完流程,二是把开源EDA完善。如果让企业去用,可能企业用一次后就不愿意用了,而通过与学生的紧密互动,其中有更多机会可以迭代。
陈云霁同样并不认为这是浪费钱的事情。
从国家角度来看,我国芯片设计人才仍很匮乏,人才基数少,研发实力逊于美国,怎样低成本又快速培养出大量芯片设计人才呢?
陈云霁的博士生导师曾告诉他,一个小的芯片设计师就是拿钱砸出来、拿失败耗出来的。
他提到,培养一个顶级芯片设计者所耗的钱是以亿计的,如果用同样多的钱,每花五万元培养一个人,虽然不是最顶级的,但这个人可以
从逻辑设计到封装再到后面电路板上调试问题全部搞定,这样就能为国家培养两千个还不错的人才。这对国家而言不是浪费钱的事情,而是造福国家、企业的事情。
结语:科研需要想象力
在产业界,我们可能更去关注一颗芯片能做什么,比如它是能加速视频图像处理还是语音处理。但对于像陈云霁这样从事基础研究的科学家们而言,他们更多从底层的角度来往上看,去做更具前瞻性的基础研究。
这些中青年科学家所聚焦的领域,无论是机器学习处理器、应用驱动的专用芯片,还是可重构智能芯片与类脑智能芯片,尽管代表了AI芯片的不同研究方向,但它们都正走向一个共同的目标,在能效越来越高的同时,让芯片的应用更有通用性。
我们不乏能将产业落地、工程问题解决很好的人才,但很多时候,科研不是缺乏能力、技术与手段,而是缺乏想象力。而在历史的长河中推动科技变革的,往往是那些敢于想象、准确判断方向并付诸长期研究的科学家们。