「AI新青年讲座」将邀请世界顶尖AI研究机构和大学的科研新青年,主讲他们在计算机视觉、机器学习等人工智能领域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑,将可以帮助大家增进对人工智能前沿研究的理解,相应领域的专业知识也能够得以积累加深。同时,通过与AI新青年的直接交流,大家在AI学习和应用AI的过程中遇到的问题,也能够尽快解决。

「AI新青年讲座」目前已完结111讲,错过往期讲座直播的朋友,可以点击文章底部“阅读原文”进行回看!

有兴趣分享学术成果的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系。

摩尔定律曾预言了半导体行业半个多世纪的蓬勃发展——集成电路上可容纳的晶体管数目,每隔十八个月翻一番——芯片性能也将随着片上资源的丰富而翻番。然而由于功耗限制,程序行为依赖等诸多原因,通用处理器的性能每两次翻番的时间间隔越来越长。

因此,为追求更快的速度和更好的功耗性能比,学界与工业界都开始将可编程的专用体系结构(硬件加速器)用于特定的应用上。工业界代表性的产品有比如谷歌的TPU,阿里的晗光和华为的昇腾,都是为深度学习/AI算法设计的加速器。学术界有名的论文有比如计算所为神经网络设计的DianNao,哥伦比亚大学为数据库设计的Q100,和斯坦福大学为通用计算设计的Plasticine。

然而为设计这些可编程的专用的体系结构,都需要经过一个冗长的工作流程:首先学习目标程序集的行为,然后根据这些程序的行为设计对应的专用硬件机制及其软硬件接口;最后,为有一个开发者友好的全栈设计,还要为这个全新的硬件开发新的编译器,以适应其全新的编程/执行模型。很少有人考虑将这个过程(或其中几步)复用,从而使得每次为新的程序集设计加速器都要从头开始。

由加利福尼亚大学洛杉矶分校翁健博士所在的PolyArch团队提出一个将可编程加速器设计流程自动化的框架DSAGEN,可以自动为目标程序集生成专用的加速器。该框架在硬件层面,每一个对程序行为专用的硬件机制都被抽象成一个模块,可以独立地集成到目标加速器中;在软件层面,因为编译器能够理解软件中需要被专用的关键行为,于是就能将此转化为对于硬件模块的需求,以此指导专用加速器的对于功能的集成和硬件资源的需求。

由翁健、刘思皓等人开发的框架DSAGEN,是一个特异化加速器设计的全栈实现——包括了应用、编译器、RTL实现,并能在FPGA上完成原型机的部署。目前该框架仍在活跃地更新,以囊括更丰富的软硬件特性。

4月27日,「AI新青年讲座」第12讲邀请到加利福尼亚大学洛杉矶分校PolyArch实验室翁健参与,主讲《可编程加速器设计自动化及编译实现》。

讲者

翁健,加利福尼亚大学洛杉矶分校PolyArch实验室在读博士,师从Tony Nowatzki,研究领域为计算机体系结构,编译原理,和软硬件协同设计;在计算机体系结构顶会HPCA、MICRO、ASPLOS、ISCA发表多篇论文,论文入选IEEE Micro Top Picks和Honorable Mentions。

第12讲

主 题

《可编程加速器设计自动化及编译实现》

提 纲

1、可编程加速器的研究现状
2、专用加速器的设计流程及问题
3、可编程的加速器设计流程自动化框架DSAGEN
4、在FPGA上完成原型机的部署

直 播 信 息

直播时间:4月27日10:00
直播地点:智东西公开课知识店铺

论文成果

DSAGEN:《DSAGEN: Synthesizing Programmable Spatial Accelerators》
链接:www.seas.ucla.edu/~jianw/isca2020.pdf
开源地址:https://github.com/PolyArch/dsa-framework