珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

芯东西(公众号:aichip001)
作者 |  程茜
编辑 |  Panken

蛰伏六年后,这家清华系AI芯片创企终于开始在国产GPGPU江湖高频出场。

今年4月,国内首款基于可重构架构的GPGPU芯片RPP-R8亮相,现已小规模量产。其背后的珠海GPU芯片创企芯动力,就此浮出水面。

珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

▲芯动力GPGPU芯片RPP-R8

芯动力创始人、CEO李原是一位芯片连续创业者。他1989年本科毕业于清华大学物理系,随后任职于英特尔、德州仪器等芯片巨头。在英特尔任职期间,他曾开发至强CPU服务器系统,拥有从产品定义、量产到商用的全链条经验。

从德州仪器辞职后,李原2008年在美国加州创立IPG Communications,承接通讯基站大型芯片设计项目。IPG独创的Turbo译码器被英特尔应用于其至强处理器。这家公司后来被美国老牌通信芯片商敏讯科技(MindSpeed)收购,敏讯科技的无线业务又在2013年被英特尔收购。

就在英伟达提出GPGPU新概念的前后脚,李原也开始琢磨类似的思路,即如何在发挥GPU并行计算能力和通用性优势的同时,通过引入其他类架构的长处,研发出能更好平衡性能、功耗、成本、延迟、部署速度的硬件。从2011年到2016年,经过长达六年的摸索,他们团队独创了一个将NPU的高效率与GPU的高通用性相结合的创新架构——可重构并行处理器架构(RPP)

他为何早早选择进入GPGPU赛道创业?又如何组建团队,将芯动力RPP架构从图纸中的创新设想,变成了在实际应用场景中发挥价值的硬件?在这外部环境复杂多变的五年之间,他对AI芯片及GPU行业的发展脉络与方向有哪些新的感悟与思考?近日,芯东西与这位国内GPGPU领域的创业代表人物进行了深入交流。

插播一则会议预告。9月14-15日,2023全球AI芯片峰会将在深圳举行。清华大学魏少军教授领衔近50位演讲嘉宾,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交锋,国内边缘计算AI芯片代表公司亮相。珠海芯动力创始人、CEO李原将在AI芯片架构创新专场,发布主题为《RPP芯片架构给AI芯片带来的发展前景及机遇》的演讲。欢迎扫码报名~

珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

一、清华物理系校友创业,已在半导体领域深耕19年

创立芯动力之际,李原早已是一位入局半导体行业19年之久的资深老兵。

1989年,他从清华大学物理系本科毕业后,接连远赴日本、加拿大进修无线通信专业。2004年,李原入职德州仪器,主攻通讯系统研发,在这里,他和芯动力的另一位联合创始人、当时已是德州仪器资深硬件工程师的朱建斌相识,这为多年后芯动力核心团队的组建奠定了基础。

当李原第一次筹备创业期间,朱建斌主动提出要转到芯片设计行业,并要从一位硬件工程师跨界成算法工程师,这令李原感到“有点不可思议”。朱建斌很快凭借其出色的学习能力、抗压能力证明了自己,李原的创业团队也组建就绪。

2008年,李原、朱建斌以及几位来自德州仪器的同事共同创业,在美国加州创办了一家无线通信芯片公司IPG Communications。

他们的初始目标很简单,先靠创业生存下来,再换个视角观察整个半导体行业。IPG创立后不久就承接设计了休斯顿卫星GlobalStar系统的通讯芯片,自研的Turbo译码器被英特尔应用至其至强处理器,随后在2011年顺利被美国老牌通信芯片商敏讯科技(MindSpeed)收购。

珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

▲芯动力发展历程

这一次创业,也让李原对半导体产业的认识更加深刻,他们发现几个特点:

半导体行业产业链绵长,芯片设计公司就是其中的灵魂

半导体行业全球竞争激烈,中小规模的公司不停被兼并、收购,很多从业人士被迫改行。李原的观点是,不能这样,“我们要逆流而上,要去看一看不同的风景”。

竞争激烈的行业共识后,他们还意识到,一旦在半导体行业里处于领先地位,企业就能获得巨大市场。最后可能形成第一家公司供应产品,第二家公司艰难竞争,第三家公司基本不存在的现象。

因此,第二次创业,李原和团队的目标就是:“我们应该成为一家什么样的公司才有可能存活下来。”

2011年,他们把各种各样不同种类的芯片摆到一张图上,他们发现其中有一个很大的空缺,在常见的CPU、GPU、DSP,以及专用的通信芯片之外,还有一类芯片的位置空缺,未被发现。

在这个空白处画下的大大的问号,成为芯动力创立的起点。经过5年的探索,2016年他们找到了答案——可重构并行处理器架构。基于这一创新架构,李原等人先是在美国成立了公司,2017年转回国内,在珠海创立芯动力公司。

二、研发“六边形战士”处理器,已实现千片级小规模量产

芯动力刚刚成立,李原曾问过朱建斌一个问题:什么样的节点代表他们做的事情成功了?朱建斌的答案是:“我们只要把这颗芯片真的做出来,达到了我们预期的性能指标。”

今年他们迎来了这一时刻。4月,芯动力发布首款基于可重构架构的GPGPU芯片RPP-R8。

RPP-R8每颗芯片内含有1024个计算核,相比传统GPU架构在同样的算力占用更小的芯片面积,实现了低功耗和高能效的有效平衡。RPP-R8除了具备专用芯片所没有的通用编程性,面积效率比可达到同类产品的7~10倍,能效比也超过3倍,可满足高效并行计算及AI计算应用。

珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

▲GPU和RPP架构性能比较

这颗芯片于2020年一次性流片成功,李原透露,RPP-R8目前实现上千片级小规模量产,并且已经进行大规模测试,之后他们会根据客户反馈进行产品修正,再继续下一个产品研发。

事实上,基于RPP架构的芯片成果做出来,在成立时的他们看来是不可能的事情。

这背后的原因可以先从现在的三大GPGPU技术流派来看,第一类较多公司采用的是在比较成熟的GPU架构之上,构建矩阵计算的能力;第二类是纯粹基于可重构技术来做;第三类是将可重构技术与GPU编程模型CUDA语言相结合

芯动力选择的即是第三类。李原解释说,主要有两大技术原因,首先选择可重构技术是因为,采用传统GPU架构很难追齐行业头部玩家,因此他们需要寻找更好的技术;其次,与CUDA语言相结合是因为其可扩展且广为行业所接受。

走一条全新的路径,也意味着他们一定程度上需要从0开始。李原谈道,最难的地方就在于,不仅要创新,还要达到市场的需求。

RPP架构是针对并行计算设计的芯片架构,芯动力将其称作“六边形战士”。这一架构既结合了NPU的高效率与GPU的高通用性优势,还支持实时操作系统(RTOS),具备DSP的低延时,可满足高效并行计算及AI计算应用,大大提高了系统的实时性和响应速度。

珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产

芯动力同样制程下的GPGPU芯片,与英伟达相比,在一些场景下性能提高达50%,且面积为类似芯片的1/7,功耗仅为其1/2-1/3

这背后离不开芯动力的研发团队,其核心成员有平均年限超过15年的资深半导体从业背景,且均来自英特尔、高通、德州仪器、联发科等半导体知名企业,研发人员占比超过80%。

时至今日,当李原再次问到什么是最大的成功时,朱建斌已经忘记了当初的说法,他的回答变成了:“我们把它在商业上做到成功,我们把这个事情变成一个客户喜欢的商品,这样才是真的成功。”

三、第一家客户是银行,率先落地三大应用场景

李原也一直在为做“客户喜欢的商品”而努力。

芯动力GPGPU芯片的第一家客户是一家银行。李原认为,芯片行业周期长,因此芯片设计必须按照产品需求来设计,否则芯片公司拿出的产品很容易因市场需求变化而被淘汰。

因此2017年以后,芯动力团队花了很长一段时间进行市场调研,调研结果与这家银行的需求不谋而合。银行希望将智能摄像头的“智能”和“摄像头”区分开,边缘算力盒子可以独立于摄像头进行升级迭代。

李原谈道,这也是他们与同类企业在市场策略上的不同之处——更加强调对于客户需求的分析。

在这个过程中,他们将客户分为三层,终端用户、软件集成商、硬件集成商。其中,关注设备功能的终端用户目前不在芯动力的合作伙伴之列。

目前,他们采用的策略是,与软件集成商合作先拿到市场,赢得硬件集成商的认同,进一步推广芯片产品。

芯动力的产品已经在边缘计算领域与银行、通讯领域与医疗超声波方向、AI方向的高性能计等领域实现应用。

作为产业链的上游玩家,芯片行业的封装、模组、软件、芯片本身领域都会影响到相关芯片企业研发或者进入新领域的动作,因此,芯动力目前的策略是把现存的几个方向做扎实,按照节奏来走。

在公司的未来规划中,李原有一个最为清晰的原则,那就是“技术是有边界的”。放到RPP架构中来说,就是这一架构只做适合的并行计算,不会做串行计算。

从任职大厂到自主创业、从半导体老兵到创企CEO,这些此前的工作经历及身份的转变,帮助李原为芯动力一步步确立起了清晰的技术路线和应用方向等。他说,最大的改变是视野不同。创业之前,有限的视野让他产生诸多困惑,例如自己到底在做什么,做的东西有没有用;创业之后,会更关注眼前的困惑,更加重视现在的产品。

四、GPGPU赛道竞争激烈,必须在细分赛道拿下第一

针对当前国内GPGPU产业,李原反复提及四个字:竞争激烈。

国内相关创企迎着半导体热潮涌入GPGPU赛道,李原认为,想要在这条赛道活下来,企业必须拿出产品验证自己存在的价值,在某一些方面超过英伟达,做到英伟达做不到的事。

英伟达这个强大的竞争对手,也是国内GPGPU芯片走向落地的最大拦路虎。李原感慨道,最高端,英伟达的A100、H100芯片拥有市场其它芯片无法匹敌的能力;最低端,英伟达的芯片同样在性能、价格上有竞争力。

面对这一劲敌,李原认为,全球竞争激烈的半导体产业中,他们必须超过第一位,成为这个赛道的龙头,才有可能生存下来。想要和英伟达竞争,就要先从与之不同的行业切入。他补充道,英伟达虽然有不同产品,但不见得其产品在每个行业都无可替代。深耕这些行业,使得产品在性能、价格上拥有竞争力是芯动力目前最重要的事情。

此外,当下大模型狂潮席卷,GPU缺货风波不断,也为GPGPU产业带来了很好的机会。在李原看来,主要有两个方向:

首先是AI训练,参数规模庞大的大型语言模型,需要强大的计算能力,国内创企未来的技术演进或许能满足这一需求。不过,目前而言,英伟达在这一方向的领先性鲜少有企业可以与之抗衡。

其次是应用部分,大型语言模型在应用端的计算需求,一般芯片也可以满足,因此这对于国内创企而言是一个巨大的机会。即便大型语言模型距离未来真正落到某一个场景还有一段距离,但李原对这个方向十分乐观,其现在面临的局限性未来有机会被打破。

就芯动力而言,他认为,大型语言模型呈现出的能力和人相比还有一段距离,芯动力会在自己的技术上做一些思考,如何找到创新的芯片架构路径,使得大型语言模型性能达到替代人的地步。

最后,在半导体行业的漫漫创业路中,李原说:“要保持乐观。”他和团队选择了一条艰难的路创业,正因为他们没有在整个半导体行业走下坡路时放弃,现在也幸运地碰到了其中为数不多蓬勃发展的好机会。

结语:国产GPGPU新秀发力,核心团队离不开三大要素

GPGPU将GPU的应用范围扩展到了图形计算之外,在众多大规模并行计算中得到了广泛的应用。今年芯片实现小规模量产的芯动力开始在这一领域崭露头角。

李原总结了芯动力核心研发团队具备的几大核心要素:

首先要有资深从业背景,芯动力的研发团队准入门槛非常高,有熟练研发经验、善于从事这一行业的工作,是最起码的要求。

其次,要对新技术保持开放的心态,他说:“当我们把这件事情做的很好的时候,我们往往会给自己画地为牢,走出来是很难的。”

第三,研发团队要有激情,遇到挑战不低头。芯动力选择的路线是没人做过的事情,因此挫折往往更多。

对于GPGPU赛道则更为艰难,英伟达身处霸主地位已经成为业界共识,另辟蹊径的芯动力或许有望通过“六边形战士”的RPP架构,在部分特定能力上做到超越英伟达。

在今年9月14日-15日举行的2023全球AI芯片峰会期间,李原教授将对RPP芯片架构给AI芯片带来的发展前景及机遇进行深入解读,分享这一架构在适配各种不同AI算法和应用场景方面的通用性,以及如何为AI企业提供强大的计算能力,推动AI产品的应用落地。