清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

芯东西(公众号:aichip001)
作者 |  程茜
编辑 |  Panken

又有一家“清华系”前沿芯片创企浮出水面。

本月初,国内Chiplet芯片设计创企北极雄芯宣布完成新一轮超亿元融资。这是继去年10月获得1.5亿元天使轮融资后,北极雄芯拿下的又一笔亿级融资。韦豪创芯、中芯熙诚、讯飞创投、丰年资本、正为资本均在其股东阵容。

这家2021年7月成立的年轻创企,在今年2月推出了国内首款基于异构Chiplet集成的智能处理芯片“启明930”,成为国内第一家流片成功Chiplet异构集成AI芯片的公司。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

▲启明930实物(左)、启明930板卡(右)

北极雄芯的创始人、首席科学家马恺声,是清华大学交叉信息研究院助理教授、博士生导师。图灵奖得主、中科院院士、清华大学交叉信息研究院院长姚期智,现任北极雄芯的首席科学顾问。

过去四年,马恺声带领团队在架构拆分设计、高速互联接口、国产供应链封装等各项Chiplet基础技术研发层面取得了一系列成功。

英伟达A100、AMD MI300、特斯拉D1、苹果M1 Ultra等经典AI芯片产品均采用了Chiplet架构。基于Chiplet架构的高性能解决方案,能够有效降低云边端AI芯片的设计门槛,潜在市场规模巨大。而马恺声对此积累颇深。

近日,芯东西与这位国内Chiplet领域的前沿学者进行了一场深度对话,不仅回顾了其如何前瞻性地选择在Chiplet赛道创业,还解读了北极雄芯背后的核心技术积累。

一、用Chiplet架构解决行业痛点,三年积累迎来产业风口

马恺声与Chiplet的缘分,是在加入清华后开始的。

2018年,从宾夕法尼亚州立大学毕业后,马恺声进入清华大学交叉信息核心技术研究院,成为其中除量子芯片外主攻应用芯片研发的“第一人”。在这里,众多专家专注于研究AI在不同行业的应用,所涉及的场景及算法差异性极大,而马恺声负责底层硬件支持。“按照每2-3年做一款AI芯片的进度,我得做几十年。”马恺声说,这样的研发速度,对于飞速发展的AI行业而言,只能是杯水车薪。

恰巧在这时,电动汽车的滑板底盘技术给了他灵感。

所谓滑板底盘,就是将电动车的制动、悬架、电动传动、电池等部件以模块化形式集成,这样不同车型可以根据需求组装相应模块。

无独有偶。苏州芯片创企贝塔微打造的工具,可以低成本快速批量生产芯片,与半导体产业头部玩家德州仪器的电源管理芯片DC-DC、AC-DC抢市场。

在这些启发下,马恺声开始集中琢磨一个问题:怎么能快速、低成本的做芯片,还能满足AI+各行各业的需求

Chiplet,就这样闯进了马恺声的研究主线。

Chiplet常被译为“芯粒”、“小芯片”,通过将一整颗SoC的功能模块解耦,分别设计制造采用不同制程工艺的chiplets,再通过2.5D/3D先进封装技术集成在一起。这种异构集成的设计理念,不仅有助于降低芯片研发成本,而且能够有效缓解各行业算力需求方在差异化需求、性能、成本、算法迭代周期、供应链保障等各方面的核心痛点。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

嗅到巨大商业价值后,2019年,马恺声意气风发地率领团队投入Chiplet研发。

早期依托于西安交叉信息核心技术研究院的孵化支持,团队完成了启明910、启明920等几代AI加速模块的研发; 2021年7月,北极雄芯公司成立并获得图灵创投、SEE Fund、红杉等天使轮投资,马恺声正式踏上创业之路。

2022年初,Intel、AMD等国际半导体产业巨头成立Chiplet产业联盟发布UCIe 1.1规范,Chiplet在市场上的关注度渐起。

一切开始步入正轨。

二、主攻云边端AI推理,智能驾驶成重点突破口

理想很丰满,现实却很骨感。

“在芯片领域,大家都很保守,你不把(产品)跑通,客户看不到产品就会选择观望,不会贸然采用Chiplet路线。”马恺声说。

实际操作中,不同场景的需求并不收敛,如何在不同场景的硬件需求中找到最大交集?如何有效的解耦其中共性的部分以及差异化的部分? 这是做Chiplet无法绕开的一大难题。

带着这样的思考,马恺声联合团队深挖潜在客户需求,综合考虑Chiplet的技术特性和经济效益后,北极雄芯将选择先从云边端AI推理入手AI加速智能驾驶为重点场景突破口,先做出具有代表性的Chiplet架构芯片,再通过方案授权或联合研发等方式向其它行业拓展。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

▲Chiplet技术演示(图源:北极雄芯官网)

例如在智能驾驶领域,单一芯片很难同时兼顾不同档次车型在产品差异化、迭代周期、成本控制上的需求;AI推理加速方面,市场对高性能算力的需求将从“通用化”向“专用化”转变。这些趋势都与Chiplet架构将大型SoC芯片的模块拆分成芯粒的技术路线相契合。

“无论是人工智能服务器,还是智能驾驶高性能计算平台,我们看到的均是千亿级别的潜在市场,并且认为Chiplet架构在其中能够提供独特的商业价值。”马恺声对Chiplet的商业价值及市场前景非常乐观。

三、两年半跑通首颗Chiplet芯片,筑起三大核心技术壁垒

从设计、制造、互联、封装、工具链等全部跑通,在这件事上,我们应该是国内第一家。”马恺声谈道

今年2月,北极雄芯发布了首个基于Chiplet架构的“启明930”芯片,可用于AI推理、工业智能等不同场景

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

启明930基于12nm工艺,采用了北极雄芯自研的第三代“MUSE”核心架构NPU,搭配北极雄芯构筑的完整算法、编译、软件工具链体系,使得自研NPU在主流AI模型应用上的平均芯片利用率超过70%

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

这是首个基于Chiplet异构集成并完成流片及国产封装全链路成功验证的高性能计算SoC,中央控制芯粒采用RISC-V CPU核心,同时可通过高速接口搭载多个功能型芯粒,做到8~20T的算力灵活拓展,支持主流AI算子。

目前,启明930已与多家AI下游场景合作伙伴进行测试。

由于基于全国产基板材料以及2.5D封装,启明930的成本更加可控。北极雄芯还提供了与其芯片配套的基础驱动、框架支持、应用层全栈式的应用部署工具。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

“把十几个小芯粒封装在一起,并且部署相应的任务,这块芯片能跑通,是一个非常复杂的工程。”马恺声感慨道,“如何在架构定义层面进行纵向拆解?需要支持哪些算法?在哪个模块做?IP如何集成?如何实现高速互联通讯?如何解决应力问题?如何解决供电散热材料?”……最后,北极雄芯联合将近10家厂商一起才跑通了启明930。

据他回忆:“启明930从研发、流片、回片,折腾了将近两半年的时间。”,因为之前从未有人完整的在国产供应链跑通全部。

在这背后,北极雄芯积累了三大核心技术。

一是“”,明确Chiplet的拆解与定义;二是“”,解决Chiplet的互连与通信;三是“”,负责Chiplet与封装优化。

其中,基于芯粒划分方法学,能降低跨芯粒数据通信负担;采用低“芯粒税”的架构定义,可以降低芯粒化带来的面积负担;内部Chiplet-Actuary成本模型,能实现高性价比复用。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

▲北极雄芯对于Chiplet的拆解与定义

北极雄芯自主研发的PBLink D2D互连接口,能实现高速高带宽与低延时的芯粒通信,同时符合国内《芯粒互联接口标准》及车规级D2D接口标准。

在封装方面,为了促进供应链国产化,低线数的PBLink D2D接口可以满足国内基板的层数要求(≤8层),多芯粒与封装协同布局同步优化封装利用率等。

四、预告芯片量产路线图,下一代Chiplet产品正在紧密研发

基于产学研结合的多年积累,北极雄芯已经完成了首个基于Chiplet异构集成芯片的试生产验证,并向下游客户交付了首个隐私安全计算芯粒产品。

北极雄芯也陆续与经纬恒润、海星智驾、山东云海国创等多家下游场景方达成战略合作,致力于共同推动Chiplet在智能驾驶、AI服务器等各行业场景的应用。

马恺声认为,Chiplet的市场发展已经很清晰,他预计到2030年超过一半的高性能AI计算芯片以及智能驾驶相关主控芯片均会采用Chiplet架构

市场研究机构Omdia的数据也显示,到2024年Chiplet的市场规模将达到58亿美元,2035年市场规模将进一步扩大到570亿美元。

目前北极雄芯正投入下一代高性能通用型芯粒以及AI计算芯粒的研发。据马恺声透露,其下一代产品预计将于2024年回片测试成功并开始小规模量产,预计将率先在部分高性能计算、商专车、低速无人驾驶等场景实现小批量使用,并按节奏逐步进入乘用车智能驾驶领域。

面向未来,当下蓬勃发展的大模型机器人产业,也让马恺声看到了Chiplet落地应用的诸多机遇。

不同于此前人形机器人的传统控制算法,现在人形机器人采用端到端控制,基于模型输出电机怎么转的指令。

这样一来,机器人的每个自由度都是一个电机,每个电机都需要一套模型,模型的计算速度要更快,才能让机器人收到反馈、做指令更灵活。

此外,大模型包含训练和推理的需求,可能两年之后,随着产业发展较为成熟,推理需求将进一步被释放出来。

在这些机遇中,基于国内尚有差距的供应链、工艺等,如何做出高性价比的系统,是北极雄芯要做的事。这些拥有巨大潜力的应用场景的出现,也为马恺声继续探索Chiplet增添了更多动力。

五、拆解Chiplet发展三大拦路虎,发布国产供应链Chiplet互联标准

对于国内Chiplet发展面临的挑战,马恺声重点谈及三个环节。

首先是生产制造环节,如何尽可能基于国内自主可控的供应链实现Chiplet芯片的量产,摆脱受制于国外先进制程的枷锁,用国内成熟制程工艺技术实现满足需求的性能。

其次是如何拆分芯片模块,并通过不同工艺制程生产,使其商业化达到最优。

还有封测环节,国内封装基本材料与国外存在差距,先进封装的量产成本高,因此做Chiplet既要考虑通过国产封装供应链来优化芯粒、接口设计,还要考虑成本。

难题摆在眼前,北极雄芯也在积极推进Chiplet接口标准的制定。

早在2020年,其团队即与国内上下游共同建立了中国Chiplet产业联盟(CCLL),专注于Chiplet架构在各领域应用的前沿探索。今年年初,交叉信息核心技术研究院牵头、中国Chiplet产业联盟共同起草的《芯粒互联接口标准》ACC 1.0高速串口标准《车规级芯粒互连接口标准》ACC_RV 1.0正式发布。

清华孵出一家Chiplet黑马!连拿亿级融资,首款AI芯片已跑通,独家对话创始人

下载链接:http://accchiplet.iiisct.com/

相比于UCIe标准,ACC标准更关注针对国产供应链的优化,适合对供应链自主可控程度要求高、量产成本敏感的下游领域,能满足其商业落地的需求。

马恺声坦言,虽然UCIe已经发布一段时间,但市场上至今还没有相对成熟的支持所有频点的满足标准的产品,而真正下场做各个“芯粒”的企业更是寥寥无几

他认为,标准应该先让大家能用起来,基于各场景的真实商业需求以及国内相关供应链的完备程度来制定标准。往后看,北极雄芯计划进一步投入高速互联芯粒接口等Chiplet基础技术的研发。

在这个过程中,他将Chiplet的发展和工艺进步看作“正交”关系,在工艺制程发展受光刻机等关键设备及半导体材料制约的情况下,接下来10-15年内,Chiplet或许会贡献出不一样的东西。

结语:高性能计算Chiplet需求渐起,国内新生势力挑起大梁

北极雄芯希望在Chiplet产业中扮演怎样的角色?马恺声用一句话加以概括:“北极雄芯希望基于国产化的供应链,用最大的自主可控程度,做出不错的系统应用。”

如今北极雄芯的核心研发团队,已经聚集了有中兴、华为、紫光、英特尔、Cadence、Marvell等国内外知名半导体企业背景,拥有不同工艺多款芯片成功流片经验的一批芯片人才。

随着系统级芯片集成进入后摩尔时代,加上国内先进制程供应受阻,基于Chiplet的创新思路成为国内半导体产业发展的重要途径。在时代浪潮中,北极雄芯致力于成为基于Chiplet架构定制化高性能计算解决方案的领航者,从AI在各领域落地的实际应用需求出发,协助各行业“用小芯片,做大芯片”。

在今年9月14日-15日举行的2023全球AI芯片峰会期间,马恺声教授将对Chiplet架构在AI芯片中的商业价值进行进一步的深入解读,分享推动Chiplet架构在国内的商业化落地以及创造新的高性能计算范式,并介绍北极雄芯在Chiplet领域的拓展及实践。