中科驭数二代DPU芯片成功点亮!28nm制程、1.2μs超低时延

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西12月25日报道,近日,DPU创企中科驭数宣布其自主研发的第二代DPU芯片K2成功点亮,并称这是业内首颗完成点亮的国产DPU芯片。

DPU是数据专用处理器,被称为继CPU、GPU之后数据中心的“第三块主力芯片”,可提供网络处理、计算加速、本地存储、安全卸载等功能,有效减轻CPU的负担。

K2是中科驭数的第二代DPU产品,采用28nm制程工艺,支持网络、存储、虚拟化等功能卸载,是目前国内首颗功能较完整的ASIC形态的DPU芯片,具有成本低、性能优、功耗小等优势。

据悉,K2芯片可实现1.2μs超低时延,支持最高200G网络带宽,广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。

中科驭数创始人、CEO鄢贵海认为,K2的成功点亮,为DPU芯片规模化量产打下了坚实的基础,是中科驭数DPU走向成熟的一大步。

中科驭数二代DPU芯片成功点亮!28nm制程、1.2μs超低时延▲中科驭数DPU芯片K2核心参数

一、首颗国产的ASIC形态DPU芯片

进入后摩尔定律时代,数据中心面临算力和带宽增速比失调的问题。随着数字经济的推进,每年各行业产生的数据量以30%的速度增长,网络带宽从10G向20G、100G、400G迈进,然而后摩尔定律时代,CPU的性能以每年不足3%增长,网络传输、存储等任务就已经让CPU不堪重负,无法再有更多的资源用于计算、任务管理调度等,数据中心面临迫切的算力架构变革。

DPU作为新型数据专用处理器,可以针对基础设施层(IaaS)的计算负载,通过创新的专用DPU计算架构,解决“CPU处理效率低下、GPU处理不了”的任务负载,如网络协议处理,高速存储协议,硬件资源虚拟化等。

通过将这些基础层负载卸载到专用的DPU上处理,释放CPU的算力资源能够更好地服务上层应用,从而提升整个计算系统的效率、降低整体系统的总体拥有成本(TCO)。目前国内尚无ASIC形态的DPU芯片产品,中科驭数成功点亮的K2是第一颗国产的ASIC形态的DPU芯片。

中科驭数是国家专精特新“小巨人”企业,至今已经开展三代DPU芯片的研发迭代,近一年多来获得了3轮数亿元规模的融资,被评为中国信科“潜在独角兽”。

中科驭数于2019年流片了第一代DPU芯片K1,第二代DPU芯片K2于2022年流片。基于DPU核心技术,中科驭数研发了超低时延DPU网卡、RDMA加速卡、数据查询加速DPU卡以及面向金融计算领域的极速风控、极速行情等解决方案。

除了在金融计算领域实现规模化应用,其市场应用也开拓到了数据中心、通信、云计算等领域,已实现几千万规模的营收。

据鄢贵海透露,中科曙光、联想、浪潮等国内主流服务器集成厂商及一些新兴服务器集成厂商都是中科驭数的客户。

二、60余次方案评审,要啃下DPU的硬骨头

谈及K2研发的挑战,中科驭数联合创始人、高级副总裁(兼CTO)卢文岩说,一年内完成集成和芯片化研发难度很大,在技术路线上,中科驭数选择了一条性能最好也是最困难的一条路,采用自主研发的KPU芯片架构,源于过往几年的技术积累,K2得以顺利流片。

中科驭数团队在芯片体系结构领域有超过15年的积累,在网络、存储、计算等领域积累了TOE、RDMA、NVMe-oF、大数据处理等功能核。

据卢文岩介绍,整个K2项目进行了60余次方案评审,芯片前端进行了近40万行代码的开发。DPU是一个与应用密切相关的芯片,在研发阶段就要完成云原生、存储、金融计算、边缘计算等5大场景的应用的原型适配;在功能仿真和测试阶段,要完成数千个验证和测试用例。

K2芯片首先致力于解决延迟痛点,做到国产方案可替代,同时也规划了接下来一两年间的数据中心标准化核心应用,希望给后续DPU在数据中心中的应用打下良好基础。

之所以K2采用28nm制程工艺,鄢贵海在接受媒体采访时加以解释:DPU现阶段主要解决功能定义问题,从性价比来看,28nm是一个既安全、能达到功能诉求,成本又较能被接受的选择。后续中科驭数的产品会对先进工艺有较强需求。

至于选择ASIC路线的原因,他谈道,这是因为相比FPGA,ASIC形态的DPU芯片更能产生规模化效应,可包含大量FPGA方案覆盖不到的细分市场。从成本、功耗和散热的角度考虑,ASIC都是更适合的路线。“ASIC芯片做出来没有那么难,但是找对时间点,确保后面芯片能达到它的预期,尤其是在应用上达到它的预期,这是比较难的一点。”

鄢贵海认为,要想把DPU做好,必须啃硬骨头,一开始就应该走更难的路,后面再做减法才会游刃有余。如果不去解决最核心的问题,一定会限制技术在大场景中的普及,难以给产品建立核心竞争力。综合来看,兼具网络IO、系统IO、存储IO的功能,才能被称之为一颗完整的DPU芯片。

在核心技术方面,除了自研以“软件定义加速器”为核心技术路线的的敏捷异构KPU芯片架构外,中科驭数还提出了软件开发平台HADOS,研发了网络卸载引擎NOE和数据计算卸载引擎DOE。

HADOS是中科驭数自研的DPU软件开发平台,是支撑DPU硬件平台的专用软件框架,生态兼容性高,可兼容多种操作系统,大幅降低应用软件开发难度。

除此之外,中科驭数还在去年牵头发布了行业首部DPU技术白皮书,并于今年发布DPU评测技术白皮书,以推动了DPU领域的标准化。

三、基础设施层芯片,还得靠独立第三方厂商

鄢贵海判断数据中心对DPU的需求将是分级的。中科驭数对未来的布局,一是继续深化在低延时方面的应用,希望做到与国外站到同一个水平线;二是支撑好云原生的数据中心,一个方向侧重于网络,另一个方向侧重于高通量计算。

谈及部分云计算大厂自研DPU的趋势,他认为云厂商能否做好DPU还不好下定论,他相信DPU终会成为一颗相对标准的芯片,变成整个计算基础设施的一部分。

“如果把DPU理解成一个应用型的芯片,那可能是应用厂商能做得好。如果DPU的定位是在基础设施层的芯片,可能还是得由第三方来做。”鄢贵海说,在芯片行业里,很少看到应用侧的厂商自己把芯片做得很好的,是因为芯片有自己的逻辑,云大厂做DPU首要服务的目标是服务自家客户,对其他云计算基础设施不具有普适性。

在他看来,DPU是一个复杂的事情,虽然中科驭数已深耕多年,仍需攻克大量技术难题,这不是铺500个工程师就能立即搞定的事情。做出一颗DPU没那么难,但是要保证DPU的技术迭代跟上整个基础设施的演进步伐,是术业有专攻的。

鄢贵海认为,独立第三方DPU厂商看到的是整个计算基础设施技术的演进,这才是让DPU最后真正变成核心主流芯片的正确态度。短时间跟某家厂商绑得紧。这种思路不见得对DPU的长期发展具有生命力。

结语:构建DPU生态是重头戏

芯片是硬件的心脏,操作系统系统是软件的灵魂。随着5G、人工智能、云计算、元宇宙的快速发展,传统的数据中心已无法满足海量数据的处理需求。基于DPU+CPU+GPU的异构计算,正在成为下一代智算中心的主流。在国家“东数西算”战略大背景下,作为新型处理器,DPU在新一代数据中心算力网络的构建中被寄予厚望。

鄢贵海说,中科驭数今年的重心与DPU生态相关,DPU要想形成规模化应用,必须与云厂商、操作系统厂商以及服务器厂商等生态伙伴建立良性合作,相互兼容开放,在此基础上有成型的DPU系统,供第三方生态厂商在上面做开发、测试,K2 DPU即希望成为这样的硬件平台,为国内DPU生态提供直接助力。