对话瀚博半导体CEO钱军:剧透首款云端GPU亮点,支撑元宇宙算力需求

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

热潮涌现的国产GPU阵列,即将迎来新成员。

9月3日,上海云端AI芯片创企瀚博半导体在2022世界人工智能大会上作出预告,即将发布其首款7nm云端GPU SG100。随着这款GPU发布,瀚博将成为国产GPU赛道的最新成员。

就在同一周,两大国际GPU巨头英伟达和AMD被美国政府通知向中国限制出口用于加速AI计算的高端GPU,此消息一出,立即引发人工智能产业和芯片设计产业双双巨震,也将国产GPU及AI芯片的最新进展与实力水平推至话题中心。

因接连获得快手、阿里巴巴两大互联网产业资本的投资,瀚博的关注度一直居高不下。

踏入GPU赛道,瀚博如何构建起自身的差异化优势?又计划如何实现GPU与“AI+视频”这两大产品线的协同?近日,芯东西等媒体与瀚博半导体创始人兼CEO钱军进行了深入交流。

对话瀚博半导体CEO钱军:剧透首款云端GPU亮点,支撑元宇宙算力需求▲瀚博半导体创始人兼CEO钱军

一、进军GPU市场,瀚博优势何在?

在国产GPU赛道,瀚博是“后生”,但其核心研发团队的资历却不浅,有18年以上高端芯片设计和量产的经验。瀚博半导体创始人兼CEO钱军是前AMD高管,曾带队设计量产了业界第一颗7nm图形处理器和第一颗7nm GPGPU架构的AI芯片。

“核心团队很多人跟我很长时间,我们手上流片出去的GPU有几十款。”钱军回忆说,基于“为像素世界提供好的算力”的愿景,从创立初期,瀚博团队就已经在规划实现GPU渲染能力。

但不同于市面上多数专注于AI加速或者专注于图形渲染的GPU,根据瀚博已透露的信息,瀚博首款云端GPU芯片SG100兼具业界领先的图形渲染、AI加速、低延时视频编码性能,使其在承担云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景的算力需求时更加游刃有余。

对话瀚博半导体CEO钱军:剧透首款云端GPU亮点,支撑元宇宙算力需求

据钱军透露,瀚博在其第一颗芯片就已经内置有一块性能较低的GPU核心。从瀚博已落地产品的实测表现来看,快手视频高级专家何刚分享说,快手测了瀚博面向数据中心设计的高性能AI推理加速卡VA1,从算法的效果和算法的加速程度和功耗上,其性能都胜过通用GPU。

随着SG100到来,瀚博的GPU和“AI+视频”两大业务均正式公开。谈及这两条产品线的协同,钱军告诉芯东西,瀚博的做法类似于“中台”概念,其自研的很多核心技术与半导体IP可互用,既可以内置于GPU,也可以AI芯片工作。

“我们还在前期,我们的IP组合还在不断增加。”钱军说,根据客户需求,后续瀚博也会考虑研发将GPU和AI能力整合在一起的芯片。

二、遵循应用导向,做好软硬件协同

如何评判芯片性能?钱军认为,不应局限于看纸面上的TOPS数值,而要看在实际场景中,做同一任务的功耗是否更优。

算力密度是芯片的关键指标之一,即单元面积能提供多少算力、每瓦能提供多少算力。“我们对算力密度自始至终是至高追求。”钱军说,这贯穿了瀚博的整个设计流程。

要极大程度挖掘硬件算力,还需在软件方面下足功夫。这也是当前国内云端AI芯片企业一致重点研发与完善的方向。

钱军谈道,瀚博做芯片遵循应用导向,会涉及各种软件的性能调优、软件库的对接、算子库的扩张等等。为了让计算密集型的AI增强、视频编解码、实时图形渲染任务性能得到最大化硬件加速,瀚博自研了统一计算架构VUCA(Vastai Unified Compute Architecture)。

对话瀚博半导体CEO钱军:剧透首款云端GPU亮点,支撑元宇宙算力需求

VUCA既包含上层软件模块化的整体架构,也包括设计理念、执行下一代产品的整体思路。据钱军分享,瀚博的整体设计理念,即是基于统一计算架构不断优化升级其引擎。

统一计算架构VUCA整合了多款高性能计算引擎,底部有高性能算力引擎、高性能AI引擎、可编程矢量计算引擎,有硬件化的视频解码、图形渲染的显示核心。

这些引擎拥有高效统一的存储管理,一致性接口跟低链接延迟。另外,算力资源需要被池化,在云端集中发挥出更高的算力效能。因此瀚博会有完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块,从而支持匹配不同客户应用的需求。

基于底层自主研发的硬件、引擎以及存储管理连接,瀚博会配上统一的软件组件VastStream。

VastStream具有统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等特性,提供系统管理等三大管理工具,再加上更加丰富的基础软件栈功能,可以加速客户侧各类AI应用的部署。

从一系列硬件产品到软件整合,瀚博的版图正日趋完善。

结语:AI芯片企业打开生态,一定要有突破口

对于云端AI芯片公司而言,加速生态建设是长远发展的必行之径,不仅要通过软硬件协同发挥出性能优势,还需降低用户迁移成本,并展现出显著的总拥有成本(TCO)优势。

聊到生态话题,钱军认为,打开生态一定要有突破口,瀚博便是先以第一款产品为敲门砖,找到好的客户交流,一起去开拓一些场景应用,接着通过循序渐进地打磨软件,持续迭代优化。

此外据他透露,瀚博非常关注行业协议,以确保自家产品出来后具备易迁移性,能够适配其他一些东西。他希望相应的规则是公平的、开放的,能促使更多的人来参与竞争。