瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西9月3日报道,今日,上海云端AI芯片公司瀚博半导体在其举办的人工智能大芯片产业落地论坛上,预览其首款7nm云端GPU芯片SG100,将图形渲染加入其产品布局。

同时,瀚博推出了瀚博统一计算架构、全新数据中心推理卡载天VA10、边缘AI推理加速卡载天VE1和瀚博软件平台VastStream扩展版

瀚博半导体2018年12月成立于上海,专注于研发高性能通用加速芯片。其融资情况也很抢眼。快手阿里巴巴两大互联网战略投资方均在其投资阵容。迄今瀚博已完成逾24亿元融资。

会后,瀚博半导体创始人兼CEO钱军接受芯东西等媒体的采访。钱军透露,今日新发布的两款加速卡已经进入客户层面测用。

钱军表示,未来瀚博将基于GPU和AI芯片带来更多产品组合,更好地满足市场、客户的需求。

一、预览7nm云端GPU,兼具图显与AI功能

瀚博半导体的首款7nm云端GPU芯片SG100具备业界领先的图形渲染性能,拥有超高吞吐、超高质量、低延时编码等能力,集渲染、AI、视频于一体,可为云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景提供深度优化。

同时,SG100还提供SR-IOV虚拟化支持,端到端整体提升用户视觉体验,能够满足市场对智能视频视觉、图形图像处理的算力需求。

瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体

瀚博半导体创始人兼CEO钱军是美国GPU巨头AMD中国前高管,曾带领AMD中国团队设计量产了业界第一颗7nm图形处理器和第一颗7nm云端GPU架构的AI芯片。据悉,瀚博核心研发团队拥有18年以上高端芯片设计和量产的经验,手上流片出去的GPU有几十款。

钱军谈道,瀚博的初衷是“为像素世界提供浩瀚算力”。考虑到GPU研发技术门槛高,瀚博成立之初考虑到硬件、软件研发及工程能力等能力都有待加强,因此选择先面向“AI+视频”市场做基于领域专用架构(DSA)架构的AI芯片,以发挥研发团队在视频处理方面的经验。

“具有图形渲染能力的GPU研发一直在我们的计划当中。”钱军说,随着SG100到来,瀚博正式进入GPU市场。

由于瀚博云端GPU和专用AI芯片在目标市场上存在重合,当芯东西问这两大产品线如何协同时,钱军谈到瀚博的做法类似于“中台”概念,瀚博自主研发的很多核心技术与半导体IP,既可以内置于GPU,也可以AI芯片工作。

未来,瀚博计划基于GPU、AI和视频核心技术带来更多产品组合。

钱军告诉芯东西,后续瀚博也会考虑研发将GPU和AI能力整合在一起的芯片,这将根据客户需求来综合判断。

二、公布统一计算架构全景图,推出两款AI推理加速卡

论坛现场,瀚博半导体创始人兼CEO钱军宣布推出由瀚博自主研制的统一计算架构(Vastai Unified Compute Architecture)。

瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体

该架构整合了多款高性能计算引擎,拥有高效统一的存储管理、一致性接口和低链接延迟、完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块。

瀚博的统一计算架构,让计算密集型的AI、视频、渲染任务性能得到最大化硬件加速,同时端到端缩小延时,一体化助力云端实时图形渲染、AI增强处理、视频编解码等需求。

面向数据中心场景,瀚博推出数据中心推理卡载天VA10。这款加速卡搭载瀚博自研的超低延时、超高吞吐AI引擎,INT8峰值算力达400TOPS,刷新业界纪录。

瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体

载天VA10功耗为150瓦,整体最高推理性能达到同功耗主流GPU的2倍以上,且延时低至后者的6%。在低延时场景(低于4毫秒的YoloV3检测算法场景)下,其推理性能可以达到同功耗市场主流GPU的3倍以上。

据悉,载天VA10适合多种需要高实时性的云端AI应用部署,如直播视频增强、智慧交通管理、实时语义理解等场景。

面向边缘计算场景,瀚博发布了首款面向边缘大算力场景推理卡载天VE1系列。

瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体

载天VE1兼具低功耗、超低时延与超高吞吐率,吞吐率达到主流GPU的2倍,但时延仅为其的1/5。在40~65瓦功耗下,载天VE1的INT8峰值算力达100TOPS

这款加速卡支持60路1080P视频实时解码,支持主流AI框架的模型,提供从模型编译到推理优化的全流程低代码开发框架VastPipe,软硬结合为客户提供端到端的AI推理解决方案。

载天VE1可在众多关键场景发挥作用,比如高速公路事件检测、“人、车、非机动车”视频结构化、大数据研判等超高数据量并发场景;再比如,道路实时动态信息交互、工业的缺陷检测等低延时要求场景。载天VE1非常适用于智慧交通、车路协同、工业质检等边缘大算力场景。

硬件要发挥最佳性能,更需要软件的同步支持。

瀚博的软件平台VastStream应运而生,可加速各类AI应用部署,包括计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等。

VastStream的全新软件组件,提供系统管理等三大管理工具,方便客户部署,同时其基础软件栈功能更加丰富,特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等。

至此,瀚博已形成一条涵盖了芯片、推理加速卡、一体机的硬件产品线和软件整合的系统解决方案。

三、产业落地屡有进展,宣布与上海交通大学人工智能研究院合作

在2022世界人工智能大会上,瀚博半导体展出了包括新品在内的多款芯片相关产品,展示其智能视频视觉、图形图像计算产品和算力解决方案。

此前,瀚博已推出首款云端AI推理芯片SV102及搭载此芯片的载天系列通用加速卡VA1,其芯片解决方案覆盖从云端到边缘的服务器及一体机市场,并在加速相关应用落地方面屡有进展。

2022年以来,瀚博先后与福建大数据集团、国宁瑞能,高新兴、超聚变等行业领先企业,在智慧城市、智慧政务、智慧交通、智慧园区、智慧能源等多元场景,开展深入合作,为企业智能化、数据化提供国产AI算力解决方案。

今年7月,瀚博半导体与高新兴签订战略合作协议,双方将围绕车联网、车路协同等智慧交通领域,就芯片解决方案和生态建设展开深度合作,助力智慧交通数字化及智能化转型升级。

瀚博的高性能通用智能加速芯片具备大算力、低时延等优势,可满足车路协同多传感器融合数据处理的大算力及时延要求。同时瀚博研发过程利用先进生产工艺以及创新的节能计算体系结构,可以实现更好的能耗比,从而有助于企业客户降低算力成本,降低计算能耗。

近期,瀚博还与国产主流服务器厂商超聚变合作共同解决企业AI应用过程中面临的典型问题,致力于降低AI计算门槛。

此外,为了促进技术生态的发展,瀚博也在联合全球顶级的技术、人才、机构和高校建立合作。

在今日的论坛上,瀚博与上海交通大学人工智能研究院签约,开展校企合作。瀚博希望通过产学研用联盟的方式,让更多优秀的人才、资源参与进来,推动技术进步、人才培养、科研成果转化,建立智能芯片生态。

四、看好元宇宙,国内芯片公司弯道超车的机会

作为数字经济未来发展的重要领域,元宇宙迈入虚拟和现实融合的3D互联网时代,算力需求也更加蓬勃。9月1日,瀚博创始人兼CEO钱军出席2022世界人工智能大会芯片主题论坛,在圆桌会议环节分享了对于芯片元宇宙中应用的见解。

瀚博亮出7nm国产云端GPU:集渲染、AI、视频于一体▲瀚博半导体创始人兼CEO钱军

钱军认为,元宇宙是国内芯片公司弯道超车的机会,“就像油车和电车比起来已经落伍了一样,当我们有一个颠覆性的方向,这个过程中会获得各种超越的机会。”

在他看来,元宇宙本身并不是一个颠覆性的技术,而是由多个数字技术组合起来的综合性的应用,在这中间会产生AR/VR等各种各样的交互和感知,并产生海量内容,这些内容需要实时、强大的视频处理算力,需要多样的渲染引擎,还需要综合5G网络、大数据、AI、区块链等数字技术来做支撑和管理。

因此,元宇宙可以被视作是一个现象级的应用,同时要综合考虑多类型、高复杂度的计算,所以对未来算力提升的需求空间巨大。

以元宇宙的数字孪生做渲染为例,尤其是沉浸式的渲染,对于GPU的性能的提升需求是巨大的。

“GPU一定要上云,只有上了云,才能够把多颗GPU综合连接起来,然后用一种集成的方式来做有效的渲染,才能支持元宇宙海量内容的产生。”钱军说。

他相信,现在场景和需求更多样化,渲染算法不断迭代,找到这些机会,GPU就有望弯道超车。不过,核心技术不是一蹴而就的,而是需要长期努力,扎扎实实地把芯片和技术做出来。

五、芯片如何为AI算力网提供支撑?

在9月2日举办的2022世界人工智能大会中国移动主题论坛上,钱军也探讨了对于“AI新基建”的理解。他认为,算力网属于现象级基础设施,运用到多种数字化技术,需要多样化的算力支撑。

芯片部署应重点关注能耗与算力密度。其中算力密度从两个维度考虑,即每平方毫米芯片提供的算力和每瓦功耗提供的算力。算力网络还应考虑算力的有效性,能否有效驱动应用。

从整体上看,打造算力网和做芯片的思路类似,需要系统地规划算力单元、存储单元、数据交互等资源,使每个模块的能力得到有效发挥。

至于生态构建,钱军希望未来出现一些领袖型企业,引导整个行业建立一个开放标准化的生态,将更加有利于行业内的有效竞争和创新,从而更好地支撑AI等行业的发展。

结语:云端GPU赛道趋火,AI芯片迈入落地阶段

工信部数据显示,我国已成为全球第二的“算力大国”:2021年算力核心产业规模达到1.5万亿元,近5年平均增速超过30%。未来,谁的计算能力更强,谁能率先在落地进程中获得客户认可,谁就有望抢占未来制高点、赢得话语权。

本周突发的美国政府要求英伟达和AMD限制向中国出口用于加速AI计算的高端GPU事件,再度给我们敲响警钟,美国随时可能向我国高精尖技术产业挥起刀锋,与其心存侥幸,不如踏踏实实做事,未雨绸缪,将未来主动权掌握在自己手中。

芯片创业充满风险,过程艰苦,前路难料。但我们看到多家国内AI芯片企业仍在砥砺前行,并陆续在单卡性能、关键应用实测性能及商用落地方面取得一系列新进展。面对接踵而至的机遇与挑战,AI芯片企业仍需保持定力、练好内功,坚持自主创新与理解客户需求,方能走得长远。