中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

芯东西(公众号:aichip001)
作者 |  
高歌
编辑 |  
Panken

芯东西11月12日报道,今天,第三届中国超级算力大会召开,来自联想华为、中国科学院、曙光、燧原、国家信息中心、国际高性能计算和人工智能咨询委员会、英特尔等企业、机构的专家分享了有关算力经济新时代中行业的发展趋势和痛点,探索了算法、数据、算力对于新基建的重要意义。

今天中国智能计算产业联盟也同样发布了2021年中国高性能计算机性能TOP100排行榜,其中蝉联多年的神威太湖之光被赶下第一名宝座,联想则成为了本次排行榜中出现次数最多的厂商。另外南京大学也获得了RDMA竞赛一等奖的荣誉。

一、中国高性能计算机TOP100:神威太湖之光第二,联想霸榜

北京应用物理与计算数学研究所研究员、中国智能计算产业联盟理事长和中国科学院计算技术研究所研究院、中国智能计算产业联盟执行理事长张云泉公布了今年的高性能计算机的TOP100情况。

在今年的TOP100,前十名中有八个是新的高性能计算机,榜单中也增加了一个新的算力服务应用领域。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

具体来说,联想在合并后提交了12台新机,是提交新机数量最高的公司。同时,联想也是本次TOP100中上榜数量和系统数量最多的公司。曙光的机器数量和系统数量都有所降低,北京超云则成为了异军突起的新兴势力。

和去年相比,第一名高性能计算机的算力提升了1.34倍,蝉联第一名多年的神威太湖之光被网络公司CPU+GPU架构的计算机超越。但是遗憾的是,因为保密需要,这台计算机的供应商、型号并未披露。

100台上榜机器的平均性能提升了79%。而往年没有超过10 PFLOPS的计算机,今年有7台计算机都超过了这一算力参数。

互联体系下,千兆以太网正在逐渐退出市场,万兆以太网成为主要互联系统,InfiniBand也占据了25%的份额。

在100台上榜计算机的应用领域上,今年特别突出的是算力服务领域,其应用领域份额超过46%,也证明中国正在进入算力经济时代。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降 中国HPC计算机TOP100发布,联想霸榜、曙光排名下降 中国HPC计算机TOP100发布,联想霸榜、曙光排名下降 中国HPC计算机TOP100发布,联想霸榜、曙光排名下降 中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

二、华为刘飞:北冥多样性计算融合架构解决行业痛点

华为多样性计算首席专家刘飞分享了华为在多样性计算融合架构方面的进展。

刘飞称,算力正在发生日新月异的变化,其规模不断增长,算力快速发展的背后则是多样应用,尤其是科学计算新范式。近些年来,华为在全国各地建设不同的算力中心,也在推动其算力网络的形成。

但是,算力的发展也带来了很多挑战,一方面算力规模快速增长,另一方面异构算力正在成为行业发展的瓶颈,算力安全、CPU/GPU等不同处理器算力协同等问题开始浮现。

因此华为今年推出了北冥多样性计算融合架构,希望能够使科学人才、工程人才快速部署多样性算力。

刘飞也带来了北冥架构的真实案例。以飞机的气动噪声模型为例,在采用北冥架构后,简化了这一模型模型开发,开发速度提升了3倍左右,实现了异构算力加速仿真。而在手机制造、无线领域,华为的MindSpore for Science昇思科学计算也能在保持精度的前提下,10倍地提升电磁仿真性能。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

三、联想范建平:起底联想AI布局

联想集团副总裁范建平也分享了联想在AI领域的布局和AI在生产制造中的应用。

范建平称,联想在AI领域实行3S战略,即Smart Infrastructure、Smart IoTs、Smart Vertical Solutions和Supply Chain Intelligence(智能基础设施、智能物联网、智能垂直解决方案和供应链智能)。

联想布局了AI开放创新平台和自然语言处理、机器学习及智慧数据、语音识别、计算机视觉等5大系列的AI核心技术。

联想的AI技术可以用于其PC、制造供应链、智慧城市等多个场景。在PC上,其AI技术可以提供疲劳检测、视距与坐姿检测、偷窥检测等服务;在供应链方面,AI技术贯穿于联想整个供应、计划、生产、服务等各个环节;在智慧城市方面,联想的AI技术实现了复杂环境下的人脸识别和行人再识别,已应用于昆明四号线地铁。

范建平称认为,现代机器学习面临难以判断不同任务学习复杂度和重要性,提升处理效率。机器学习需要通过AI协作,达到“精确扶贫”,这也将会是比较重要的一个研究方向。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

四、中科学院院士鄂维南:算法是新时代技术发展关键

中国科学院院士鄂维南重点强调了算法在新时代的重要性。

他说,当前5G、AI、大数据、区块链等新一代信息技术的核心就是算法,算法已成为推动技术和社会发展的主要动力。如何将模型、数据、算力等资源挖掘到极致,算法是其中的关键。

当前AI for Science科学研究的新范式则是他认为真正能够推动技术、应用发展的技术趋势。2020年ACM Gordon Bell奖是科学计算+机器学习+高性能计算(HPC)的第一个范式,通过这样的新范式,行业可以研究化学燃烧反应等科学模型。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

鄂维南也在推动这样技术的发展,参与推动了北京科学智能研究院的构建,打造新一代分子模拟平台。鄂维南称,在基础工具满足后,希望科学研究完成从“小农模式”到“安卓模式”的转变。

在人工智能领域,行业期待一种高精度、可解释、不需要大量标注数据、稳健的新方法,以解决多对多的复杂问题。这也需要底层算法的创新。

对新一代工业制造来说,算法也是其中的关键组成部分。以半导体用的硅片为例,其纯度要求为11个9(99.9999999%)。而为了得到这样高纯度的硅片,需要使用CVD等方法来进行晶体生长,而瓶颈就是物理模型和控制算法。此外,算法的重要性也体现在高精度工业机床等多个行业。

五、曙光任京暘:算力规模增长推动行业发展

曙光信息产业股份有限公司高级副总裁任京暘则提到了算力对于算力基础设施建设的重要性。

他表示,在数字经济时代,数据是新的生产资料,算力是新的生产力,算法是新的生产关系,三者缺一不可,但算力是其中的基础。

随着一批新课题、新机遇的出现,算力基础设施呈现算力网络化、算力多元化、计算智能化、中心规模化、发展绿色化等特征。

同时,各类应用层出不穷也带动了行业和市场的快速发展。以芯片为例,此前CPU和GPU是主要的两类处理器。现在,NPU、DPU等新兴处理器不断推出,正是因为各类应用的发展演进,有着其切实的意义。

因为市场需求、技术发展和政策等多种因素,高算力中心正在不断建设。而在双碳目标下,绿色化也是数据中心的必经之路。如果想要推动算力成为水电一样的社会级服务,网络化既是行业和政策的目标,也是行业最难的挑战之一。

算力基础设施建设也面临应用、技术、运营、产业等不同方面的挑战。从企业个体来看,开放合作、协同发展,构建产业生态是一个重要的方式。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

六、国家信息中心单志广:智算中心要紧密结合产业

国家信息中心信息产业化和产业发展部主任单志广则讨论了有关智能计算中心这一新名词背后的意义。

数字新基建是相对于老基建概念下的以5G、物联网、人工智能、数据中心等为代表的新一代信息技术演化生成的基础设施。相比于老基建以现金流、人员流为核心,新基建的核心是数据流。

从整个业界来说,数字经济发展的规模化仍未出现。事实上,数据对于社会的整个价值还没有发挥出来。对于智能计算中心,其更加强调面向人工智能等主要场景的支持能力,要从当前数据集中、数据大脑的方式和分布式中心折中的一种方式。

在单志广看来,智能计算中心是基于最新人工智能领域,采用领先的人工智能计算架构、提供人工智能应用所需算力服务、数据服务、和算法服务的公共算力新型基础设施。

单志广强调,智算中心要和产业紧密结合,为中小微企业免费或低成本提供开源的人工智能算法及其代码,提供智慧计算服务,将算法能力、数据资源和运营服务等结合到IT基础薄弱的企业。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

七、燧原科技李瑛:云端AI芯片面临算力和通用性挑战

上海燧原科技研发副总监李瑛分享了云端AI芯片目前面临的挑战和需要解决的问题。

李瑛认为,对于当前的中国算力产业,并不缺乏数据和算法,但是在算力、通用等方面存在较大挑战。

在通用领域,行业面临着计算机视觉、语音识别、自然语言处理、推荐算法等多种应用和模型,企业需要思考哪一种通用架构能够减少这样的挑战。当前行业中也存在很多的AI芯片,其算力指标都有不错的表现,但其算力在实际应用中往往并不能发挥出来。

因此,燧原科技也在着重提升自己的AI芯片峰值算力和实际算力,其邃思DTU 2.0芯片采用了新的算力架构,在计算核心、存储、带宽和互联等方面都有所优化和增强。燧原科技也对这款芯片在基于12nm节点上进行了设计调优,算力比提升了2倍,功耗则节省了30%,能耗比有最高3.2倍的提升。

此外,燧原科技也拥有Topsrider2.0软件栈,可以使其硬件的算力达到最优。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

八、国际高性能计算和人工智能咨询委员会宋庆春:用计算方法解决数据中心上云的阻塞问题

宋庆春则作为国际高性能计算和人工智能咨询委员会亚太区主席从技术层面发表了有关多租户HPC和AI应用的前沿技术进展。

宋庆春谈道,当前行业面临着绿色、双碳、减排等大的趋势,因此需要将算力资源用到极致,而高性能计算中心是算力最集中的地点。

为了让高性能计算中心发挥出最大的效率,数据中心上云是一个重要的发展趋势。但是通信导致的资源消耗正在成为行业增长的瓶颈,多对一、多对多等不同应用场景面临着不同的挑战。

宋庆春称,传统的也有动态路由等网络技术解决这一瓶颈。但是也可以用计算的思维、技术来解决网络的问题。对于同一工作下的异步通信来说,第三方处理器DPU是一个较为合适的解决方法。

当前第三方处理器可以将异步工作放置在DPU上进行,对多租户进行管理、隔离,满足高性能计算中心上云的需求。当前已经有美国俄亥俄州的研究人员实现了CPU和GPU完全重叠,没有网络阻塞。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

九、英特尔联合中科院计算所打造中国oneAPI生态

英特尔软件和先进技术事业部副总裁兼中国区总经理谢晓清分享了有关oneAPI对高性能异构计算的重要性。

她谈道,高性能计算作为当前时代的重要技术,在各个领域提供都扮演了重要的角色。随着万物智能化,数据呈指数化增长,微高性能计算系统为高性能计算性能的要求比以往任何时候都要多。

英特尔也在HPC领域构建了覆盖XPU架构、软件工具、内存、存储、互连和安全等多方面的产品组合。尽管硬件加速技术带来了设备功率和性能的优势,但是每一个架构不同的工具链、业界对新技术的观望、跨平台移植的高昂成本等都阻碍了行业发展。

开发者需要高校、高性能以及跨平台的加速器编程模型。oneAPI则具备开放、基于业界标准的同一软件栈,可以很大程度上解决这一行业痛点。

为了在中国推广oneAPI,英特尔今天宣布和中科院计算所达成合作,成立了中国oneAPI研究中心。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

中科院计算所研究院谭光明也分享了中科院对于这次合作的看法。他谈道,未来的计算机系统将使多样化算力异构的时代,需要紧密围绕oneAPI软件栈开展通用优化技术研究。

本次英特尔和中科院计算所也将从推动开源生态建设、推动人才与学科建设、推动民生产业发展3个方面展开合作,加速中国oneAPI生态的构建。

中国HPC计算机TOP100发布,联想霸榜、曙光排名下降

结语:算力服务应用火热趋势值得行业重视

由于5G、AI、物联网等新型应用的推动,数字经济时代正在成为各行业发展的主要趋势。本次大会,一众行业专家分享了当前算力产业的一些问题和行业痛点。

而高性能计算机TOP100榜单让我们看到了算力服务这一重要的新兴应用领域。通过这样的应用,如何能够让中小微企业用上大数据、AI等新技术或许将成为行业发展的关键,也值得行业加以关注。