智东西(公众号:zhidxcom)
文 | 季瑜生

智东西9月19日上海消息,今日早晨,华为在上海世博中心举行的2019全联接大会已经行进到第二天,智东西为您带来现场一手干货报道。

会上华为Cloud&AI产品与服务总裁侯金龙以及华为智能计算业务部总裁马海旭等高管以及合作伙伴企业分别作了精彩演讲。

会上,华为还宣布开源了服务器操作系统、GaussDB OLTP单机版数据库,开放鲲鹏主板,并发布了两款基于昇腾910打造的新品。

另外,侯金龙还透露了华为在嵌入式芯片的布局,从2004年开始,华为投资研发了第一颗嵌入式处理芯片,迄今历经15年,目前已经投入超过2万名工程师。而未来,华为还将投入15亿美金发展产业生态。

一、一张泰山云海日出图背后的华为一云两翼计算野心

开场伊始,大屏幕上是一张图片,正中心是五岳之首的泰山,冉冉升起的太阳,然后还有展翅的鲲鹏,升腾的云海。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

不仔细看,会以为这就是一张普通的云海日出图,但是如果有心会发现,这中间藏了许多关于华为计算的“小心机”。

泰山——五岳之首,《孟子.尽心上》中有云“孔子登东山面小鲁,登泰山而小天下”。山川之外,“泰山”背后是俾睨天下的气势。对应到华为的产品是基于鲲鹏处理器的打造的服务器“泰山”。

鲲鹏——《庄子.逍遥游》中的神兽,“水击三千里,抟扶摇而上者九万里”,它是壮志的承载,对应的则是华为2019年1月向业界发布的高性能数据中心处理器“鲲鹏”。

昇腾——云海翻涌的形态,对应华为2018年10月10日正式发布的人工智能芯片“昇腾”,围绕昇腾系列产品,华为构建起了全世界最快的AI计算集群——Atlas 900。

与此同时,这张图背后进一步解读,则是华为在计算领域的产业布局生态,对此华为将其称为“一云两翼、双引擎”。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

在今日的华为全联接大会主会场中,华为宣布基于“鲲鹏+昇腾”双引擎正式全面启航,此外,华为计算战略Cloud & AI产品与服务总裁侯金龙对此进行了详细的阐释。

所谓一云,指的是华为云,通过全栈创新,提供安全可靠的混合云,华为云会成为生态伙伴的黑土地,为世界提供普惠算力。

两翼指智能计算业务以及智能数据与存储业务。在智能计算领域,面向端、边、云,提供“鲲鹏+昇腾+x86+GPU”的多样性算力。在智能数据与存储领域,融合了存储、大数据、数据库、AI,围绕数据的全生命周期,让数据的每比特成本最优、让数据的每比特价值最大。

双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。

通过这样的战略,华为还构建了一个开放的生态,通过硬件开放和软件开源,使能广大合作伙伴,形成一个开放的“鲲鹏”与“昇腾”产业生态。

二、15年,从第一颗嵌入式处理芯片到2万名工程师打造的“鲲鹏+昇腾”基础芯片族

阐释过战略之后,侯金龙又简单回顾了华为处理芯片从十五年前的1发展到如今一个庞大家族的过程。

侯金龙表示“华为从2004年开始投资研发第一颗嵌入式处理芯片,历经15年,目前投入超过2万名工程师,形成了以“鲲鹏+昇腾”为核心的基础芯片族。”

那么这个芯片族都包括了哪些产品?

鲲鹏包括服务器和PC机芯片,鲲鹏920是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”,是业界集成度最高的数据中心处理器。时间上看,鲲鹏处理器从2007年走到现在已历时12年,鲲鹏920现在是第三代芯片。

昇腾包括训练和推理芯片,用于训练的昇腾910,半精度(FP16)算力达256 TFLOPS,是业界的2倍。用于推理的昇腾310,整型(INT8)算力16 TOPS,功耗仅8W。

存储控制器芯片,通过独特的磨损均衡算法,把SSD盘的寿命提高20%。智能网卡芯片,支持OVS、VxLAN、RoCE等多协议卸载,特别适合云化和低时延场景。智能管理芯片,实现智能的功耗和故障管理,是大型数据中心自动化管理的基础。

此外,侯金龙还表示,目前在计算架构中,华为是业界唯一同时拥有“CPU,NPU,存储控制,网络互连,智能管理”5大关键芯片的厂商。未来华为将按照“量产一代、研发一代、规划一代”的节奏投资芯片。

三、硬件:全面解读鲲鹏、昇腾生态,基于达芬奇架构的进一步云边端协同

不难发现,在提到鲲鹏、昇腾之时,华为一同提到次数最多的词语就是“生态”。这也就涉及到了华为对鲲鹏计算产业的定位,侯金龙将其总结为“硬件开放、软件开源、使能合作伙伴”。围绕这一定位,华为提出了以下几个原则:

1、华为聚焦计算架构创新,处理器的研发,以及华为云的服务。

2、华为利用自己的硬件能力,对外提供主板、SSD、网卡、RAID卡、Atlas模组和板卡,优先支持合作伙伴发展服务器和PC等计算产品。TaiShan服务器,聚焦做高端和内部配套,在条件成熟的时候,华为或将停止TaiShan服务器的销售业务

3、华为开源操作系统、数据库和AI计算框架,使能伙伴发展自己品牌的产品,并为开发者提供覆盖端、边、云的全场景开发框架。

4、华为不做应用,但免费支持主流应用和软件的迁移适配

值得一提的是华为对外提供的是主板、SSD、网卡、RAID卡、Atlas模组和板卡,也就是说鲲鹏以及昇腾芯片本身是并不对外销售的

另外也正是在本次大会上,华为宣布了将正式推出鲲鹏主板,并向合作伙伴全面开放。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

据了解,华为鲲鹏主板采用多合一SoC、xPU高速互联、100GE高速I/O等关键技术。它不仅搭载了鲲鹏处理器,还内置了BMC芯片、BIOS软件。华为将开放主板接口规范和设备管理规范,提供整机参考设计指南,全面向伙伴开放华为的技术积累和实践经验。合作伙伴可以基于鲲鹏主板和整机参考设计指南,快速开发出自有品牌的服务器和台式机产品。

解读完鲲鹏之后,侯金龙紧接着解读了华为的昇腾生态。

目前,基于昇腾910和310 AI处理器,华为推出了全球最快的AI训练集群Atlas 900、AI训练服务器 Atlas 800、智能小站Atlas 500、AI推理与训练卡Atlas 300和AI加速模块Atlas 200,完成了Atlas全系列产品布局,覆盖云、边、端全场景,可同时面向训练和推理。其中训练卡Atlas 300与AI训练服务器 Atlas 800为今日新发布的新品。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

另外基于统一的达芬奇架构和全场景AI计算框架,还可以进一步实现云边端协同。

产品性能层面,Atlas 900:可扩展的AI集群架构,由数千颗昇腾910处理器组成,在ResNet-50测试中,以59.8秒的成绩位居全球第一,在同等精度下比第2名快15%。Atlas 900的强大算力,可广泛应用于科学研究、天文探索、石油勘探等领域。

Atlas 800:4U空间集成了8颗昇腾910 AI处理器,可提供2 PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克,重量不到业界同类产品的一半,内置32个硬件解码器,每秒可完成16384张1080P图片解码,是业界主流产品处理能力的25倍,而且可以与训练并行处理。它还支持风冷和液冷散热,可满足企业数据中心和集群高密部署两类场景,单机能效比为业界同类产品的1.8倍。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

Atlas 300:可提供256 TFLOPS的算力,是当前业界主流训练卡的2倍,每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口,可实现梯度参数和数据集并行传输,最高可降低70%的梯度同步时延,支撑集群训练时间缩短到秒级。

四、软件:从开源操作系统、数据库,到发布112款基于鲲鹏和昇腾的云服务

软件层面,华为云的战略是开源,本次大会上华为宣布开源服务器操作系统EulerOS、GaussDB OLTP单机版数据库并发布112款基于鲲鹏和昇腾的云服务。

首先是服务器操作系统EulerOS开源,开源版本的名称为openEuler,华为将支持合作伙伴发行基于openEuler的商业版,支持各行业主流应用和软件迁移到基于openEuler的操作系统上。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

对于该产品,华为从2010年起就对此展开了研发,目前已在通信、存储、云等产品中广泛使用,部署超过10万套。它有2个主要创新点:

第一,三级智能调度技术。从内核、集群和Die三级实行智能调度,将不同的进程分配在最合适的核上,让应用获得最短时延、最大带宽,多进程的并发时延相比业界可缩短60%。

第二,智能自动优化技术。从驱动、内核、虚拟化、Lib库等多层次的应用感知与学习,可自动调优7000多个系统参数,让系统越用越快。例如,在Nginx测试中,Web服务性能提升了137%。

其次是开源GaussDB OLTP单机版数据库,在数据库领域,华为也已进行10多年的研发,产品已广泛用于运营商、金融等核心场景。

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

今年5月,华为正式发布了GaussDB数据库,并在今日正式开源,开源版本的名称为openGauss并将于2020年6月全面上线,可覆盖企业70%以上的数据库业务场景。具体来说,它有2大特点:

第一,全球首款AI-Native数据库,具备AI-Native自调优能力,调优效果比DBA(数据库管理员)提升85%。

第二,全球首款基于鲲鹏的企业级数据库,能充分发挥鲲鹏的超并行计算能力,相比非鲲鹏系统,TPCH基准测试性能提升48%。

最后,华为还宣布了69款基于鲲鹏的云服务和43款基于昇腾的云服务正式上线,与此同时,基于昇腾的图像搜索服务、内容审核服务,价格下调70%!

华为首次全面解读云计算布局,未来将投入15亿美金发展产业生态

五、生态:华为自己已部署十万台设备,还将投入15亿美金培育生态

演讲的最后,侯金龙向我们透露了华为内部鲲鹏与昇腾的使用情况:

1、华为已部署超过10万台鲲鹏与昇腾设备,覆盖从研发、生产、办公、交付到销售的全业务场景。

2、产品与解决方案中的网管系统,其服务器已经全部切换到鲲鹏平台。

3、华为云60%以上的场景,今年会切换到鲲鹏与昇腾平台

4、华为消费者云,现在已经全部切换到鲲鹏平台。

而面向合作伙伴与开发者华为则表示:

1、将联合行业伙伴打造完整的产业生态链和具有竞争力的解决方案。

2、华为的定位是聚焦处理器和部件的开发,而鲲鹏产业是业界共享的,欢迎各区域的伙伴根据自身特点打造本区域的鲲鹏产业。

3、华为将联合绿色计算产业联盟、边缘计算产业联盟等组织,制定开放的软硬件标准体系,促进产业的健康发展。

4、未来5年,华为将联合各社区和高校培养500万开发者,并计划投入15亿美金用于发展产业生态。