对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

在数据中心的芯片战场,火药味日益浓烈。

面向人工智能(AI)数据分析和推理的计算加速,英特尔是无可争议的领导者。与此同时,它正向英伟达独霸的AI训练市场发起冲锋——一方面重回数据中心GPU战场,另一方面推出新一代云端AI芯片Habana Gaudi2。

“通过内置AI的CPU以及所有新的GPU产品和Gaudi这样的AI加速器,我们在训练方面也将取得巨大的飞跃,这对英特尔来说是一个激动人心的时刻。”英特尔公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera说。

Sandra是英特尔现任CEO基辛格的左膀右臂。去年6月,英特尔对其业务部门作出调整,将英特尔数据平台事业部重组为两个全新的业务部门,并任命Sandra担任执行副总裁、数据中心和人工智能(DCAI)部门的总经理。

对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝▲英特尔公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera

在接管DCAI部门后,Sandra Rivera负责领导开发基于云领域的领先数据中心产品,以及推进英特尔整体AI战略。今年5月,英特尔发布两款全新云端AI芯片——第二代AI训练芯片Habana Gaudi2和AI推理芯片Greco。这是英特尔收购以色列AI芯片企业Habana Labs以来,首次正式发布的AI芯片新品。

如今随着数据量、计算力的不断增长,数据中心和AI市场已成为许多芯片企业猛攻的高地。近日,英特尔公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera与芯东西等媒体进行了深入交流,分享英特尔制胜数据中心的战略布局,以及其AI芯片的最新进展。

一、正面迎战英伟达,对AI训练芯片有信心

“我们AI战略的核心是我们的软件优势、软硬结合的优势、对开发人员的重视以及我们所打造的强大的开放生态系统。”Sandra总结说。

面向AI市场,英特尔制定了完善的战略,其整体大战略从传统的IDM升级至IDM 2.0,计划通过重新加大芯片制造的投入来扭转局面——基辛格宣布未来几年内,英特尔将投入数百亿美元建造芯片工厂,同时推出芯片代工服务。

在Sandra看来,IDM 2.0是英特尔独一无二的制胜法宝,使其始终有能力设计最好的产品、并以最好的方式进行制造,从而实现领先的制程、产品、供应和成本。“这不仅是为整个芯片的发展奠定了基础,英特尔IDM 2.0也为未来人工智能的发展打好基础。”

硬件层面,英特尔最新发布的云端AI训练芯片Habana Gaudi2将Tensor处理器内核数量从第一代Gaudi训练处理器中的10个增至24个,封装内存从32GB(HBM2)增至96GB(HBM2E),板载SRAM从24MB增至48MB。

“这是第一个,也是唯一一个集成了如此大量内存的加速器,所以在产品实力上,Gaudi2已处于业界领先水平。”Sandra告诉芯东西。在权威AI基准测试MLPerf近期公布的最新测试结果中,Habana Gaudi2在多项测试任务的训练速度比英伟达A100 GPU更快。

Habana Gaudi1已在不少CSP厂商的实际部署中发挥价值。随着Gaudi2的出货,Sandra相信将有更多厂商采用英特尔AI芯片解决业务挑战。

除了Habana Gaudi2之外,英特尔至强可扩展处理器系列也在帮助其广泛客户更好地通过灵活的解决方案完成大规模AI训练。此外,英特尔在其产品线中增加了图形处理器(GPU)。两年前,英特尔便透露了自己在GPU方面的蓝图,欲与英伟达展开新一轮的较量。

Sandra认为,客户更关注的是如何将技术整合到一起形成合力,以实现更快的AI部署和更高效的业务。这其中的关键不在于寻找单一的解决方案,而是对AI技术进行有机结合,从而帮助企业实现商业目标。英特尔则是那个最能为客户提供完整解决方案的公司,并通过持续在深度学习训练架构和软件创新,提供更具性价比的AI训练解决方案。

她也解释了英特尔CPU产品的大小核与同行产品的差别:“我们推出的产品,无论是能效核还是性能核,都是基于相同平台的,所以我们的客户在同一平台之下就有了能效核和性能核这两种选择。很多客户对这种前景是非常期待和兴奋的,他们可以充分利用基于英特尔架构内嵌的已经写好的软件,并且基于自己的工作负载自由选择性能核或者是能效核。”

“英特尔已经整装待发,得益于良好的客户关系、强大的市场地位,以及独特的差异化优势,我们只需要遵循并实施我们的AI战略,一切未来皆可期。”Sandra谈道。

二、软件是我们所有工作的核心

据英特尔团队观察,AI芯片在当前整个芯片市场中相对份额较小,但增长十分迅猛。

对更快、更高效的AI计算需求的不断增长,不仅催生了数十家芯片初创企业,也引来领先芯片制造商的大举投资。

根据美国市场调查公司Allied Market Research的调查报告,2020年AI芯片市场总价值约为80亿美元,预计其将在2030年增至近2000亿美元。

面对这样的趋势,英特尔重整AI战略,更加强调软件在计算架构体系内的重要作用,并在软件和开源生态社区方面进行了大规模投入。

例如,它将为客户提供软件包,使客户既能够使用通用AI芯片处理工作,也可以将部分任务交给擅长图像识别或其他工作的专业芯片。同时,英特尔更加强调执行力和推出产品的节奏,以提供具有吸引力的产品。

英特尔在AI策略上坚持“软件优先”的理念,面向AI开发者打造开放且易用的软件堆栈。

“软件优先”包括安全的AI软件组件,即让用户能够利用至强处理器的独特软件和安全功能,如通过英特尔软件防护扩展(英特尔SGX)进行机密计算,保护使用中的关键数据和软件。

对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝

英特尔继续投资于oneAPI这样的开放软件堆栈,以及TensorFlow和PyTorch这样的行业框架,以促进开发人员、学术界和更广泛生态系统之间的协作。此外,英特尔不仅花费数年时间为CPU优化最流行的开源框架和函数库,还开发了BigDL 2.0和OpenVino。

“软件是我们所有工作的核心,对于选择x86的开发人员来说,未来是光明的。”Sandra说,“我们始终认为相比封闭、专有的解决方案,开放的生态系统能释放创新能力,因此,我们致力于打造成熟的生态系统吸引更多客户。”

据她透露,英特尔将继续充分利用制程、技术以及架构的优势,在此基础上叠加软件,未来将会有很多通过软件来实现10倍、20倍、30倍的性能扩展和提升。

三、将资源集中于人工智能和数据安全

“我相信未来每一个计算平台当中都有AI的成分,现在可以说英特尔在所有的平台上都有AI,无论是服务器还是客户端产品。”Sandra认为AI是一个多角度、多层次的工作负载,从整个人工智能流程来看,从数据的导入、训练、推理到最后的部署,都存在着大量的市场机会。

按流程来拆分,一开始数据导入阶段往往采取至强CPU,之后的训练环节可以选择具有AI加速功能的CPU、GPU或AI加速器,在最后的推理及部署阶段,2/3的AI推理是在英特尔至强平台上进行的。“英特尔拥有完全的能力,已经做好了充分准备去利用这些机会。”Sandra说。

她透露道,英特尔将资源和注意力集中在快速增长和高价值的领域:一是人工智能,二是数据安全。而英特尔SGX软件防护扩展基于其CPU平台,可以充分保障数据安全和隐私。

对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝

Sandra举了两个具体案例,一个是美团与英特尔合作,优化了基于第三代至强的人工智能推荐系统,通过充分利用AVX512指令的功能,实现AI训练性能提高30倍,从而改善消费者的用户体验;另一个是动力电池领军企业宁德时代利用英特尔AI+SGX辅助生产检测,实时优化数据分析,并借助至强及SGX,将供应链数据分析时间从原来的15小时缩短至1小时,同时充分保障了其客户的隐私。

此外,百度、腾讯云、字节跳动等云服务提供商均利用英特尔SGX进行数据机密计算分析以及用例的数据隔离保护。

在她看来,聚焦x86将成为英特尔区别于业内其他厂商的主要差异化优势。英特尔通过oneAPI和开源社区打造开放的生态系统,使其能够为客户提供更广泛的解决方案,故而使英特尔能在AI领域的竞争中胜出。

“深度学习训练和GPU性能只是AI领域的一小部分。真正让我们赢得客户青睐的是完整而开放的生态系统,以及一个AI真正民主化的世界。”Sandra说,开放的生态系统可释放创新,使计算民主化,并最终战胜封闭的专有解决方案。这意味着为开发人员打开围墙大门,并创造更多选择,以适合客户的方式推进技术。

她谈道,满足客户需求是英特尔的头等大事,但同样重要的是,致力于帮助推动开发社区内外的创新。大力支持开发社区,亦是英特尔AI战略的一个关键举措。

谈及现阶段AI芯片面临的主要瓶颈,Sandra分享了两点,一是很多时候客户需要跨数据中心的拷贝,如何直接应用AI并将其扩展到相应大数据平台上是一大挑战;针对各种AI应用,如何使这些智能计算支撑上层AI应用场景,亦是一道难关。

结语:持续投资高增长领域,巩固数据中心护城河

总体来看,英特尔的AI执行战略旨在满足从硬件到软件、从云到边缘的各种碎片化AI需求。英特尔一面持续投资高增长领域,结合其在制程、封装、规模以及制造方面的优势,以巩固其与客户在数据中心的竞争力;另一方面打造软硬件最优组合,与中国合作伙伴和客户展开合作,使更多的生态系统合作伙伴加入创新并从中受益,由此持续打造英特尔的差异化优势。

在人工智能、数据安全和隐私保护等方面,英特尔也会协助其充分利用计算平台的能力,对用户数据进行保护,以满足客户的多样化需求。

据Sandra观察,就AI的采用情况而言,这个行业仍处于起步阶段,现在就宣布获胜者或者说行业已经发生转型还为时过早,但英特尔在推动当前和未来AI转型方面处于最前沿。

尽管目前用AI取得良好业务成果的公司仍在少数,但她相信,只要注重选择、信任、开放、安全和生产力,就可以使AI民主化,并释放AI的初期(80%)潜力。