数据中心扩展计算公开课下周开讲,详解 NVIDIA 全新AI计算平台及高速网络技术|直播预告

5月26日,腾讯宣布投入5000亿用于新基建,而在数据中心方面,将陆续在全国新建多个百万级服务器规模的大型数据中心;6月6日,快手公司宣布投资100亿元人民币自建数据中心,计划部署30万台服务器,主要用于大数据和AI训练;在6月9日阿里云线上峰会中,阿里云智能总裁张建锋表示,现在阿里云已有100多万台服务器,而三年后这一数据将超过300万台。新基建浪潮正在加速数据中心的建设。

数据中心的构建是一个及其复杂的过程,需要考虑环境温度控制、数据安全、网络传输带宽、资源管理等多种因素。另外,面对不断提升的计算需求,可扩展性也是数据中心建设过程中必须要提前考虑的重要因素。

在GTC 2020发布会上,NVIDIA 展示了新一代 DGX SuperPOD。该集群利用 Mellanox HDR 200Gbps InfiniBand 互连技术,将140台 DGX A100 系统结合在一起,构建了DGX SuperPOD AI超级计算机, AI计算能力高达700 Petaflops,用于公司内部对话式AI、基因组学和自动驾驶等领域的研究。

为帮助客户利用DGX A100系统快速构建自己的数据中心,NVIDIA 发布了全新DGX SuperPOD参考架构,通过该参考架构,企业可以借鉴NVIDIA所采取的设计原则和最佳实践经验,提升数据中心构建效率,大大缩短交付时间。

6月19日,智东西公开课推出数据中心扩展计算公开课 NVIDIA 专场,由 NVIDIA 机器学习解决方案架构师路川、NVIDIA 网络事业部HPC-AI技术市场总监冯高锋共同主讲,主题为《NVIDIA 全新AI计算平台及高速网络技术解析》。

本次专场,路川、冯高锋两位老师将共同为我们揭秘由 140 台 DGX A100 系统和 Mellanox 网络技术搭建的 DGX SuperPOD。同时,这也是NVIDIA收购Mellanox 后首次线上讲解其新一代 InfiniBand 网络技术。

课程时间

时间:6月19日19点
地点:智东西公开课小程序

课程详情

主题:NVIDIA全新AI计算平台及高速网络技术解析
提纲
1、NVIDIA 新一代AI计算平台DGX A100详解
2、高性能可扩展AI超级计算机DGX SuperPOD架构解析
3、案例分析:如何使用DGX SuperPOD加速AI训练
4、InfiniBand高速网络技术发展历程
5、DGX SuperPOD系统中的InfiniBand可扩展组网技术
6、新一代InfiniBand网络技术创新

讲师:

路川,NVIDIA 机器学习解决方案架构师,在 NVIDIA 主要负责帮助企业客户构建基于GPU 计算的深度学习系统方案,在机器学习、高性能计算和云计算领域有着丰富的项目经验。曾作为主要技术人员参与国家大型超算项目的规划和建设,熟悉超算系统建设流程、高性能计算网络、并行存储系统等。

冯高锋,NVIDIA 网络事业部HPC-AI技术市场总监,同时担任国际高性能计算和人工智能咨询委员会HPC和AI亚太区首席架构师,负责高性能计算和人工智能行业的高性能网络方案和市场推广,为InfiniBand在超大规模数据中心应用和优化构建方案。冯高锋长期从事高性能计算行业,在高性能计算系统架构,软件优化,网络拓扑设计和优化,路由算法,数据中心虚拟化等有多年积累。

报名方式

添加智东西公开课小助手芒芒(ID:zhidxclass005)报名,添加时请备注“姓名-公司/学校-职位/专业”,因报名人数过多,优先通过备注者。