芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西11月22日报道,在本周于美国亚特兰大举行的年度超级计算大会SC24上,英伟达(NVIDIA)凭借多项重要发布和进展,再度成为行业焦点。

NVIDIA创始人兼CEO黄仁勋、NVIDIA加速计算副总裁Ian Buck共同发布了一系列AI和超级计算工具,涵盖了新一代药物发现、实时气候预测和量子模拟,以助力改变生物制药、气候科学等行业。

他们重点介绍了几个影响现实世界的例子,包括诺贝尔奖获得者在神经网络和蛋白质预测方面取得突破性进展,这些突破就是在NVIDIA技术支持下实现的。

今年TOP500榜单上的384个系统都采用了NVIDIA技术。在53个新上榜的系统中,有87%(46个系统)是加速系统。这些加速系统中有85%使用了NVIDIA Hopper GPU,推动了气候预测、药物研发、量子模拟技术等研究。

在Green500榜单前十中,有8个系统采用了英伟达的技术。

黄仁勋谈道:“超级计算机是人类最重要的工具之一,推动着科学突破,拓展着知识的边界。在创造了第一款GPU的25年之后,我们重塑了计算,并引发了一场新的工业革命。”

据他回忆,NVIDIA的加速计算之旅始于2006年发布的CUDA和首款用于科学计算的GPU。

2008年东京工业大学的Tsubame超级计算机、2012年橡树岭国家实验室的Titan超级计算机以及2016年交付给OpenAI的AI超级计算机NVIDIA DGX-1等等,这些里程碑的成就突显了NVIDIA在该领域发挥的变革性作用。

一、发布cuPyNumeric:无需修改Python代码,支持在数千块GPU上运行

在SC24上,NVIDIA发布了cuPyNumeric库(NumPy的GPU加速版本),旨在增强数据科学、机器学习和数值计算领域的应用。

有了这个全新加速计算库,科研人员能将数据处理Python代码毫不费力地运行在基于CPU的笔记本电脑、GPU加速工作站、云服务器或大型超级计算机上。

cuPyNumeric支持在1块或数千块GPU上运行代码,而且无需修改任何代码。

最新版cuPyNumeric已在Conda和GitHub上发布,支持NVIDIA GH200 Grace Hopper超级芯片、运行时自动进行资源配置以及改进的内存扩展;还支持科学界非常流行的HDF5,这种文件格式有助于高效地管理大型的复杂数据。

NVIDIA现有400多个CUDA-X库,在增强各个行业的计算能力方面持续处于领先地位。

二、CUDA-Q:与谷歌量子AI合作,加快量子计算器件设计

黄仁勋将CUDA-X库称作“加速计算的引擎”,它赋能了从AI驱动的医疗突破到量子电路模拟的一切。

NVIDIA关注实时的交互技术,涵盖了从工程到量子模拟的各个领域。

在与谷歌的合作中,NVIDIA的CUDA-Q现已为量子处理器详细的动态模拟提供支持,将原本长达数周的运算时间缩短到了几分钟

Ian Buck解释道,借助CUDA-Q,所有量子处理器的开发人员都能够进行更大规模的模拟,探索更具可扩展性的量子比特设计。

NVIDIA宣布与谷歌量子AI合作,使用NVIDIA CUDA-Q平台进行模拟,加快下一代量子计算器件的设计工作。

谷歌量子AI的研究科学家Guifre Vidal谈道:“要想开发出商用的量子计算机,就必须能够在控制噪声的情况下扩展量子硬件规模。借助NVIDIA加速计算,我们正在探索越来越大的量子芯片设计中噪声的影响。”

量子计算硬件只能运行一定数量的量子运算,然后由于存在研究人员称之为“噪声”的现象就必须终止计算。理解量子硬件设计中的噪声需要进行复杂的动态模拟,以便充分了解量子处理器内的量子比特是如何与周围环境相互作用的。

对此,谷歌量子AI正在使用量子-经典混合计算平台和NVIDIA Eos超级计算机,来模拟其量子处理器的物理特,从而有助于克服量子计算硬件当前的一些局限。

以前模拟计算成本很高。借助CUDA-Q平台,谷歌可以在NVIDIA Eos超级计算机上使用1024个NVIDIA Hopper Tensor Core GPU,以极低成本进行对包含40个量子比特的器件进行逼真的全面模拟,这是同类模拟中规模最大的。

原本需要一周时间完成的噪声模拟,通过CUDA-Q提供的模拟技术,现在只需要几分钟就能完成。

驱动这些加速动态模拟的软件将公开发布在CUDA-Q平台上,使量子硬件工程师能够快速地扩展他们的系统设计。

三、Omniverse Blueprint:创建实时数字孪生体,将模拟速度提高1200倍

会上,NVIDIA发布了用于实时计算机辅助工程数字孪生的NVIDIA Omniverse Blueprint。借助这个参考工作流,行业软件开发商可以帮助航空航天、汽车、能源和制造业等行业的开发人员创建交互式数字孪生体。

黄仁勋将Omniverse Blueprint称作是打通NVIDIA Omniverse与AI技术的参考管线。

该蓝图是利用NVIDIA加速库、物理-AI框架以及基于物理的交互式渲染而构建的,它将模拟速度提高了1200倍,为实时交互树立了新标杆。

它首先被用于计算流体动力学(CFD)仿真等用途。CFD仿真是在虚拟环境中探索、测试和完善汽车、飞机、船舶等诸多产品设计的关键步骤。从物理仿真到可视化和设计优化,传统工程流可能需要数周乃至数月的时间才能完成。

开发者可将该蓝图作为单个元素或整体集成到现有工具中。

包括西门子、Altair、Ansys、Cadence在内的早期采用者已经在使用该蓝图来优化工作流、降低成本并更快地将产品推向市场。

NVIDIA和Luminary Cloud在SC24大会上展示了业界领先的虚拟风洞。它支持用户以实时、交互式的速度对流体动力学进行仿真和可视化,甚至可以同时更改风洞内的车辆模型。

四、“AI+化学”微服务:提高材料筛选效率,锂电池开发商半天绘制10万个分子

在SC24上,NVIDIA ALCHEMI NIM微服务正式发布,将生成式AI引入化学领域,改变了材料发现的规则。这项微服务不久将通过NVIDIA NGC 目录供研究人员免费试用。

Ian Buck解释道,科学家们首先定义他们想要的特性,比如强度、导电性、低毒性甚至颜色。

生成式AI模型会推荐数千个具有所需特性的潜在候选化合物。然后,ALCHEMI NIM通过使用NVIDIA Warp来求解候选化合物的最低能量状态,根据稳定性对这些候选化合物进行排序。

通过优化针对化学模拟的AI推理,这项微服务可以帮助科研人员在虚拟AI实验室的模拟环境中测试化合物和材料的稳定性,从而降低成本和能耗,有望催生更高效且可持续发展的材料,从而支持可再生能源转型。

例如,在NVIDIA H100 Tensor Core GPU上运行材料化学预训练基础模型MACE-MP-0时,如果是模拟一种潜在混合物的长期稳定性,那么这项全新的NIM微服务可以将评估速度加快100倍

SES AI是领先的锂电池开发商,这家公司正在使用NVIDIA ALCHEMI NIM微服务和AIMNet2模型,希望更快地找到制造电动汽车所需的电解质材料。

借助ALCHEMI,SES AI近期在半天时间内绘制了10万个分子,而且有望把绘制时间缩短到1小时之内。SES AI的目标是在未来几年内绘制多达100亿个分子的特性,打破AI驱动的高通量发现的边界。

通过支持科学家在更短时间内研究更多的结构,NIM微服务可以促进用于太阳能和蓄电池等材料的研究,从而推动可再生能源的转型。

NVIDIA还计划发布用于模拟新材料可制造性的NIM微服务,以确定如何让新材料走出实验室并用于制造实际产品,比如电池、太阳能电池板、肥料、杀虫剂等,让地球更健康、更环保。

五、BioNeMo开源框架:加速AI医药研发,扩大数字生物学研究规模

NVIDIA宣布全球制药和科技生物行业的领导者、学术先锋和 AI 研究人员正在使用开源的NVIDIA BioNeMo框架,来推进药物研发并加速分子设计。

开源BioNeMo框架提供了一系列加速计算工具,旨在为生物分子研究提供指数级扩展的AI模型。

与其它AI软件相比,BioNeMo将训练速度提高了2倍,帮助人们更快地开发出挽救生命的治疗方法。

A Alpha Bio、美国阿贡国家实验室等领先的生物技术公司、科技生物研究人员以及AI平台公司与组织已经或即将为这一开源框架做出贡献。以推动计算科学发展著称的领先重点科研机构也使用BioNeMo框架推动创新。

端到端NVIDIA BioNeMo平台专为加快AI药物研发和分子设计模型的创建、定制与部署而设计,通过与加速计算基础设施无缝集成,该能够降低成本、扩大规模,并加快药物研发流程的速度。

除BioNeMo框架外,该平台还支持AI推理微服务NVIDIA NIM和针对湿实验室和计算工作流的优化参考设计NVIDIA BioNeMo Blueprints。

NVIDIA发布了适用于BioNeMo的一系列经过优化且易于使用的全新NIM微服务。这些微服务支持AlphaFold2、DiffDock 2.0等业界领先的模型,可快速、轻松地部署在本地或任何数据中心或云中,使开发人员能够在各种不同的环境中灵活运行应用,并缩短了生物药物研发研究中从推理到获得洞察的时间。

NVIDIA发布了一种预测药物如何与靶蛋白相互作用的突破性工具DiffDock 2.0

在全新cuEquivariance库的支持下,DiffDock 2.0比以前快了6.2倍,使研究人员能够以前所未有的高速度和高准确度来筛选数百万种分子。

BioNeMo现在加入了包括cuEquivariance在内的全新加速库,能够加速DiffDock化学预测所必需的数学计算。

企业可使用NVIDIA BioNeMo Blueprints来帮助开发人员将其AI部署扩展为企业级生产管线。

用于虚拟筛选的BioNeMo Blueprint提供了一个可定制且易于遵循的AI工作流目录,不但能够使用NIM微服务来更快设计出小分子,同时还能节省时间和成本。

目前已有200多家科技生物公司、大型制药公司和初创企业用户将BioNeMo集成到其计算机辅助药物研发平台和工作流中。

五、Earth-2 NIM微服务:将气候建模提速500倍

Ian Buck还发布了两项全新的微服务CorrDiff NIMFourCastNet NIM。它们可将NVIDIA Earth-2平台上的气候变化建模和模拟结果提速多达 500倍

Earth-2是一个用于模拟和可视化呈现天气和气候条件的数字孪生云平台,旨在为气象技术公司带来领先的生成式AI驱动的功能,以辅助预测极端天气事件。

这些微服务有助于加速部署基础模型,同时确保数据安全,能帮助气象技术公司更快生成更高分辨率、实现更准确的预测,而且比传统系统的能效更高。

NVIDIA CorrDiff是一种可实现公里尺度超高分辨率的生成式AI模型,基于 WRF模型的数值模拟结果进行训练,可以生成12倍更高分辨率的天气预报结果。

与使用CPU的传统高分辨率数值天气预报相比,CorrDiff NIM微服务的计算速度高出了500倍,能效提升了10000倍。此外,CorrDiff现在以300倍的更大规模运行,可对整个美国进行超分辨率处理(即提高低分辨率图像或视频的分辨率),并能以公里尺度的可见度预测降雪、结冰和冰雹等降水事件。

FourCastNet NIM微服务使大规模集合预报成为可能,提供了全球范围的中期粗分辨率预报。通过使用欧洲中期天气预报中心或美国国家海洋和大气管理局等业务气象中心的初始场,提供商可生成未来两周的预报,速度比传统数值天气模型快5000倍

借助这些工具,气候技术提供商能够以不同尺度评估极端天气相关风险,从而预测当前计算工作流对低概率事件发生可能性的遗漏。

结语:AI将改变每个100万亿美元市场

此次在SC24期间的一系列发布和进展分享,展示了NVIDIA如何利用AI来推动气候预测、药物发现、量子模拟等科学突破,从而能够更快地应对全球挑战。

“自CUDA诞生以来,NVIDIA将计算成本降低至之前的百万分之一。”黄仁勋在演讲中谈道,“对一些人来说,NVIDIA 就像一台计算显微镜,让他们能够观察到极其微小的东西;对另一些人来说则像一台望远镜,让他们能够探索难以想象的遥远星系;对许多人来说,它是一台时间机器,让他们能够在有生之年从事毕生的事业。”

黄仁勋相信,AI将加速科学发现,变革各行各业,并彻底改变全球每一个100万亿美元规模的市场。