芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西11月13日报道,在今日东京举行的英伟达AI峰会上,英伟达创始人兼CEO黄仁勋宣布,日本软银获得全球首套NVIDIA DGX B200系统,将打造日本最强大的AI超级计算机。
穿着标志性黑色皮衣的黄仁勋,先是发表了1小时的特别演讲,随后与软银集团CEO孙正义进行现场对谈。黄仁勋爆料说:“在座的许多人可能不知道,孙正义曾是英伟达的最大股东。”紧接着两人表演了一出抱头痛哭。
两人的聊天气氛十分轻松活跃。黄仁勋抛出一个话头“如果今天,你是最大股份持有者……”后自己先笑喷了,孙正义也笑得前仰后合,然后他们提起十年前的一次私下对话。
黄仁勋记得当时孙正义对他说:“Jensen,市场不理解英伟达的价值,你的未来是令人难以置信的,但市场并不理解。你的苦难之旅将持续一段时间,因为你正在发明这个未来。让我给你钱来买英伟达。 ”
“他想借钱给我买下英伟达,所有的资产。”黄仁勋满面笑容地回忆,“现在我后悔没采取了。这是个好主意。”
之后两人还讨论过将两家公司合并。
如今,软银已利用NVIDIA AI Aerial加速平台成功试运行了全球首个AI和5G电信网络,并用NVIDIA AI Enterprise软件创建一个能够满足本地安全AI计算需求的AI市场。这项支持AI训练和边缘AI推理的新服务使得软银成为日本的AI网格。
AI-RAN,可同时运行AI和5G工作负载的新型电信网络,是英伟达和软银实现的一项技术里程碑。
软银通过室外试验证明其英伟达加速的AI-RAN解决方案已实现运营商级5G性能,并能利用网络的过剩容量同时运行AI推理工作负载,其应用包括自动驾驶汽车远程支持、机器人控制等。
英伟达和软银估计,电信运营商在新的AI-RAN基础设施上每投资1美元资本支出,就可以获得大约5美元的AI推理收入。软银估计其基础设施中每增加一台AI-RAN服务器,就可以获得高达219%的回报。
也就是说,基站可以变成AI创收资产。
除了跟孙正义聊日本AI基础设施外,黄仁勋依旧大谈AI技术变革,称过去十年英伟达使AI和机器学习的规模扩大了100万倍,并展示了Blackwell、NVLink交换机等硬件产品。
他还晒出Blackwell系统的“全家福”。
一、AI+GPU开启软件2.0时代,Scaling Law推动计算能力加速提升
“我们几乎是计算领域唯一一家不想取代CPU的公司,而是想增强CPU,以便我们可以承担非常计算密集型的工作负载。并将它们卸载到GPU上。”黄仁勋说。
他谈道,Blackwell系统不仅强大,而且适应性很强,可以适应世界计算基础设施的每个角落。多年来,英伟达创建的所有软件都集成到系统中,使每个人都可以在世界各地部署AI超级计算机。
软件1.0是由人类程序员编写串行代码,运行在由CPU驱动的通用计算机上。在GPU上运行的神经网络开启了软件2.0时代。如今软件可以编写软件,给它大量示例观察数据,它就可以学习、自己预测功能是什么。
在GPU上运行的神经网络形成了一种新的操作系统,一种使用计算机的新方式。大语言模型已被证明具有令人难以置信的可扩展性,可将声音、语音、图像和视频数字化,可以是多模态的。
这些组合中的每一个,都是一个新的行业、新的公司、新的应用用例,现在已经创造了应用程序数量爆炸式增长。
机器学习的一个特性是,大脑越大、可以教给它的数据越多,它就变得越聪明。这被称之为Scaling Law。
有充分证据表明,随着模型规模扩大,训练数据量、有效性、质量和智能性能都会得到提高。每年,行业都会将模型的大小扩大2倍左右,相应需要2倍的数据,因此需要4倍的计算量、大量的计算资源来推动AI的下一个水平。
同时存在的训练和推理Scaling Law将要求以非常快的速度提供计算能力。黄仁勋分享了英伟达采用一年一迭代周期的原因:“随着世界继续观察并将AI纳入我们的使命,我们有责任在这个过程中尽可能快地推动性能提升。扩大AI的范围,提高其效率,降低其成本。降低其电力消耗。”
二、AI Agent协作提高生产力,未来的工厂将成为机器人工厂
什么是AI?黄仁勋认为有两种思考方式非常有帮助。
第一个应用是数字AI工作者(Agent),它们可以执行营销活动、支持客户、提出供应链计划、优化芯片、辅助编写软件、做药物发现研究助理等。
就像数字员工一样,你必须对它们进行培训,创建数据,向它们介绍你的公司,训练它们的特定技能,在培训后对它们进行评估,以确保它们学到了应该学的东西,并要确保它们执行被要求做的工作。然后在Blackwell上部署它们,它们会与其他Agent互动,作为一个团队来解决问题。
英伟达打造了AI Agent生命周期库NVIDIA NEMO,能帮助构建AI Agent。这些库被集成到全球的工作流程和框架中。
“AI不会取代你的工作,别人使用AI会取代你的工作。”在黄仁勋看来,与其将AI视为取代50%的人,更应该将AI看作会为100%的人完成50%的工作。AI将有助于提高公司的生产力。
第二个应用是物理AI,迄今机器人技术一直受限,不够灵活,无法适用于不同的场景、不同的条件和不同的工作。我们需要一种更加灵活、可自适应和学习的AI。现在可将这种通用的AI技术应用于嵌入式AI或物理AI或以其他方式称为机器人的世界。
黄仁勋提出物理AI和机器人开发需要3台计算机系统,一个训练AI,一个模拟AI,还有一个将经过训练的AI模型部署到节能的边缘计算系统上。
英伟达旨在让开发者能够创建物理AI。NVIDIA Omniverse提供了测试和优化物理AI的开发平台和模拟环境。在Omniverse中,AI使用强化学习物理反馈进行了精细调试。经训练的AI可在NVIDIA Jetson Thor机器人计算机上运行。
有两种类型的机器人系统可以轻松部署到世界上任何地方,一是自适应汽车,二是人形机器人。
在上周的机器人学习会议上,英伟达宣布了一个重要的开源机器人学习框架NVIDIA Isaac Lab。该框架基于Omniverse构建,可以加速包括人形机器人、四足机器人、协作机器人等AI机器人的开发工作。
英伟达还创建了几个全新GR00T工作流,用于向机器人演示如何执行任务、运动和轨迹生成、实现灵巧操作、全身控制、运动和导航、多模态感知等。英伟达还将机器人控制方面的技能提炼成了一个统一模型,使得机器人能够执行运动学技能。
机器人是自主的,未来的工厂将成为机器人工厂。
“Mega”以Omniverse为基础,是工厂数字孪生的蓝图,可帮助工业企业在将机器人部署到实体工厂之前,在模拟中测试和优化机器人队列,让开发人员能够将虚拟机器人及其AI模型(即机器人的大脑)植入工厂数字孪生中。
数字孪生中的机器人通过感知环境、推理、规划下一步动作并最终完成计划动作来执行任务。这些动作由Omniverse中的世界模拟器在数字环境中进行模拟,并通过Omniverse的传感器模拟,被机器人大脑感知到结果、决定下一步动作、然后循环继续,同时Mega会跟踪工厂数字孪生中每个元素的状态和位置。
这种先进的软件在环测试方法使工业企业能在Omniverse数字孪生的安全范围内模拟和验证变化,帮助他们预测和缓解潜在问题,从而降低实际部署期间的风险和成本。
结语:“没有一家公司能负担得起不生产AI的代价”
黄仁勋相信,每个公司都将成为AI制造商。没有一家公司能负担得起不生产AI的代价。每个行业、每个公司、每个国家都必须生产自己的AI,这是一场新的工业革命。
物理AI时代已经到来,正在改变世界的重工业和机器人技术。有两个机器人系统:第一个是数字化的,称AI为代理,在办公室使用,与员工合作;第二个是物理AI,机器人技术。
未来汽车公司将有两个工厂,一个工厂制造汽车,一个工厂生产运行在车内的AI。
计算机行业已从CPU上运行的编程发生了根本性变化。现在机器学习运行在一个生产软件的行业GPU上。英伟达已经身处一个制造AI的行业,AI是在工厂生产的。当你获得软件许可时,将其安装到你的计算机中,软件的制造和分发就完成了。
而智能永远不会完成,你会与各种AI系统进行交互,无论是AI Agent还是AI机器人。智能用token来表达,所有token都是在这些工厂AI生产的。
“每次你为基础设施创造一些全新的东西时,就会创造新的产业和新的综合体、新的经济机会、新的繁荣。”黄仁勋说。