芯东西(公众号:aichip001)
编译 | 尹明顺
编辑 | 漠影
芯东西9月13日消息,据The Information报道,软件巨头甲骨文公司(Oracle Cloud Infrastructure)高级副总裁 Karan Batta称,尽管英伟达在销售人工智能数据中心芯片方面蓬勃发展,但一些开发AI的客户正在转向规模较小的竞争对手AMD。
甲骨文公司认同英伟达在芯片市场上的优势地位,但同时认为需要加入一些竞争来可控硬件开发成本。
英伟达产品存在提升价格可能,许多客户为此陷入担忧。
甲骨文高管称,AMD硬件能够有效帮助公司防范因英伟达芯片供应短缺出现的危机,而这类短缺问题,在去年的绝大多数时间都存在过。
除了甲骨文公司外,微软等云服务商也有减少对AI计算巨头英伟达依赖的意向。
一、英伟达断供成常态,客户纷纷转向AMD
Karan Batta说:“我们发现,芯片推理的达成并不一定非要绑定在某个特定供应商。”Karan Batta认为,随着英伟达在服务器芯片市场上一骑绝尘,需要竞争来降低硬件成本。
无论是自主开发AI应用这一层面,还是向软件供应商采购此类应用层面,增强竞争都将使企业能够控制AI推理成本。
AMD在2023年推出的最新旗舰服务器芯片可能不如英伟达在2022年推出的最新旗舰产品H100强大,但甲骨文和微软的高管们认为,他们别无选择,只能支持AMD以促进竞争。Karan Batta补充道:“AMD正在投入大量精力,并且在提升芯片性能方面做得很好。”
Karan Batta认为,甲骨文公司使用AMD硬件还有助于其防范未来英伟达潜在的供应短缺问题。此类短缺在去年大部分时间都发生过。
Karan Batta拒绝透露具体细节或客户名称,但他的评论表明甲骨文公司希望减少对AI计算巨头英伟达的依赖,这一做法与微软等其他云服务提供商类似。
此外,用于推理的英伟达芯片租赁成本一直在下降,但其下一代旗舰AI芯片可能会改变这一现状。其他英伟达客户也私下表达了类似的担忧,他们担心如果AMD或其他公司不抢占英伟达的市场份额,英伟达产品将继续保持高昂的价格。
虽然到目前为止,这种情况还没有真正发生。
AMD称,与去年同期相比,其数据中心收入在6月当季增长了115%,达到28了亿美元,而英伟达的数据中心收入在7月当季增长了154%,达到了263亿美元。
▲英伟达与AMD数据中心收入对比图(图源:The Information)
二、甲骨文正与OpenAI、xAI开展合作,着力提升芯片集群规模
与此同时,甲骨文和其他云服务提供商正在蓬勃发展,他们向OpenAI和埃隆·马斯克的xAI等客户出租了更多英伟达服务器。
在美国的服务器租赁市场中,甲骨文公司排在亚马逊的Amazon云服务、微软Azure云科技和谷歌云之后,位列第四。甲骨文公司从这项业务中获得了24亿美元的收入,同比增长45%。
甲骨文公司进入云计算领域相对较晚,但有些幸运,因为去年正值AI初创公司争相抢购云服务器的热潮。甲骨文公司没有开发类似OpenAI GPT-4的大型语言模型,故而对于AI开发客户不构成竞争威胁,这使它在市场显现出了优势。
现在,甲骨文公司正在寻求在AI模型训练市场占据更大份额,联合创始人拉里·埃里森(Larry Ellison)在周一表示,甲骨文公司正在设计一座容量超过10亿瓦特的数据中心,它足以为像旧金山这样的城市供电。
Karan Batta拒绝透露该数据中心的细节也未公布何时投入运营。他称,为了支持其扩张,甲骨文公司将提升串联AI芯片集群的能力,使它们能够像单台计算机一样工作,这是训练新大型语言模型的理想设置。
这些改进包括改变甲骨文公司冷却发热芯片的方式,以及为电缆建造隧道,以便将不同建筑中的芯片连接起来,使它们不必全部位于同一地点。
他说,甲骨文计划将芯片集群规模扩大至少一倍,从6.4万个GPU增加到12.8万个以上。但他没有说明具体时间。
此外, Karan Batta认为,即使初创公司使用其他云服务来开发其核心模型,甲骨文公司仍然可以从人工智能培训的需求中受益。
例如,这些公司还需要其他用途的硬件,如微调,开发人员会在其中对特定任务的模型进行优化。
Karan Batta称,一些AI公司正在购买访问旧芯片的权利来处理这些工作负载。
据The Information人工智能数据中心数据库显示,甲骨文公司可能与OpenAI和微软达成了一项协议,将在明年使用美国德克萨斯州的一座设施,但 Karan Batta拒绝就具体公司对此事发表评论。
结语:越挫越勇?自称AI计算能力名列前茅
最近,甲骨文公司受挫,因马斯克决定在美国孟菲斯建造自己的GPU集群,而不是从甲骨文公司租用,因为该公司无法快速建立数据中心。
Karan Batta认为,现在判断xAI是否能在甲骨文之前更快地完成由10万个H100芯片组成的Colossus集群,还为时过早。
“我没有一个比较的基准。我们比xAI快得多吗?还是慢得多?……我认为,与其他云服务提供商比较而言,我们会觉得自己在AI计算能力方面是最快的之一。”
来源:The Information