芯东西(公众号:aichip001)
编译 | 刘煜
编辑 | 陈骏达

芯东西3月23日消息,据《福布斯》近日报道,Groq联合创始人、英伟达首席软件架构师乔纳森·罗斯(Jonathan Ross)分享了英伟达投资200亿美金(约合人民币1381.5亿元)与Groq达成技术合作的细节,称最初构想的英伟达与Groq的“GPU与LPU深度整合方案”差点被放弃

创始人亲自揭秘:英伟达与Groq价值1300亿的合作始末

▲乔纳森·罗斯(Jonathan Ross)(图源:20VC播客)

同时,罗斯称Groq芯片已经开始全面生产,预计2026年下半年出货,其规模达到“英伟达量级”,并不是小规模试点。

继Groq与英伟达达成合作之后,这笔交易进一步提升了市场对其他自主研发AI推理芯片初创公司的关注度,逐渐引发了连锁反应。

半导体行业公认的传奇芯片架构师、AI芯片研发公司Tenstorrent的CEO吉姆・凯勒(Jim Keller)说道:“Groq为异构计算打开了大门…… 我相信有人已经算过这笔账。”

可是谁能想到,2026年的新晋亿万富翁人选罗斯,在最初经营Groq时,却屡屡面对收入无法覆盖亏损的局面。从2023年的亏损多出收入近28倍,再到2024年仅能得到微不足道的投资收入,这家公司几次面临死亡的风险。

即使Groq公司的运营几经波折,但罗斯并没有就此放弃Groq的创办理念。他想把英伟达的GPU和Groq自己的LPU芯片搭配使用,构建一个“GPU做训练、LPU做推理”的混合算力集群。

仅因为这个想为Groq争取一笔高达数十亿美元的芯片合同的“求生”念头,最后却给Groq带来了超出所有人预期的高达200亿美元的合同。

Groq开始了两条并行的发展路线:Groq的技术将成为英伟达AI计算平台的一部分,同时也作为独立的公司继续运营。

谈及加入英伟达的感受,罗斯称:“我们就像进了糖果店的孩子。突然间,我们能接触到所有资源。”

一、差点被放弃的合作方案,促进了200亿美金合同的签订

去年冬天,罗斯与黄仁勋进行会谈,提议两家公司进行技术合作。会谈时罗斯对黄仁勋说道:“如果你要为全美国搭建物流网络,我告诉你只有两个选择:全用18轮大卡车,或者只用配送厢车,你会选哪个?最佳答案是:两者都要。”

简单来说,英伟达的通用GPU是重型卡车,Groq专为极速运行模型设计的语言处理单元LPU芯片,则是小型厢式货车。

罗斯不只是在兜售一套理念。他希望获得英伟达许可,采购约10万颗Blackwell芯片,价值可能高达数十亿美元。会谈时黄仁勋就技术细节对他进行了更深入的追问,之后会谈结束。

三天后黄仁勋回电,罗斯本以为要讨论GPU采购订单,结果等来了更深一步的合作。

于是,三周后,英伟达在平安夜宣布了一笔200亿美元的交易:英伟达获得了Groq的芯片技术授权,并聘用Groq的大部分员工。其中,罗斯担任英伟达首席软件架构师。

据《福布斯》报道,按罗斯在Groq公司持股约9%估算,他将获得9.5亿美元(约合人民币65.62亿元)税后现金。不仅如此,在英伟达为入职员工预留的约30亿美元(约合人民币207.23亿元)激励中,他很可能拿到极高比例,待他在英伟达的股票薪酬全部归属后,他将新晋为一位亿万富翁。

而硅谷风险投资家、企业家查马斯・帕里哈皮蒂亚旗下的Social Capital持股比例与罗斯相近。

这笔交易的结构意味着美国政府可能获得超过60亿美元(约合人民币414.46亿元)税收,而英伟达也可享受约30亿美元的税务抵扣。

罗斯拒绝对个人净资产置评,但如果这笔交易是以股票或资产出售形式完成,而非双重征税、以现金为主的授权协议,他的身家会高得更多。

罗斯称,Groq的业务部门LPU云服务商仍在运营,其业务也在持续增长。上个月,Groq前员工称,该部门预计会被出售,但目前尚未完成。

用硅谷的话说,这像是一份没有正式并购文件的合并:拿下团队、锁定技术、获得战略利益,同时不用承接公司里所有遗留问题,也不会触发反垄断审查。

英伟达与Groq的合作虽然现已达成,但谈及去年年底向黄仁勋提出的想法时,罗斯称:“我们差点就没做GPU与LPU深度整合这件事。”是现已是英伟达副总裁的桑尼・马德拉(Sunny Madra)说服了他,最终促成了合作。这次合作无论从商业还是文化上看,这都像是一场天作之合。

二、AI推理理念超前,Groq公司的求索路稍显曲折

2016年,Groq成立。当时,Groq提出超高速推理概念,而这个概念却是大多数公司还没有意识到的市场需求。

在与英伟达合作达成前的几个月里,罗斯公开宣传其与沙特国有石油公司旗下科技子公司Aramco Digital相关的合作,并称这次合作将为Groq带来巨额收入。

2025年2月,Groq与Aramco Digital签署了15亿美元(约合人民币103.61亿元)长期合作承诺。罗斯在风险投资和科技创业领域全球最具影响力的播客之一20VC播客中称:“我们没有融资15亿美元,那是收入。这个收入大约相当于OpenAI收入的30%。”

一名Groq前员工向《福布斯》澄清道,15亿美元指的是Groq计划建设的服务的累计价值。这一数字很可能包括部署Groq芯片的数据中心建设总成本、芯片本身价值,以及芯片在未指定期限内所能产生的算力价值。

据三名Groq前员工透露,Groq与Aramco Digital的协议采用收入分成模式:Groq以相对较低的价格向Aramco出售AI芯片,Aramco则出资建设搭载芯片的数据中心,而后双方再分享芯片产生的算力收入。

不过,并非所有合作都是清晰的现金换产品交易。

在Groq与澳大利亚数据中心REIT商数字基础设施公司Equinix的合作中,Groq作为客户向Equinix支付最高3亿美元用于部署LPU,再转售给云客户。

Groq成立7年时,Groq收入300万美元(约合人民币2072.3万元),亏损8800万美元(约合人民币6.07亿元)。

到2024年年中,即使Groq以28亿美元(约合人民币193.41亿元)估值融资了6.4亿美元(约合人民币44.21亿元),但曾在2021年首次投资Groq的美国的风险投资公司Alumni Ventures的首席投资官马克・爱德华兹称,Groq的这些收入依然微不足道。

2024年,罗斯接受《福布斯》采访时称:“Groq多次濒临死亡。我们可能起步得太早了一点。”

目前尚不清楚在Groq与英伟达达成新的合作之后,Groq之前的合作会怎么安排,同时也不清楚在Groq与英伟达商谈合作时这些Groq之前签订的合作是否有被当成谈判的筹码。罗斯称,Groq仍作为独立公司继续履行与沙特客户签订的合同。

三、英伟达的附加板块:推理芯片的战略生态

黄仁勋将2026年定为AI推理之年,即使用AI而非训练AI的阶段。

今年早些时候,黄仁勋称:“Groq很难打入AI工厂的主流市场。但与我们结合后,他们就不用再为此发愁。”

黄仁勋在英伟达GTC 2026年度开发者大会上用大量篇幅介绍Groq,并且清晰亮出了自己的计划。黄仁勋称,Groq自身业务可能翻倍,因此,对于一个1吉瓦规模的数据中心,Groq可将英伟达的整体收益提升约25%。

罗斯称,Groq推迟发布的第二代芯片尚未量产,而Groq的第二代芯片与英伟达系统整合的时间,几乎和设计制作Groq第三代芯片并将其整合到英伟达系统的时间一样长。

于是,在英伟达GTC 2026大会上,黄仁勋推出全新的NVIDIA Groq 3 LPU芯片,并宣布将其与英伟达最新一代Vera Rubin平台深度整合。

创始人亲自揭秘:英伟达与Groq价值1300亿的合作始末

▲Groq 3 LPU图(图源:英伟达发布会)

Groq 3 LPU由三星代工,已进入量产,大约在今年第三季度能够交付。英伟达拒绝透露计划生产的Groq芯片数量,但称其规模极大。

罗斯称他已参加了大量客户会议,但目前尚未公布任何买家。

英伟达高性能计算与AI基础设施高级总监迪翁・哈里斯(Dion Harris)称:“我现在还不能确认任何订单。现在尚处早期,但市场兴趣非常浓厚。”

尽管其他推理芯片厂商认为,Groq与英伟达的合作在渠道上占据明显优势。但无论如何,这笔交易进一步巩固了市场对AI推理芯片的信心。

边缘AI推理芯片公司femtoAI的联合创始人兼CEO萨姆・福克称:“英伟达的新产品NVIDIA Groq 3 LPX承认了一个事实:仅靠GPU无法很好地服务于增速更快的推理市场”。他认为,更便宜、更易获取的推理方案将满足市场的更高需求。

d-Matrix联合创始人兼CEO西德・谢思称:“黄仁勋为我们长期推动的这个市场提供了背书。英伟达下一阶段的增长将来自推理。”

尽管面临诸多不利因素,罗斯坚称自己始终信心满满、志向远大。他回忆道:“我原本以为自己会在Groq干到最后。我一直跟别人说,我们想要承载全球一半的推理算力。”

尽管一名Groq前员工称,Groq的目标一直是与英伟达合作,但罗斯最初并不确定Groq芯片与英伟达GPU能否良好整合。而现在,这场押注正从交易理论走向产品现实。

结语:英伟达官方背书,推理芯片进入发展新阶段

英伟达与Groq的“平安夜协议”达成时Groq公司处境微妙,而如今,英伟达正押注Groq的极速推理技术,将其融入全新发布的芯片平台。

除此之外,Groq的竞争对手美国AI芯片独角兽AI研发企业Cerebras已与OpenAI达成合作,将为OpenAI的平台新增750兆瓦的超低延迟AI算力,并在2028年之前分批次陆续上线。Cerebras联合创始人兼首席执行官安德鲁・费尔德曼(Andrew Feldman)称:“正如宽带技术变革了互联网,实时推理也将变革AI,催生构建AI模型及与之交互的全新方式。”

或许,当前的时代,正在从GPU“独大”的刻板印象里,逐渐向另一个不再那么看重训练性能,而是更关心成本、延迟与规模化吞吐能力的市场慢慢交汇靠近。