推理战争打响了:OpenAI砸200亿押注Cerebras,英伟达200亿买下Groq,两笔钱说的是同一件事

同一周,两笔200亿美元的芯片交易出现在视野里。

一笔是英伟达去年年底以200亿美元收购Groq——专门做AI推理芯片的公司,也是Cerebras最主要的架构竞争对手。

另一笔是OpenAI向Cerebras追加承诺:三年内再砸200亿美元买算力,外加最高10%的股权认股权证,以及向Cerebras单独投入10亿美元专项资金建数据中心。

这两笔交易同时发生不是巧合。AI的计算战场正在从训练转向推理,各方都在抢位置。

推理变成了主战场

先说清楚背景。

AI算力分两种:训练(把大量数据喂给模型,调整参数,一次性成本)和推理(用训练好的模型回答问题,持续发生)。

几年前,训练是主要开支。现在不一样了。

2025年,推理已经占AI算力总支出的50%。2026年,这个比例预计跳到三分之二。

每次你发一条消息给ChatGPT、Claude或Gemini,背后就是一次推理请求。用户量越大,推理成本越高,而且是线性增长的。大模型公司要服务数亿用户,推理基础设施的效率直接决定毛利率能不能活下去。

英伟达的GPU非常适合训练,但在推理场景下有一个硬伤:内存带宽。推理的瓶颈不是算力,是数据搬运速度。GPU需要把权重从显存反复调出来,这个过程慢、贵、耗电。

Cerebras为什么适合推理

Cerebras的WSE-3(第三代晶圆级引擎)是一张覆盖整块晶圆的芯片:

参数 WSE-3 NVIDIA H100
芯片面积 46,225 mm² 814 mm²
AI核心 900,000个 16,896个CUDA核心
片上SRAM 44GB
推理速度 H100的15-20倍 基准

WSE-3比H100大57倍。这不是唬人的数字,而是决定推理性能的关键:44GB的片上SRAM让内存和计算核心紧挨着,数据搬运距离从厘米级压到微米级,推理速度差距就是这么来的。

代价是什么?晶圆级封装良率低,成本高,CUDA生态缺失——训练几乎不能用,训练侧NVIDIA的护城河完整无损。但推理?Cerebras的架构在这里有结构性优势。

OpenAI的两步棋

OpenAI和Cerebras的关系其实不是新的。今年1月,OpenAI签了第一笔大合同:750兆瓦计算容量,三年期,价值超过100亿美元。

4月17日,The Information报出追加消息:OpenAI新增承诺,三年内总支出超过200亿美元,可能累计达到300亿,附带:

  • 随消费增加的股权认股权证,最高可达Cerebras 10%所有权
  • 单独向Cerebras投入10亿美元帮它建数据中心

这不是一个采购合同,更像是战略绑定。同时,OpenAI还在和Broadcom合作开发自研ASIC芯片,目标2026年底量产。

OpenAI在有意识地把算力供应多元化——在NVIDIA之外建一条平行通道,同时下注专用推理芯片和自研芯片两条路。

英伟达的应对:把对手买掉

英伟达去年底以200亿美元收购Groq,Groq的LPU(语言处理单元)是纯推理架构,和Cerebras一样绕过了GPU的内存带宽瓶颈,是独立推理芯片赛道上的主要竞争对手。

收购之后,Groq从独立玩家变成了英伟达旗下部门。这是防御性动作,但效果直接:把对手收进来,比在市场上正面打更便宜,也更彻底。

结果是,Cerebras在这个赛道上最主要的架构竞争对手消失了,变成了英伟达自己的产品。这个格局对Cerebras接下来几年的客户拓展是利好。

Cerebras重新冲击IPO

4月17日,Cerebras向SEC重新提交上市申请,目标估值约350亿美元,计划融资30亿美元,争取二季度完成上市。

第一次IPO失败是因为最大客户G42(阿布扎比AI公司)被CFIUS盯上。Cerebras把G42的投票权股票全部改为无投票权,CFIUS在2025年3月31日最终放行。

现在的条件和上次不一样了:

  • Groq被英伟达并购,最主要竞争对手退场
  • OpenAI是锚定客户,200亿承诺是上市路演最大的底牌
  • 估值从今年2月Series H的230亿跳到350亿目标,敲锣之前已经涨了50%

OpenAI、英伟达、Cerebras,三方在推理这个战场上各有算盘,但都在赌同一件事:未来五年,推理算力的需求还会再翻几倍。现在抢位置的成本,比两年后入场便宜太多了。

参考来源:OpenAI to Spend More Than $20 Billion on Cerebras Chips, Receive Equity Stake(The Information);AI chipmaker Cerebras files to go public after scrapping IPO plans last year(CNBC);Two $20 billion deals: OpenAI and Nvidia are waging a "war of inference"(PANews);Cerebras IPO 2026: The $25B Nvidia Challenger(Nerd Level Tech)