同一周,两笔200亿美元的芯片交易出现在视野里。
一笔是英伟达去年年底以200亿美元收购Groq——专门做AI推理芯片的公司,也是Cerebras最主要的架构竞争对手。
另一笔是OpenAI向Cerebras追加承诺:三年内再砸200亿美元买算力,外加最高10%的股权认股权证,以及向Cerebras单独投入10亿美元专项资金建数据中心。
这两笔交易同时发生不是巧合。AI的计算战场正在从训练转向推理,各方都在抢位置。
推理变成了主战场
先说清楚背景。
AI算力分两种:训练(把大量数据喂给模型,调整参数,一次性成本)和推理(用训练好的模型回答问题,持续发生)。
几年前,训练是主要开支。现在不一样了。
2025年,推理已经占AI算力总支出的50%。2026年,这个比例预计跳到三分之二。
每次你发一条消息给ChatGPT、Claude或Gemini,背后就是一次推理请求。用户量越大,推理成本越高,而且是线性增长的。大模型公司要服务数亿用户,推理基础设施的效率直接决定毛利率能不能活下去。
英伟达的GPU非常适合训练,但在推理场景下有一个硬伤:内存带宽。推理的瓶颈不是算力,是数据搬运速度。GPU需要把权重从显存反复调出来,这个过程慢、贵、耗电。
Cerebras为什么适合推理
Cerebras的WSE-3(第三代晶圆级引擎)是一张覆盖整块晶圆的芯片:
| 参数 | WSE-3 | NVIDIA H100 |
|---|---|---|
| 芯片面积 | 46,225 mm² | 814 mm² |
| AI核心 | 900,000个 | 16,896个CUDA核心 |
| 片上SRAM | 44GB | — |
| 推理速度 | H100的15-20倍 | 基准 |
WSE-3比H100大57倍。这不是唬人的数字,而是决定推理性能的关键:44GB的片上SRAM让内存和计算核心紧挨着,数据搬运距离从厘米级压到微米级,推理速度差距就是这么来的。
代价是什么?晶圆级封装良率低,成本高,CUDA生态缺失——训练几乎不能用,训练侧NVIDIA的护城河完整无损。但推理?Cerebras的架构在这里有结构性优势。
OpenAI的两步棋
OpenAI和Cerebras的关系其实不是新的。今年1月,OpenAI签了第一笔大合同:750兆瓦计算容量,三年期,价值超过100亿美元。
4月17日,The Information报出追加消息:OpenAI新增承诺,三年内总支出超过200亿美元,可能累计达到300亿,附带:
- 随消费增加的股权认股权证,最高可达Cerebras 10%所有权
- 单独向Cerebras投入10亿美元帮它建数据中心
这不是一个采购合同,更像是战略绑定。同时,OpenAI还在和Broadcom合作开发自研ASIC芯片,目标2026年底量产。
OpenAI在有意识地把算力供应多元化——在NVIDIA之外建一条平行通道,同时下注专用推理芯片和自研芯片两条路。
英伟达的应对:把对手买掉
英伟达去年底以200亿美元收购Groq,Groq的LPU(语言处理单元)是纯推理架构,和Cerebras一样绕过了GPU的内存带宽瓶颈,是独立推理芯片赛道上的主要竞争对手。
收购之后,Groq从独立玩家变成了英伟达旗下部门。这是防御性动作,但效果直接:把对手收进来,比在市场上正面打更便宜,也更彻底。
结果是,Cerebras在这个赛道上最主要的架构竞争对手消失了,变成了英伟达自己的产品。这个格局对Cerebras接下来几年的客户拓展是利好。
Cerebras重新冲击IPO
4月17日,Cerebras向SEC重新提交上市申请,目标估值约350亿美元,计划融资30亿美元,争取二季度完成上市。
第一次IPO失败是因为最大客户G42(阿布扎比AI公司)被CFIUS盯上。Cerebras把G42的投票权股票全部改为无投票权,CFIUS在2025年3月31日最终放行。
现在的条件和上次不一样了:
- Groq被英伟达并购,最主要竞争对手退场
- OpenAI是锚定客户,200亿承诺是上市路演最大的底牌
- 估值从今年2月Series H的230亿跳到350亿目标,敲锣之前已经涨了50%
OpenAI、英伟达、Cerebras,三方在推理这个战场上各有算盘,但都在赌同一件事:未来五年,推理算力的需求还会再翻几倍。现在抢位置的成本,比两年后入场便宜太多了。
参考来源:OpenAI to Spend More Than $20 Billion on Cerebras Chips, Receive Equity Stake(The Information);AI chipmaker Cerebras files to go public after scrapping IPO plans last year(CNBC);Two $20 billion deals: OpenAI and Nvidia are waging a "war of inference"(PANews);Cerebras IPO 2026: The $25B Nvidia Challenger(Nerd Level Tech)