Fractile要把推理芯片彻底重做一遍:2.2亿美金B轮到账,HBM和片上SRAM都不要了

英国跑出来一家敢打 NVIDIA 推理饭碗的。

5 月 13 日,伦敦的 Fractile 宣布拿到 2.2 亿美金 B 轮(约 1.65 亿英镑),由 Accel、Factorial Funds、Peter Thiel 的 Founders Fund 三家联合领投,Conviction、Felicis、8VC、Buckley Ventures 等跟投。

但这家公司有意思的不是估值,是它的技术叙事:HBM 不用,on-chip SRAM 也不用,从头重写推理硬件

创始人想干的事很具体

Fractile 的 CEO 是 Walter Goodwin,牛津大学训练出来的芯片工程师,2022 年创办这家公司。他亲自参与了芯片设计——不是常见的”我请来一队前 NVIDIA 的人”那种叙事。

Goodwin 给的卖点是一个数字:

“现在的推理芯片大约只能跑到 40 tokens/秒。”

40 token/秒什么概念——大模型解一道复杂题往往要吐 1 亿个 token 的中间步骤。按 40 token/秒算,这一道题要跑接近一个月

“We bet everything on the logical conclusion: that the only way to truly unlock this latent value, to make speed viable at scale, was to radically re-invent the hardware that we run our frontier AI models on.”

把一个月的工作压到一天,把一个周末的实验压到一杯咖啡的时间——Goodwin 说这就是他想做的事。

它跟 NVIDIA 那条路的差别

Fractile 走的不是改良 GPU 这条线。Goodwin 说他们的芯片:

“It doesn’t use traditional high-bandwidth memory, nor on-chip static random-access memory or SRAM.”

这话扔在英伟达股东大会上算半个炸弹。HBM 是 NVIDIA H100/B200 这一代芯片最贵的部件,单颗成本能占到芯片的 40%;on-chip SRAM 是 GPU 推理性能的关键瓶颈。Fractile 说这两个都不要了,意味着它走的是完全不同的存算架构——业界叫法叫 in-memory compute,简单讲就是把计算挪到内存里直接做,不再来回搬数据。

具体的技术方案 Fractile 没公开。它说自己的逻辑芯片可以直接挂在标准服务器机架里——不需要专门的服务器机箱、不需要重新设计冷却。这意味着如果产品真能跑出来,部署门槛会比 NVIDIA 那套低不少。

Founders Fund 这次的押注逻辑

Founders Fund 这两年在 AI 硬件上的下注路径很清晰——已经投了 Cerebras(晶圆级处理器)、Anduril(国防 AI 算力)、SpaceX(自家 Colossus 训练集群)、xAI。

Fractile 是它推理这条线的下注。训练那一边卷成红海了,推理这一边的格局还在重写——尤其是当模型能 thinking 一万步、生成一亿 token 的时代,每秒 40 个 token 这个上限会越来越疼。

英国 AI 大臣 Kanishka Narayan 给这事加了句站台:

“a strong vote of confidence in British AI”

潜台词是——欧洲 AI 这两年被吐槽得不轻,能跑出来一家美国顶级 VC 集体进局的芯片公司,对英国是脸面。

还没看到的部分

文章里没披露的几件事比较关键:

  • 客户:Fractile 没说有谁在用,目前只是”很快交付到企业客户手上”
  • 首颗芯片量产时间:没写
  • 跑分数据:除了 “40 token/s 的现状” 作为对比,没给自家芯片的实测数字
  • 能耗优势的具体数字:只说”显著降低”,没量化

这些不披露的部分是合理的——B 轮这个阶段,能交付的硬件、能跑的 benchmark 还没到讲故事的时候。但 2.2 亿美金到账这个事实本身已经说明,Accel、Founders Fund 这种级别的 VC 已经看过他们的实物——这个钱不是听 PPT 给的。

下一步要看的是:到底有谁会买、跑出来比 H200 推理快多少、单 token 成本能降到几分之一。

如果做不到这三件事的任何一件,Fractile 也只是又一家”挑战 NVIDIA”的芯片公司——这个名单挺长的。

参考来源:UK AI chip startup Fractile raises $220M to tackle the growing inference bottleneck(Tech.eu);Fractile lands £165m as ministers hail 'vote of confidence' in UK AI(CityAM);British inference chip startup Fractile bags $220M to accelerate token consumption(SiliconANGLE)