Mira Murati是在2024年底离开OpenAI的,那时候OpenAI正处在上市前夕的高光时刻,她是技术总监,带着一批核心工程师走的。
大家都以为她会去做另一个追逐GPT的语言模型。
结果她做了Tinker。
Thinking Machines Lab到底在做什么
简单说:Tinker是一个允许开发者给任何开源大模型打”能力补丁”的API。
你想让Llama 4更擅长写Python?给Tinker一批标注数据,它帮你用强化学习把这个模型微调成”Python专家”版本。不用自己维护GPU集群,不用搭训练流水线,API调用就行。
这个产品思路和OpenAI的fine-tuning API像,但底层不一样——Tinker的核心是基于强化学习(RL)的微调,不是普通的监督学习微调。RL微调比SFT更难控制,但在某些任务上效果明显更好。DeepSeek的推理能力提升,用的就是这条路。
Thinking Machines的首席科学家是John Schulman——PPO算法的作者之一,也是OpenAI早期RL训练框架的主要设计者。你可以理解为,他们把强化学习这条线上最懂的人请来了。
另外两位:CTO是Soumith Chintala,PyTorch的创始人;CEO是Mira Murati本人。这三个人搭在一起,构成了一个罕见的组合:模型框架+RL理论+产品直觉。
这次Google的交易
4月22日,在拉斯维加斯的Google Cloud Next大会上,Thinking Machines Lab和Google Cloud宣布了一笔新合同。
规模:数十亿美元(TechCrunch独家报道,一位知情人士描述为”个位数十亿美元”级别,具体金额未公开)。
合同内容:
- 硬件:Nvidia GB300 NVL72系统——72块GPU一组的大型液冷机柜,训练和服务速度比上一代提升2倍
- 网络:Google自研的Jupiter网络架构,专门用于GPU间权重传输
- 软件服务:Kubernetes Engine、Spanner数据库、Cloud Storage(带Anywhere Cache)
- 虚拟机:A4X Max实例,每台配置四块Nvidia Blackwell Ultra GPU、72核CPU、37TB内存
为什么RL微调需要这种级别的算力?创始研究员Myle Ott解释了核心瓶颈:
“每次训练迭代,权重要在数千块GPU之间来回同步数千次。互连带宽不够,训练效率直接崩掉。”
这不是普通的推理部署,是算力密集型训练任务。Myle Ott的评价是:
“Google Cloud让我们用创纪录的速度跑起来,可靠性完全满足我们的要求。”
背景细节
Thinking Machines成立时间:大约14个月前,2025年初。
融资:2025年7月,完成20亿美元种子轮融资,估值120亿美元。种子轮拿20亿,在整个科技行业都很罕见,说明投资人对团队的信任程度超出常规判断。
团队现状:130人+。但面临一个挑战——Meta已经从Thinking Machines挖走了7名创始成员,其中包括Tinker的主力工程师。这个规模的人才流失在AI行业里算不小。
Nvidia那笔:今年3月,Thinking Machines和Nvidia达成另一个协议——购买超过1吉瓦量级的Vera Rubin GPU系统,Nvidia也直接投资进来。算力上,他们同时在向Google和Nvidia两边下注。
合同是非排他性的:他们可以继续用其他云服务商。但能拿到Google GB300的最早批次访问权,说明Google在主动争夺这个实验室。
顺便一提,这次Google Cloud Next上,Google同时宣布了和Anthropic及Meta的新合同——几家头部实验室一次性锁定,这是Google Cloud在抢AI计算市场的明显动作。
为什么这条路有意思
AI行业现在有两条主线在分叉:
一条是继续堆通用能力——训练更大的模型,追那些大盘子benchmark。
另一条是垂直微调——拿现有的开源模型,针对特定任务做强化,交付给企业用。Thinking Machines走的是后者。
商业逻辑在于:大多数企业其实不需要GPT-5,他们需要”能准确处理我们合同文件的模型”、”能通过我们内部代码审查标准的AI助手”。定制比通用更有说服力,尤其在数据安全要求高的行业。
如果Tinker能把RL微调这条路走顺,可能会成为企业AI技术栈里真正的基础层——不显眼,但很难绕过。
14个月的公司,拿了数十亿美元的Google算力合同,首席科学家是RL领域的核心人物。接下来他们发布什么,值得持续跟着看。
参考来源:Exclusive: Google deepens Thinking Machines Lab ties with new multibillion-dollar deal(TechCrunch);Google Cloud inks AI infrastructure deal with Thinking Machines(SiliconAngle);Thinking Machines Signs Multi-Billion Google GB300 Deal(Implicator.ai)