微软一口气掏出 7 个自家大模型,明说就是要少靠 OpenAI——推理款从零练、不蹭一点别人数据,编程追平 Claude Opus

微软给 OpenAI 砸了一百多亿美金,这事人尽皆知。但过去一两年,微软的小动作越来越明显——一边用着 OpenAI 的模型,一边在自己后院偷偷养了一支叫 MAI 的队伍。

这周的 Build 大会上,后院的东西端上桌了。微软一口气甩出 7 个自研模型,CEO Mustafa Suleyman 把话挑得很明白:这是为了”长期的自给自足”(long term self-sufficiency)。

翻译一下:以后少靠点 OpenAI。

最硬的一款:从零练,一点别人的数据都不蹭

7 个里最有看头的是 MAI-Thinking-1——微软第一个自己的推理模型。

关键不在参数,在出身。它是一个 350 亿激活参数的稀疏 MoE 模型,但真正的卖点是完全从零训练,零蒸馏。意思是它没偷看任何第三方模型的答案,全程只吃商业授权数据练出来。

这一点冲着谁,不用点名。市面上一堆模型被指偷偷蒸馏大厂的输出,微软这回等于公开立了块牌子:我这个是清清白白练出来的。

跑分也没让人失望:

  • AIME 2025 数学竞赛:97%
  • SWE-Bench Pro 编程:53% 上下,微软说在编程任务上追平了 Anthropic 的 Claude Opus 4.6
  • 更狠的是,微软请的独立人工评测方 Surge 做盲测,结果 MAI-Thinking-1 被评测员更偏爱,压过了 Claude Sonnet 4.6

一个从零起步、不蹭数据的模型,能在编程上摸到 Claude Opus 的水平——这个起点不低。目前它在 Microsoft Foundry 上私有预览。

编程那款,直接塞进 GitHub Copilot

另一款 MAI-Code-1,路线完全反过来——不拼参数,拼省。

它只有 50 亿参数,专门为效率优化,已经上了 GitHub Copilot 和 VS Code。挑这个时间点很有意思:Copilot 刚改成按 token 收费,开发者正为账单肉疼,微软顺势推一个又小又省的自家模型,算盘打得很精。

剩下几个也凑齐了一套:

模型 干什么 微软的说法
MAI-Image-2.5 画图,加了图生图 Flash 变体主打快
MAI-Transcribe-1.5 语音转写,撑到 43 种语言 转写效果压过谷歌和 OpenAI
MAI-Voice 语音合成,15 种语言 Voice to Flash 变体主打超低延迟

微软到底在打什么算盘

Suleyman 这次反复强调一句话:

“The type of AI that we create really does matter.”

讲人话就是——我们造什么样的 AI,本身就是件要紧事。配合”长期自给自足”那句,意思已经很透了。

但要看清这步棋,得注意一个细节:微软没去正面硬刚旗舰通用模型那条线。MAI 这一桌,挑的全是别人没吃透的边角——超低延迟语音、43 语种转写、又小又省的编程模型。它不跟 GPT-5.5、Claude Opus 抢”谁最聪明”的头衔,而是奔着”够用、够便宜、够听话”去的。

这个打法很微妙。微软心里清楚,跟 OpenAI 撕破脸不划算,那一百多亿还在账上。但把命脉全押在一家身上,更不划算。养一支自己的 MAI 队伍,相当于手里多攥一张牌——谈判桌上腰杆硬,真到哪天关系生变,自己也接得住。

所以这 7 个模型,与其说是来抢 OpenAI 饭碗的,不如说是微软给自己上的一道保险。

能不能真的”自给自足”,光靠几个跑分还说不准。但微软已经把姿态摆出来了:那个只会乖乖用 OpenAI 模型的微软,翻篇了。

参考来源:Microsoft's MAI Models at Build 2026(The AI Economy);Microsoft Build 2026: MAI-Thinking-1 Is First In-House Reasoning Model, Trained Without OpenAI Data(TechTimes);Microsoft unveils seven homegrown AI models in bid for 'long term self-sufficiency'(GeekWire)