微软给 OpenAI 砸了一百多亿美金,这事人尽皆知。但过去一两年,微软的小动作越来越明显——一边用着 OpenAI 的模型,一边在自己后院偷偷养了一支叫 MAI 的队伍。
这周的 Build 大会上,后院的东西端上桌了。微软一口气甩出 7 个自研模型,CEO Mustafa Suleyman 把话挑得很明白:这是为了”长期的自给自足”(long term self-sufficiency)。
翻译一下:以后少靠点 OpenAI。
最硬的一款:从零练,一点别人的数据都不蹭
7 个里最有看头的是 MAI-Thinking-1——微软第一个自己的推理模型。
关键不在参数,在出身。它是一个 350 亿激活参数的稀疏 MoE 模型,但真正的卖点是完全从零训练,零蒸馏。意思是它没偷看任何第三方模型的答案,全程只吃商业授权数据练出来。
这一点冲着谁,不用点名。市面上一堆模型被指偷偷蒸馏大厂的输出,微软这回等于公开立了块牌子:我这个是清清白白练出来的。
跑分也没让人失望:
- AIME 2025 数学竞赛:97%
- SWE-Bench Pro 编程:53% 上下,微软说在编程任务上追平了 Anthropic 的 Claude Opus 4.6
- 更狠的是,微软请的独立人工评测方 Surge 做盲测,结果 MAI-Thinking-1 被评测员更偏爱,压过了 Claude Sonnet 4.6
一个从零起步、不蹭数据的模型,能在编程上摸到 Claude Opus 的水平——这个起点不低。目前它在 Microsoft Foundry 上私有预览。
编程那款,直接塞进 GitHub Copilot
另一款 MAI-Code-1,路线完全反过来——不拼参数,拼省。
它只有 50 亿参数,专门为效率优化,已经上了 GitHub Copilot 和 VS Code。挑这个时间点很有意思:Copilot 刚改成按 token 收费,开发者正为账单肉疼,微软顺势推一个又小又省的自家模型,算盘打得很精。
剩下几个也凑齐了一套:
| 模型 | 干什么 | 微软的说法 |
|---|---|---|
| MAI-Image-2.5 | 画图,加了图生图 | Flash 变体主打快 |
| MAI-Transcribe-1.5 | 语音转写,撑到 43 种语言 | 转写效果压过谷歌和 OpenAI |
| MAI-Voice | 语音合成,15 种语言 | Voice to Flash 变体主打超低延迟 |
微软到底在打什么算盘
Suleyman 这次反复强调一句话:
“The type of AI that we create really does matter.”
讲人话就是——我们造什么样的 AI,本身就是件要紧事。配合”长期自给自足”那句,意思已经很透了。
但要看清这步棋,得注意一个细节:微软没去正面硬刚旗舰通用模型那条线。MAI 这一桌,挑的全是别人没吃透的边角——超低延迟语音、43 语种转写、又小又省的编程模型。它不跟 GPT-5.5、Claude Opus 抢”谁最聪明”的头衔,而是奔着”够用、够便宜、够听话”去的。
这个打法很微妙。微软心里清楚,跟 OpenAI 撕破脸不划算,那一百多亿还在账上。但把命脉全押在一家身上,更不划算。养一支自己的 MAI 队伍,相当于手里多攥一张牌——谈判桌上腰杆硬,真到哪天关系生变,自己也接得住。
所以这 7 个模型,与其说是来抢 OpenAI 饭碗的,不如说是微软给自己上的一道保险。
能不能真的”自给自足”,光靠几个跑分还说不准。但微软已经把姿态摆出来了:那个只会乖乖用 OpenAI 模型的微软,翻篇了。
参考来源:Microsoft's MAI Models at Build 2026(The AI Economy);Microsoft Build 2026: MAI-Thinking-1 Is First In-House Reasoning Model, Trained Without OpenAI Data(TechTimes);Microsoft unveils seven homegrown AI models in bid for 'long term self-sufficiency'(GeekWire)