黄仁勋这次端出来的是美国最强的开源大模型。结果跑分一对比,还是输给了中国。
6 月 1 日 Computex 台北的主题演讲上,英伟达发布了 Nemotron 3 Ultra,一个 5500 亿参数的开源模型。官方话术拉满,但有个数字它没法回避:在第三方机构 Artificial Analysis 的智能指数榜上,Ultra 拿了 48 分,而四月就发布的中国模型 Kimi K2.6 是 54 分。
美国开源最强的牌,还是没摸到中国的天花板。
黄仁勋端出来的是什么
先说硬参数,这模型确实是英伟达开源里最能打的一个:
- 5500 亿总参数,激活 550 亿——MoE 架构,跑一次只点亮其中一小部分
- 100 万 token 上下文
- 每秒吐 300 多个 token,速度拉满
- 号称比同档对手便宜 30%、推理快 5 倍
架构上是个混搭:Mamba-2 层 + Transformer 注意力 + MoE 路由 + 多 token 预测拼到一起。简单说,就是把这两年提速降本的招数一锅烩了,目标就一个——同样的智能水平,跑得更快、更省。
模型 6 月 4 日上架,HuggingFace、ModelScope、OpenRouter 都能下能调,build.nvidia.com 上还包了一层 NIM 微服务。
跑分表摊开看
英伟达自己在台上把 Ultra 跟一堆模型摆一起比,但真按第三方智能指数排,名次是这样的:
| 模型 | 出品方 | 智能指数 |
|---|---|---|
| Kimi K2.6 | Moonshot(中国) | 54 |
| Nemotron 3 Ultra | 英伟达(美国) | 48 |
| Gemma 4 31B | 39 | |
| Nemotron 3 Super | 英伟达 | 36 |
| GPT-OSS-120B | OpenAI | 33 |
看出门道了吗?这张表里最强的开源模型来自中国,而且不是险胜——54 对 48,差了整整 6 分。Kimi K2.6 四月发布,现在在全球所有模型(含闭源)里排第四。
英伟达这边能拿出手的两张开源牌,48 和 36;OpenAI 的 GPT-OSS-120B,33 分垫底。
美国开源,怎么就落到这一步
这事的尴尬,不在某一个分数,在背后的格局。
中国这边,DeepSeek、Moonshot、阿里、智谱一个接一个把旗舰级能力直接开源扔出来,谁都能下、谁都能跑。美国这边反过来——最能打的模型全锁在付费墙后面,GPT-5.5、Claude、Gemini 这些顶配,开源社区一个都摸不到。开放出来的,往往是降了一档的版本。
结果就是:论开源权重的天花板,中国实验室一路领跑,美国在后面追。
英伟达显然不想认这个。它砸了 260 亿美元搞开源计划,Nemotron 全系连训练数据都往外公开,摆明了是要把”美国开源也能打”这件事重新立起来。Ultra 这次冲到 48 分,已经是这套打法目前的最好成绩。
但 48 还是没够到 54。
结尾
把芯片卖给全世界训模型的英伟达,自己下场做开源模型,本身就是个有意思的信号——它不想只当卖铲子的,也想在模型这层有话语权。
只是这一仗的对手,恰好是用着受限芯片、还能把开源跑分压它一头的中国团队。
英伟达追上那 6 分,要多久?这个故事,下一个版本号见分晓。
参考来源:Nvidia Releases Its Best Open AI Model Yet—But Still Lags Behind China(Decrypt);Nemotron 3 Ultra announced: high-speed, leading US open weights intelligence(Artificial Analysis);Nvidia CEO Jensen Huang launches Nemotron 3 Ultra AI model at Computex 2026(Crypto Briefing);NVIDIA Computex 2026: Complete Recap(explainx.ai)