Cohere 这两年一直在企业和”主权 AI”那条线上闷头跑:模型卖给政府和大客户,部署在人家自己机房,数据不出门。前阵子它把 218B 的旗舰 Command A+ 用 Apache 2.0 开源,押的也是这套叙事。
6 月 9 日,它把手伸向了一个过去基本没碰的市场——AI 编程和开发者。
Cohere 放出 North Mini Code,自己定义为”第一个面向开发者的模型”,也是它第一个专攻 agentic 编程的模型。这一步,等于把它一直缺的那块短板补上了。
这次走的是”小而本地”
跟上回那个 218B 的大块头不同,North Mini Code 主打一个小:
| 规格 | North Mini Code |
|---|---|
| 参数 | 30B 总参 / 3B 激活(MoE 架构) |
| 上下文 | 256K |
| 最大输出 | 64K |
| 最低硬件 | 单张 H100(FP8) |
| 许可证 | Apache 2.0 |
| 智能指数 | 27.6(Artificial Analysis) |
| 编程指数 | 33.4(Artificial Analysis) |
关键在”3B 激活”。30B 的总盘子,每次只点亮其中 3B 干活,推理成本压得很低——低到一张 H100 就能跑起来。Command A+ 还要两张卡,这个砍到一张,等于又往”单机本地能跑”的方向挪了一截。
Cohere 自测甩了两个数:输出吞吐是 Devstral Small 2 的 2.8 倍,吐字(inter-token)延迟低 30%。它瞄的活也说得很具体——代码生成、agentic 软件工程、终端任务。
为什么是补短板
Cohere 的画像几年来很固定:联合创始人里有 Transformer 论文的作者,主打企业级和”主权 AI”,帮政府大企业把 AI 部署在境内。它有渠道、有合规叙事,但一直有两个窟窿——产品几乎不面向单个开发者,模型也没专门为编程练过。
这两年 AI 编程是最烧钱、最能拉用户的赛道之一。Claude Code、Cursor、Copilot 把开发者这块市场炒得火热,Cohere 此前基本是缺席的。
North Mini Code 就是冲这个缺口去的。把它的老本行——本地部署、Apache 2.0、不锁定——挪到编程场景,给那些”数据不能出境、但又想用 AI 写代码”的政府和企业一个本地选项。
别误会,它不是来抢第一的
得说句实话:27.6 的智能指数,在今天的牌桌上不算高。同期 MiniMax M3 是 55,差着一截。
但 North Mini Code 卖的本来就不是”最强”。它卖的是另一套逻辑:够小,能塞进单卡;够开放,Apache 2.0 随你改随你商用;够本地,数据全程不出你的机房。对那些”性能够用就行、算力和数据必须自己攥着”的客户,这套组合拳比多刷十分跑分实在。
渠道也铺得广:Hugging Face 下权重、Cohere API、自家 Model Vault 托管推理、OpenRouter、OpenCode,都能直接试。
一句话收尾
头部几家在比谁的旗舰更聪明,Cohere 走的是另一条路——做小、做本地、做能落进政府机房的那一档。
这回把这条路延伸到了编程。赌的还是同一件事:等真到了要把 AI 搬进自己机房的那天,”能不能本地跑、数据出不出门”,会比跑分榜上多几分更值钱。
参考来源:North Mini Code: Agentic Coding Model for Developers(Cohere Blog);North Mini Code: Cohere's small coding-focused MoE model(Artificial Analysis);Introducing North Mini Code: Cohere's First Model For Developers(Hugging Face);Cohere releases North Mini Code, a 30B parameter open-source coding model(Crypto Briefing)