Cohere这次的牌打得不小。
5月20号,他们把旗舰模型Command A+开源了——Apache 2.0协议,权重全放Hugging Face,218B参数的MoE架构。这是Cohere第一个走Apache 2.0完全开源的旗舰模型。
为什么这事值得展开说?
Cohere过去两年的市场定位一直是”企业级AI”——客户是花旗、PwC、Oracle这种大公司。这种客户买AI模型有个共同诉求:我得能自己跑、自己改、自己控制数据。开源是这个诉求的天花板。把旗舰模型直接Apache 2.0放出来,等于Cohere把”主权AI”这张牌彻底押下去。
硬件门槛压到了两张H100
Command A+是个MoE模型——218B总参数,每次只激活25B。
激活的25B意味着推理成本只算这部分。Cohere给出的部署门槛:
- 一张B200就够跑
- 或者两张H100(W4A4量化)
- 16-bit BF16、8-bit FP8、4-bit W4A4三档量化都开源放Hugging Face
两张H100什么概念?现在主流大模型部署的起步价大概在4-8张H100之间,Command A+把这个数砍了一半还多,且按官方说法精度几乎无损(lossless quantization)。
对企业IT负责人来说,这是把采购单的GPU栏从两位数砍到个位数的差距——也是采购决策能不能过的关键阈值。
benchmark上跟自家旧版的对比
| 测试集 | Command A Reasoning(旧) | Command A+(新) |
|---|---|---|
| τ²-Bench Telecom | 37% | 85% |
| Terminal-Bench Hard 代码 | 3% | 25% |
| MMMU Pro | - | 63% |
| MathVista | - | 80.6% |
| Artificial Analysis Intelligence Index | - | 37 |
τ²-Bench Telecom从37%跳到85%、Terminal-Bench代码从3%跳到25%——这两个差距非常大,说明Cohere在agentic任务上做了一次大的架构调整,不是常规迭代。
Artificial Analysis综合得分37分,跟当前一线开源模型(Llama 4、Qwen 3.5那一档)差不多。但两张H100就能跑的部署门槛在这个分数段是稀缺的。
输出tokens/s比旧版快63%、首token延迟降17%——这两个数字是企业级Agent场景最关心的。
「主权AI」是什么
Cohere blog里说Command A+是为「sovereign critical infrastructure」造的。
“Sovereign AI”这词最近一年开始火,定义说白了就是——模型权重和数据都得能在我自己机房里跑,不依赖任何外部API、不出本地网络、不让任何第三方看到任何数据。
什么客户在乎这个?
- 中央银行
- 国防部
- 能源/电网公司
- 大型保险/养老金
- 受GDPR严格约束的欧洲企业
这批客户买AI最大障碍不是价格,是数据出不出门。OpenAI、Anthropic的API再便宜对他们都没用——只要API call要跨过自家防火墙,整笔生意就告吹。
Cohere押的就是这批人。富士通的高管Vivek Mahajan在Cohere公告里直接背书:
“Command A+’s mixture-of-experts architecture and strong agentic performance align well with our commitment to deliver innovative, sovereign AI solutions.”
富士通是日本政府重要IT供应商,对接的是日本各部委、金融机构、关键基础设施——他们站台不是给Cohere卖面子,是日本政府最近一年在反复强调”AI国产化”。
原生引用是个细节但很关键
Command A+有个功能藏在技术细节里,但企业场景下很值钱——native citations。
意思是:模型从外部工具/数据库里抓信息回答时,回答里会自动带上grounding spans——用特殊标签把每一句话直接挂到它引用的那个具体文档或数据库行上。
为什么这个事关键?
企业用Claude或者GPT做内部知识库问答,最大的麻烦是”AI给的答案对不对,能不能追溯到源头”。如果出错了,是模型瞎编的还是数据本身有问题?过去要靠外挂RAG系统手工绑引用。Cohere把这个能力做进模型本身,等于把审计追溯链做成了原生属性。
对法务、合规、审计部门来说,这是个能直接通过采购决策的功能。
跟谁抢生意
直白点说,Command A+不是来跟ChatGPT和Claude抢消费者市场的——那个仗Cohere本来就不打。
它要抢的是Llama的企业开源市场。
Meta的Llama 4虽然开源但有商业使用限制,超过一定规模的企业要单独谈授权。Command A+直接Apache 2.0——任意规模、任意场景、随便商业用。这个区别对企业IT负责人是巨大的。
至于这步棋能不能成?Cohere需要等下一份ARR数据。但2026年5月20号晚上,开源AI的牌桌上多了一个真正认真在打”主权AI”牌的玩家。
参考来源:Introducing Command A+(Cohere官方博客)/ Cohere cracks lossless quantization and native citations with first full Apache 2.0 licensed open model Command A+(VentureBeat)/ Cohere Releases Command A+: An Open-Source Enterprise AI Model Built for Sovereign Critical Infrastructure(Business Wire / Yahoo Finance)