Mistral发了Workflows:用Netflix和Stripe同款底座,把ASML们的AI流程拽进生产环境
四月二十八号,Mistral扔出来一个不那么性感的产品:Workflows,公开预览。 这玩意儿不是模型,不是聊天机器人,甚至不能直接给你写代码。它是个企业AI的编排层——专门解决一个被忽略很久的问题:模型再聪明,跑不进生产就是个demo。
共 10 篇文章
四月二十八号,Mistral扔出来一个不那么性感的产品:Workflows,公开预览。 这玩意儿不是模型,不是聊天机器人,甚至不能直接给你写代码。它是个企业AI的编排层——专门解决一个被忽略很久的问题:模型再聪明,跑不进生产就是个demo。
先上这个数字:SWE-bench Pro 53.5 vs 50.9。 前者是Qwen3.6-27B,27B参数,4月22日刚开源,Apache 2.0协议。后者是Qwen3.5-397B,397B参数,混合专家架构(MoE),阿里之前的主力
今天(4月24日),DeepSeek发布了V4。 Bloomberg的标题是「一年后再次颠覆硅谷」。有没有这么夸张暂且不说,但这次确实是两件事一起发: V4-Pro:1.6万亿总参数,激活49B,支持100万token上下文 V4-Flas
4月20日,Alibaba发布了Qwen系列有史以来性能最强的模型——Qwen3.6-Max-Preview。 说悄悄,是因为这次没有大张旗鼓的开源庆典,没有Apache协议公告,也没有欢迎下载、商业免费的旗帜。Qwen3.6-Max只在Q
4月7日,Z.ai(原智谱AI)发布了GLM-5.1,754B参数,MoE架构,MIT协议开源。 跑分结果:SWE-Bench Pro 58.4%,全球第一。GPT-5.4是57.7%,Claude Opus 4.6是57.3%。 光这个数
量子计算机有个让工程师头疼的老问题:校准。一台量子处理器(QPU)每跑一段时间,量子比特之间的相干性就会漂移,需要重新校准。人工校准少则几天,多则一周,这还是在有丰富经验的团队情况下。 英伟达在4月14日给这个问题丢出了一个新方案:NVID
Arcee AI是家只有26个人的小公司,但他们刚做了一件让圈子里很多人吃惊的事:花了公司大约一半的风险投资,2000万美元,用2048块英伟达B300 GPU跑了33天,训出了一个400亿参数的开源推理模型——Trinity-Large-
3月26日,Mistral发布了Voxtral TTS,它们的第一个语音模型。 4B参数,开放权重,人工评测自然度超过ElevenLabs Flash v2.5,API定价0.016美元/千字,可以直接跑在自己的服务器上——这是这
3月16日,Mistral发布了Small 4,一个看起来平平无奇的名字,背后藏着一个挺实用的产品思路——用MoE架构把原来三款独立模型全部揉进一个里面,一次部署搞定所有场景。 一个模型,三个用途Mistral之前有三款各司其职的模型: M
3月22日,Cursor悄悄出了一个新模型 Composer 2,宣传语是frontier-level coding intelligence(前沿级编程智能)。没过多久,一位叫 Fynn 的 X 用户把话说穿了:这东西基本上就是 Kimi