阿里把模型扔到自家芯片上跑了 35 小时——让它自己写驱动,结果跑出 10 倍提速
5 月 20 日,杭州云栖大会,阿里端了三盘菜上来——一颗芯片、一个模型、一台机柜。 但真正让人记住这场发布会的,是一段 35 小时的演示。 这场演示干了一件反直觉的事阿里把刚发布的 Qwen3.7-Max 模型,放到刚发布的 Zhenwu
共 7 篇文章
5 月 20 日,杭州云栖大会,阿里端了三盘菜上来——一颗芯片、一个模型、一台机柜。 但真正让人记住这场发布会的,是一段 35 小时的演示。 这场演示干了一件反直觉的事阿里把刚发布的 Qwen3.7-Max 模型,放到刚发布的 Zhenwu
4月20日,Alibaba发布了Qwen系列有史以来性能最强的模型——Qwen3.6-Max-Preview。 说悄悄,是因为这次没有大张旗鼓的开源庆典,没有Apache协议公告,也没有欢迎下载、商业免费的旗帜。Qwen3.6-Max只在Q
4月16日,阿里Qwen团队把Qwen3.6-35B-A3B开源了,Apache 2.0协议,没有任何商用限制。 这个模型有点意思:总参数35B,但推理时只激活3B。用了混合专家(MoE)架构,12:1的计算稀疏比——在效果上接近35B大模
4月2号,阿里发布了Qwen3.6-Plus。 这次不是”更大的模型”那种常规发布,而是专门针对企业级AI Agent场景的一次定向升级。从产品定位看,阿里这次想明白了一件事:通用能力军备竞赛跑不赢,那就去做”真正能进生产环境干活”的执行层
今年2月17号,阿里在农历新年前夕放出了Qwen3.5——397B参数的开放权重模型,语言支持从82种直接拉到了201种。 主要升级原生多模态:文本、图片、视频在同一个模型里处理,不是外挂的adapter方案。这和Llama 4的early
Qwen3系列里最有技术含量的设计之一是混合推理模式——同一个模型内置了thinking和non-thinking两种工作状态。 怎么工作的 Thinking mode:模型会先生成一段内部推理过程(类似Chain-of-Thought),
阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,