270亿参数打赢了3970亿MoE:Qwen3.6-27B开源,靠的是把推理过程记下来
先上这个数字:SWE-bench Pro 53.5 vs 50.9。 前者是Qwen3.6-27B,27B参数,4月22日刚开源,Apache 2.0协议。后者是Qwen3.5-397B,397B参数,混合专家架构(MoE),阿里之前的主力
共 5 篇文章
先上这个数字:SWE-bench Pro 53.5 vs 50.9。 前者是Qwen3.6-27B,27B参数,4月22日刚开源,Apache 2.0协议。后者是Qwen3.5-397B,397B参数,混合专家架构(MoE),阿里之前的主力
4月22日,Qwen团队在Hugging Face发了个新模型。27B参数,Dense架构,Apache 2.0协议,叫Qwen3.6-27B。 发布博文里,他们把benchmark分数列了出来。SWE-bench Verified:77.
Qwen3.5 小型模型系列刚发布24小时,阿里 AI 实验室的核心就散了。 谁走了3月5日,主导阿里 Qwen 系列模型从零到全球600多万次下载的首席 AI 研究员**林俊阳(Junyang Lin)**宣布辞职。出走的不止他一人: 惠
3月30日,阿里Qwen团队丢出了Qwen3.5-Omni,这是他们第一个真正意义上的全模态模型——文字、图片、音频、视频全部塞进同一个模型里处理,不是那种把几个专门模型拼在一起的拼接式架构。 一个模型,四种模态之前市面上的多模态系统大多是
阿里云在4月初发了Qwen3.6 Plus,官方定位是”面向企业的Agentic AI”。放到一堆大模型发布公告里可能显得平平无奇,但仔细看技术细节和基准测试,还是有几个值得认真对待的地方。 1M上下文,专门为仓库级代码分析设计Qwen3.