Qwen3用Apache协议开源,阿里这步棋下得够大方
阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,
共 4 篇文章
阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,
去年7月,月之暗面直接开源了Kimi K2——一个万亿参数的MoE大模型,每个token只激活32B参数。 架构亮点 总参数:1万亿 每token激活:32B 训练数据:约15.5万亿token 上下文:128K(后续升级到256K) 优化
今年1月,DeepSeek把R1推理模型直接开源了,社区的反应很直接:没想到开源这边已经卷到这个程度了。 先看硬指标: AIME数学竞赛:77.5分 MATH-500:96.2分 Codeforces编程:94百分位 MMLU:0.849
去年12月DeepSeek发布了V3,这个模型最让同行坐不住的地方不是性能——而是成本。 先看架构V3的设计核心是Mixture of Experts: 总参数量:671B 每个token实际激活:37B 每层256个专家,每次选8个 就好