News - Cocoloop - AI前沿资讯与深度分析

阿里今年把Qwen3全系列模型用Apache 2.0协议开源了，从0.6B到235B一共8个尺寸，全线开放。为什么Apache协议很重要？Apache 2.0基本上是最宽松的开源协议之一，意味着企业可以免费商用，不用额外谈授权。对比之下，

去年7月，月之暗面直接开源了Kimi K2——一个万亿参数的MoE大模型，每个token只激活32B参数。架构亮点总参数：1万亿每token激活：32B 训练数据：约15.5万亿token 上下文：128K（后续升级到256K）优化

今年1月，DeepSeek把R1推理模型直接开源了，社区的反应很直接：没想到开源这边已经卷到这个程度了。先看硬指标： AIME数学竞赛：77.5分 MATH-500：96.2分 Codeforces编程：94百分位 MMLU：0.849

去年12月DeepSeek发布了V3，这个模型最让同行坐不住的地方不是性能——而是成本。先看架构V3的设计核心是Mixture of Experts：总参数量：671B 每个token实际激活：37B 每层256个专家，每次选8个就好

#开源