⚡ News · Cocoloop
首页 Claude GPT Gemini DeepSeek 开源模型 全部标签 归档

#开源

共 4 篇文章

Qwen 2026-04-07

Qwen3用Apache协议开源,阿里这步棋下得够大方

阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,

Kimi 2026-04-07

Kimi K2开源了一个万亿参数的MoE模型,国产开源卷出新高度

去年7月,月之暗面直接开源了Kimi K2——一个万亿参数的MoE大模型,每个token只激活32B参数。 架构亮点 总参数:1万亿 每token激活:32B 训练数据:约15.5万亿token 上下文:128K(后续升级到256K) 优化

DeepSeek 2026-04-07

DeepSeek R1开源之后,推理模型这条路被彻底跑通了

今年1月,DeepSeek把R1推理模型直接开源了,社区的反应很直接:没想到开源这边已经卷到这个程度了。 先看硬指标: AIME数学竞赛:77.5分 MATH-500:96.2分 Codeforces编程:94百分位 MMLU:0.849

DeepSeek 2026-04-07

DeepSeek V3:671B参数只激活37B,MoE架构的教科书级操作

去年12月DeepSeek发布了V3,这个模型最让同行坐不住的地方不是性能——而是成本。 先看架构V3的设计核心是Mixture of Experts: 总参数量:671B 每个token实际激活:37B 每层256个专家,每次选8个 就好

← 上一页 第 2 / 2 页

⚡ News · Cocoloop

AI前沿资讯与深度分析,覆盖大模型、开源社区、产业动态。每日自动抓取英文原版信息,由AI辅助二次创作为中文内容。

模型资讯

  • Claude
  • GPT / OpenAI
  • Gemini
  • DeepSeek
  • Qwen

主题

  • 开源模型
  • AI编程
  • Agent
  • 全部标签

站点

  • 首页
  • 文章归档
  • Sitemap
  • RSS 订阅
  • robots.txt

友情链接

  • Cocoloop 主站
  • 问答站
  • Hermes 指南

© 2026 News · Cocoloop — AI前沿资讯

部分内容由AI辅助整理,引用来源保留原文链接。转载请注明出处。