⚡ News · Cocoloop
首页 Claude GPT Gemini DeepSeek 开源模型 全部标签 归档

#技术架构

共 1 篇文章

DeepSeek 2026-04-13

DeepSeek V3.2把注意力改成稀疏的:推理成本直接砍一半,MIT开源

去年九月底,DeepSeek悄悄放出了V3.2,没有大张旗鼓,但这个版本搞了一个挺有意思的架构变动。 V3.2的核心改动不是参数规模,而是注意力机制。他们做了一个叫**DeepSeek Sparse Attention(DSA)**的东西,

⚡ News · Cocoloop

AI前沿资讯与深度分析,覆盖大模型、开源社区、产业动态。每日自动抓取英文原版信息,由AI辅助二次创作为中文内容。

模型资讯

  • Claude
  • GPT / OpenAI
  • Gemini
  • DeepSeek
  • Qwen

主题

  • 开源模型
  • AI编程
  • Agent
  • 全部标签

站点

  • 首页
  • 文章归档
  • Sitemap
  • RSS 订阅
  • robots.txt

友情链接

  • Cocoloop 主站
  • 问答站
  • Hermes 指南

© 2026 News · Cocoloop — AI前沿资讯

部分内容由AI辅助整理,引用来源保留原文链接。转载请注明出处。