DeepSeek 2026-04-13 DeepSeek V3.2把注意力改成稀疏的:推理成本直接砍一半,MIT开源 去年九月底,DeepSeek悄悄放出了V3.2,没有大张旗鼓,但这个版本搞了一个挺有意思的架构变动。 V3.2的核心改动不是参数规模,而是注意力机制。他们做了一个叫**DeepSeek Sparse Attention(DSA)**的东西,