DeepSeek第一次向外部要钱了:拒绝VC三年后,梁文峰开口了

DeepSeek要融资了。

这件事在AI圈的冲击感,可能不亚于任何一次技术发布。因为「不接受外部投资」一直是DeepSeek最重要的标签之一——梁文峰拒绝过红杉、拒绝过GGV、拒绝过国内几乎所有知名VC,连一些国资背景的基金也被婉拒了。

The Information本周报道,DeepSeek正在寻求首轮外部融资,目标金额至少3亿美元,估值超过100亿美元。消息来源是四位匿名知情人士。

为什么是现在

这个时间节点不是随机选的。

V4快来了。 DeepSeek V4预计本月底发布。参数量预计跳到万亿级别,上下文窗口最长100万token。训练和部署这个规模的模型需要巨额算力投入——即使是出了名会省钱的DeepSeek,也得真金白银扔进去。

华为迁移要钱。 DeepSeek正在把基础设施从英伟达芯片迁移到华为昇腾——这不是换个硬件那么简单,是从底层重新优化一套软件栈,工程成本相当高。

数据中心要扩。 内蒙古乌兰察布的新数据中心正在规划,服务器、网络、电力,每项都是钱。

留住人要钱。 DeepSeek靠接近学术界的薪酬水平吸引顶尖研究员,但市场行情变了。字节、阿里、腾讯的AI薪资包已经到了一个很高的位置,DeepSeek需要更多弹药来留人。

所有这些叠在一起,幻方量化的自有资金已经不够用了。

这对DeepSeek的运作方式意味着什么

DeepSeek以前的逻辑很清晰:母公司提供资金,研究团队专注技术,不对外部投资人负责,所以可以做很多「不考虑短期商业化」的决策——比如把模型直接开源,不收API费用或象征性收费。

引入外部资金,这个逻辑开始动摇。即使只有3亿美元,投资人也会带来预期、KPI和增长压力。这些东西和DeepSeek目前运作方式的兼容性,是一个真实的问题。

梁文峰当然清楚这一点。他选择在V4即将发布、公司处于最高谈判筹码的时间节点去融资,而不是等到「快撑不住了再说」,这本身是一种主动管理节奏的姿态。主动的意思是:条件可以谈,进来的人是我选的。

100亿美元估值:这个数字合不合理

DeepSeek没有公开财务数据,比较只能横向参考:

公司 最新估值 业务性质
DeepSeek >$10B 基础模型研究 + API
Mistral ~$6B 欧洲开源模型
Cohere ~$5.5B 企业AI API
智谱AI ~$3B 国内企业服务

10亿美元对一个没有大规模商业收入的研究机构来说不低,但DeepSeek的技术品牌——V3、R1的全球影响力——和即将发布的V4,给了这个估值足够的支撑。

真正的问题是谁会进来。中国VC市场对AI基础模型的态度已经高度分化:头部机构要么早就押了竞争对手,要么在等一个更清晰的商业化路径才敢出手。外资在中国AI领域的投资也受到多方面限制。

DeepSeek融资这件事,比「融了多少钱」更有意思的部分,是「最终是谁进来了」。

等V4发布之后,这个答案大概就会浮出水面。

参考来源:DeepSeek reportedly launches first funding round at over $10 billion valuation(CnTechPost / The Information);DeepSeek seeks outside funding for the first time at a $10B valuation(Tech Funding News)