先说个拧巴的画面:美国企业的 IT 负责人,一边在合规群里转发「别用中国模型」的警告,一边把公司信用卡绑到了 DeepSeek 的 API 上。
这不是段子。6 月 7 日 The Decoder 援引 Ramp 的数据,把这事摆到了台面上。
谁在涨:DeepSeek 冲到了 Ramp 榜首
Ramp 的 AI 支出指数盯着 5 万多家美国公司的真实刷卡记录,比问卷调查实在得多——钱花没花、花给谁,账单上写得清清楚楚。
6 月这版,涨得最猛的软件供应商里,DeepSeek 排第一。注意措辞:是「涨得最猛」,不是「用得最多」。整体最快增长的供应商榜首,还是 Anthropic。
有意思的是绝对盘子其实很小。真正直接掏钱用 DeepSeek 的美国公司,占比只有 0.1%。而且这数字一年多前(2025 年 1 月)反而更高,到过 0.3%。
我的读法是:2025 年初 R1 那一波把尝鲜的人冲上来过一次,热度退了又掉下去;现在是 V4 靠价格把第二波点着了。看的是斜率,不是当下那个还很小的数。
增长从哪来:不是聊天,是 agent 在烧 token
OpenRouter 那边的数字更能说明问题。
过去一周,DeepSeek V4 Flash 直接干到调用量第一,周环比涨 48%。DeepSeek 三个主力模型加一块儿,一周处理了将近 6 万亿 token。
对比一下:OpenAI 的旗舰 GPT-5.5 掉到了第 15,470 亿 token。差了一个数量级还不止。
为什么突然这么能吃 token?VentureBeat 给的解释是,大家不再拿模型当一问一答的聊天机器人了。真正在烧量的,是那些一跑好几个小时的 agent——在代码库和数据湖里一遍遍递归,工具调用一串接一串,长上下文反复重读。token 消耗是指数级往上走的。
而这种「按量付费、跑得越久越贵」的活,谁便宜就用谁。
价格才是那道护城河上的缺口
DeepSeek V4 Flash 的报价摆出来:每百万 input token 约 0.098 美元,output 约 0.197 美元,上下文窗口 100 万 token。
一位分析师的原话是:
“the performance gap certainly is far smaller than the price gap.”
讲人话就是——性能差距没多大,价格差距是真大。
这也是为什么连企业自建推理栈的比例都在涨:用 vLLM、Ray、Triton、Kubernetes 自己托管开源模型的公司,从 11.3% 涨到了 17.9%。开源权重加便宜,凑一块儿,企业的算盘就打得动了。
风险摆在那,钱照样打
Ramp 的首席经济学家把话挑明了:
“US companies are paying Deepseek directly and sending data through its platform.”
美国公司在直接给 DeepSeek 付钱,数据也是直接走它的平台。这句话后面,他点了安全和竞争上的两重风险。
但市场用脚投票。2025 年 12 月,Hugging Face 上热门新模型的下载量里,中国模型占了 44%。这不是某一家的偶然,是一整条开源线在往上顶。
所以这事的看点,不在 0.1% 这个还很小的数字,而在它背后的逻辑变了。当 token 变成像电费一样按度计的成本,企业选模型就跟选电价一个道理——谁稳、谁便宜用谁,牌子值几个钱?
这道题,DeepSeek 已经先替市场答了一半。
参考来源:DeepSeek topped Ramp's trending software vendors in June 2026(The Decoder);How DeepSeek's radical architecture is shattering Silicon Valley's token moat(VentureBeat)