美国公司嘴上喊「风险」,手却往 DeepSeek 账户里打钱——一周吞掉 6 万亿 token,把 GPT-5.5 挤到第 15

先说个拧巴的画面:美国企业的 IT 负责人,一边在合规群里转发「别用中国模型」的警告,一边把公司信用卡绑到了 DeepSeek 的 API 上。

这不是段子。6 月 7 日 The Decoder 援引 Ramp 的数据,把这事摆到了台面上。

谁在涨:DeepSeek 冲到了 Ramp 榜首

Ramp 的 AI 支出指数盯着 5 万多家美国公司的真实刷卡记录,比问卷调查实在得多——钱花没花、花给谁,账单上写得清清楚楚。

6 月这版,涨得最猛的软件供应商里,DeepSeek 排第一。注意措辞:是「涨得最猛」,不是「用得最多」。整体最快增长的供应商榜首,还是 Anthropic。

有意思的是绝对盘子其实很小。真正直接掏钱用 DeepSeek 的美国公司,占比只有 0.1%。而且这数字一年多前(2025 年 1 月)反而更高,到过 0.3%。

我的读法是:2025 年初 R1 那一波把尝鲜的人冲上来过一次,热度退了又掉下去;现在是 V4 靠价格把第二波点着了。看的是斜率,不是当下那个还很小的数。

增长从哪来:不是聊天,是 agent 在烧 token

OpenRouter 那边的数字更能说明问题。

过去一周,DeepSeek V4 Flash 直接干到调用量第一,周环比涨 48%。DeepSeek 三个主力模型加一块儿,一周处理了将近 6 万亿 token。

对比一下:OpenAI 的旗舰 GPT-5.5 掉到了第 15,470 亿 token。差了一个数量级还不止。

为什么突然这么能吃 token?VentureBeat 给的解释是,大家不再拿模型当一问一答的聊天机器人了。真正在烧量的,是那些一跑好几个小时的 agent——在代码库和数据湖里一遍遍递归,工具调用一串接一串,长上下文反复重读。token 消耗是指数级往上走的。

而这种「按量付费、跑得越久越贵」的活,谁便宜就用谁。

价格才是那道护城河上的缺口

DeepSeek V4 Flash 的报价摆出来:每百万 input token 约 0.098 美元,output 约 0.197 美元,上下文窗口 100 万 token。

一位分析师的原话是:

“the performance gap certainly is far smaller than the price gap.”

讲人话就是——性能差距没多大,价格差距是真大。

这也是为什么连企业自建推理栈的比例都在涨:用 vLLM、Ray、Triton、Kubernetes 自己托管开源模型的公司,从 11.3% 涨到了 17.9%。开源权重加便宜,凑一块儿,企业的算盘就打得动了。

风险摆在那,钱照样打

Ramp 的首席经济学家把话挑明了:

“US companies are paying Deepseek directly and sending data through its platform.”

美国公司在直接给 DeepSeek 付钱,数据也是直接走它的平台。这句话后面,他点了安全和竞争上的两重风险。

但市场用脚投票。2025 年 12 月,Hugging Face 上热门新模型的下载量里,中国模型占了 44%。这不是某一家的偶然,是一整条开源线在往上顶。

所以这事的看点,不在 0.1% 这个还很小的数字,而在它背后的逻辑变了。当 token 变成像电费一样按度计的成本,企业选模型就跟选电价一个道理——谁稳、谁便宜用谁,牌子值几个钱?

这道题,DeepSeek 已经先替市场答了一半。

参考来源:DeepSeek topped Ramp's trending software vendors in June 2026(The Decoder);How DeepSeek's radical architecture is shattering Silicon Valley's token moat(VentureBeat)