DeepSeek一周吞6万亿token，挤GPT-5.5至第15 - News

先说个拧巴的画面：美国企业的 IT 负责人，一边在合规群里转发「别用中国模型」的警告，一边把公司信用卡绑到了 DeepSeek 的 API 上。

这不是段子。6 月 7 日 The Decoder 援引 Ramp 的数据，把这事摆到了台面上。

谁在涨：DeepSeek 冲到了 Ramp 榜首

Ramp 的 AI 支出指数盯着 5 万多家美国公司的真实刷卡记录，比问卷调查实在得多——钱花没花、花给谁，账单上写得清清楚楚。

6 月这版，涨得最猛的软件供应商里，DeepSeek 排第一。注意措辞：是「涨得最猛」，不是「用得最多」。整体最快增长的供应商榜首，还是 Anthropic。

有意思的是绝对盘子其实很小。真正直接掏钱用 DeepSeek 的美国公司，占比只有 0.1%。而且这数字一年多前（2025 年 1 月）反而更高，到过 0.3%。

我的读法是：2025 年初 R1 那一波把尝鲜的人冲上来过一次，热度退了又掉下去；现在是 V4 靠价格把第二波点着了。看的是斜率，不是当下那个还很小的数。

增长从哪来：不是聊天，是 agent 在烧 token

OpenRouter 那边的数字更能说明问题。

过去一周，DeepSeek V4 Flash 直接干到调用量第一，周环比涨 48%。DeepSeek 三个主力模型加一块儿，一周处理了将近 6 万亿 token。

对比一下：OpenAI 的旗舰 GPT-5.5 掉到了第 15，470 亿 token。差了一个数量级还不止。

为什么突然这么能吃 token？VentureBeat 给的解释是，大家不再拿模型当一问一答的聊天机器人了。真正在烧量的，是那些一跑好几个小时的 agent——在代码库和数据湖里一遍遍递归，工具调用一串接一串，长上下文反复重读。token 消耗是指数级往上走的。

而这种「按量付费、跑得越久越贵」的活，谁便宜就用谁。

价格才是那道护城河上的缺口

DeepSeek V4 Flash 的报价摆出来：每百万 input token 约 0.098 美元，output 约 0.197 美元，上下文窗口 100 万 token。

一位分析师的原话是：

“the performance gap certainly is far smaller than the price gap.”

讲人话就是——性能差距没多大，价格差距是真大。

这也是为什么连企业自建推理栈的比例都在涨：用 vLLM、Ray、Triton、Kubernetes 自己托管开源模型的公司，从 11.3% 涨到了 17.9%。开源权重加便宜，凑一块儿，企业的算盘就打得动了。

风险摆在那，钱照样打

Ramp 的首席经济学家把话挑明了：

“US companies are paying Deepseek directly and sending data through its platform.”

美国公司在直接给 DeepSeek 付钱，数据也是直接走它的平台。这句话后面，他点了安全和竞争上的两重风险。

但市场用脚投票。2025 年 12 月，Hugging Face 上热门新模型的下载量里，中国模型占了 44%。这不是某一家的偶然，是一整条开源线在往上顶。

所以这事的看点，不在 0.1% 这个还很小的数字，而在它背后的逻辑变了。当 token 变成像电费一样按度计的成本，企业选模型就跟选电价一个道理——谁稳、谁便宜用谁，牌子值几个钱？

这道题，DeepSeek 已经先替市场答了一半。

参考来源：CocoLoop、DeepSeek topped Ramp's trending software vendors in June 2026（The Decoder）；How DeepSeek's radical architecture is shattering Silicon Valley's token moat（VentureBeat）