DeepSeek 2026-04-07 DeepSeek训练大模型到底怎么做到这么省钱的 DeepSeek在成本控制上的水平已经成了行业传说级别的存在: V3训练成本:约$550万 R1 GPU使用费:约$29.4万 同期美国公司训类似规模模型的预算是**$1亿到$10亿**。差了至少一个数量级。 省钱秘诀1. FP8混合精度训