Tensormesh融资2000万美元，瞄准AI推理重复计算 - News

英伟达、AMD 和 CoreWeave 很少同时站到一张投资人名单上。Tensormesh 这轮融资之所以值得看，不是因为金额有多大，而是因为它切中了 AI 推理成本里最浪费的一块：重复计算。

5 月 27 日，Tensormesh 宣布完成 2000 万美元融资，投资方包括 AMD Ventures、英伟达旗下 NVentures、CoreWeave、Valley Capital Partners 和 Laude Ventures。算上此前融资，公司累计融资约 2450 万美元。

同一天，Tensormesh 也把旗下推理优化平台 Tensormesh Inference 推向正式商用。它要解决的问题很直接：模型在处理相似请求和长上下文任务时，常常会反复计算已经算过的中间结果，GPU 时间就这样被烧掉。

Tensormesh 的做法是把这些中间结果沉淀下来复用，行业里通常称为 KV cache。已经计算过的上下文直接调用，没算过的部分再继续计算。公司称，在合适场景下，这套方案可以把延迟和 GPU 开销最高降到原来的十分之一，一些客户部署中的缓存命中率超过 70%。

这件事在 Agent 场景里尤其重要。一个复杂任务往往要来回调用模型几十轮，前面的上下文会被不断带入后续请求。如果每一轮都从头计算，推理成本会被快速放大。KV 缓存的价值就在于，把这些重复上下文变成可管理、可复用的基础设施。

Tensormesh 并不是从零开始。它背后是开源项目 LMCache，GitHub 星标超过 8000，并已接入 vLLM、SGLang、TensorRT、NVIDIA Dynamo、AWS SageMaker 和 Oracle OCI 等生态。商用版本的意义，是把已经跑通的开源底座，包装成企业能直接部署和采购的服务。

对英伟达、AMD 和 CoreWeave 来说，这也是一笔逻辑清晰的投资。芯片厂和云厂都希望客户把推理跑得更便宜、更稳定，因为推理成本越可控，企业才越愿意把 AI 应用推到生产环境。Tensormesh 这类公司不是替代 GPU，而是在 GPU 之上提高利用效率。

过去一年，AI 基建的钱大多砸向更大的模型和更多的卡。Tensormesh 代表的是另一条线：在同样的模型和硬件上，先把浪费掉的算力省回来。随着 Agent 把推理量继续推高，这条“省钱”的基础设施赛道会越来越拥挤。

接下来要看的是，KV 缓存能否从单点优化变成企业推理栈里的标准层。如果这层标准被建立起来，Tensormesh 抢到的就不只是一次融资热度，而是 AI 应用时代的一个长期收费入口。

参考来源：Tensormesh Raises $20M from Investors Including AMD Ventures,CocoLoop、 CoreWeave, NVentures（Business Wire）；Tensormesh taps Nvidia, AMD and CoreWeave for funding to fix AI model memory problems（SiliconANGLE）