Vertex AI改名了:Google把整个云改造成了Agent平台,还把TPU拆成了训练/推理两条线

Google Cloud Next ‘26开了三天,最大的信号其实就一句话:Vertex AI这个名字不再用了,新名字叫Gemini Enterprise Agent Platform

听起来只是改名,但Google这次把整个产品线、整个硬件路线、甚至整个云服务的卖法,都重新围着”agent”这个核心做了一遍。

Vertex AI变成了什么

Gemini Enterprise Agent Platform不是Vertex AI的简单换皮,是被重写成了一个专门跑agent的全栈平台

里面接了200多个模型——Google自家的Gemini 3.1 Pro、Flash Image、Lyria 3、Gemma 4,还把Anthropic的Claude Opus、Sonnet、Haiku也直接挂了上来。这点其实挺微妙:Google一边在Anthropic投了400亿美金,一边把Claude当作和自家Gemini平起平坐的选项放在企业产品里。

平台本身的组件,按Google的说法是覆盖agent全生命周期:

  • Agent Studio — 开发环境
  • Agent Development Kit — SDK
  • Agent Runtime — 运行时
  • Agent-to-Agent Orchestration — 多agent协作
  • Agent Gateway — 流量和访问控制
  • Agent Identity — 身份认证
  • Agent Registry — 注册中心
  • Agent Observability — 可观测性
  • Agent Simulation / Evaluation — 仿真和评测

熟悉这套话术的会发现:Google基本是把过去十年云原生那套(Service Mesh、API Gateway、Identity等等)原样搬到了agent上。一句话:把agent当做一种新的服务形态来管。

TPU这次彻底拆成两条线了

硬件这边,第八代TPU正式发布,但没有像前几代一样出一颗”通用”芯片,而是把训练和推理拆成了两条产品线

TPU 8t(训练版):

  • 单个superpod扩展到9,600颗芯片
  • 共享内存2 PB
  • 算力121 ExaFlops
  • 每个pod算力是上代的近3倍
  • 存储访问速度是上代的10倍

TPU 8i(推理版):

  • 片上SRAM翻三倍
  • 互联带宽翻倍到19.2 Tb/s
  • 每美元性能提升80%

这个拆分背后的判断挺清楚:训练和推理对硬件的需求已经分叉太大了。训练要的是堆超大共享内存做分布式优化,推理要的是低延迟、高互联、高片上缓存。再用一颗芯片同时讨好两边,不划算。

英伟达那边其实也走过类似的路(H100/H200和L40S的分化),但Google直接把这件事写进TPU的世代命名里,态度更果断。

把整个数据中心重新做了一遍

支撑这个新TPU的是个叫Virgo Network的新数据中心架构:

  • 一张网链接13.4万颗TPU 8t
  • 非阻塞带宽47 Pb/s
  • 每颗TPU 8t能用到的带宽是上代的4倍
  • 未加载延迟降低40%

47 Pb/s这个数字什么概念?大致相当于把全球互联网核心节点的总带宽塞进一个数据中心。

软件那一层还在卷成本

光卷硬件不够,软件层这次也是一刀刀往运行成本上砍:

  • GKE Agent Sandbox:每秒启动300个沙箱,每美元性能提升30%
  • BigQuery fluid scaling:平均成本降低34%
  • Lightning Engine for Apache Spark:每美元性能翻倍
  • Managed Lustre:吞吐最高10 TB/s
  • M4N虚拟机系列:跑Oracle负载,TCO降低20%以上

数据层和编排层这套打法,瞄准的是企业里那些**”用不起Vertex AI但又必须做AI”**的传统业务负载。

这步棋下得有多大

Google Cloud Next过去几年的发布会,每次都有”AI”,但这次明显不一样:

  • 名字改了——从工具型平台(Vertex AI)变成应用平台(Agent Platform)
  • 芯片拆了——训练推理分家,是产品线级别的押注
  • 数据中心重做了——Virgo是从底层架构推倒重来
  • 卖点换了——以前卖”AI能力”,现在卖”agent生命周期管理”

这背后的判断是:未来云上的工作负载,主体不再是人写的代码,而是agent跑的任务。如果这个判断对,那云厂商的所有产品都需要重新围绕agent设计;如果错,Google等于把至少两年的研发预算押在了一个错的方向上。

AWS还没出招(re:Invent要等年底)、Azure这边Microsoft Fabric MCP上个月也动了。但Google这次的狠在于一次性把硬件、网络、平台、商业化模型都重新拼了一遍。

熟悉云这一行的都知道:芯片世代和数据中心架构,做错了要回头三年起步。Google敢这么压,对自己的agent路线是真的有信心。

参考来源:Google Cloud Next '26: Gemini Enterprise Agent Platform Leads AI-Centric News(Virtualization Review);Google Cloud Next made it clear: AI is coming for everything(The Register);Google Cloud Next 2026: News and updates(Google官方博客)