谷歌把 Vertex AI 改造成 Agent 平台 - News

Google Cloud Next ‘26开了三天，最大的信号其实就一句话：Vertex AI这个名字不再用了，新名字叫Gemini Enterprise Agent Platform。

听起来只是改名，但Google这次把整个产品线、整个硬件路线、甚至整个云服务的卖法，都重新围着”agent”这个核心做了一遍。

Vertex AI变成了什么

Gemini Enterprise Agent Platform不是Vertex AI的简单换皮，是被重写成了一个专门跑agent的全栈平台。

里面接了200多个模型——Google自家的Gemini 3.1 Pro、Flash Image、Lyria 3、Gemma 4，还把Anthropic的Claude Opus、Sonnet、Haiku也直接挂了上来。这点其实挺微妙：Google一边在Anthropic投了400亿美金，一边把Claude当作和自家Gemini平起平坐的选项放在企业产品里。

平台本身的组件，按Google的说法是覆盖agent全生命周期：

Agent Studio — 开发环境
Agent Development Kit — SDK
Agent Runtime — 运行时
Agent-to-Agent Orchestration — 多agent协作
Agent Gateway — 流量和访问控制
Agent Identity — 身份认证
Agent Registry — 注册中心
Agent Observability — 可观测性
Agent Simulation / Evaluation — 仿真和评测

熟悉这套话术的会发现：Google基本是把过去十年云原生那套（Service Mesh、API Gateway、Identity等等）原样搬到了agent上。一句话：把agent当做一种新的服务形态来管。

TPU这次彻底拆成两条线了

硬件这边，第八代TPU正式发布，但没有像前几代一样出一颗”通用”芯片，而是把训练和推理拆成了两条产品线。

TPU 8t（训练版）：

单个superpod扩展到9,600颗芯片
共享内存2 PB
算力121 ExaFlops
每个pod算力是上代的近3倍
存储访问速度是上代的10倍

TPU 8i（推理版）：

片上SRAM翻三倍
互联带宽翻倍到19.2 Tb/s
每美元性能提升80%

这个拆分背后的判断挺清楚：训练和推理对硬件的需求已经分叉太大了。训练要的是堆超大共享内存做分布式优化，推理要的是低延迟、高互联、高片上缓存。再用一颗芯片同时讨好两边，不划算。

英伟达那边其实也走过类似的路（H100/H200和L40S的分化），但Google直接把这件事写进TPU的世代命名里，态度更果断。

把整个数据中心重新做了一遍

支撑这个新TPU的是个叫Virgo Network的新数据中心架构：

一张网链接13.4万颗TPU 8t
非阻塞带宽47 Pb/s
每颗TPU 8t能用到的带宽是上代的4倍
未加载延迟降低40%

47 Pb/s这个数字什么概念？大致相当于把全球互联网核心节点的总带宽塞进一个数据中心。

软件那一层还在卷成本

光卷硬件不够，软件层这次也是一刀刀往运行成本上砍：

GKE Agent Sandbox：每秒启动300个沙箱，每美元性能提升30%
BigQuery fluid scaling：平均成本降低34%
Lightning Engine for Apache Spark：每美元性能翻倍
Managed Lustre：吞吐最高10 TB/s
M4N虚拟机系列：跑Oracle负载，TCO降低20%以上

数据层和编排层这套打法，瞄准的是企业里那些**“用不起Vertex AI但又必须做AI”**的传统业务负载。

这步棋下得有多大

Google Cloud Next过去几年的发布会，每次都有”AI”，但这次明显不一样：

名字改了——从工具型平台（Vertex AI）变成应用平台（Agent Platform）
芯片拆了——训练推理分家，是产品线级别的押注
数据中心重做了——Virgo是从底层架构推倒重来
卖点换了——以前卖”AI能力”，现在卖”agent生命周期管理”

这背后的判断是：未来云上的工作负载，主体不再是人写的代码，而是agent跑的任务。如果这个判断对，那云厂商的所有产品都需要重新围绕agent设计；如果错，Google等于把至少两年的研发预算押在了一个错的方向上。

AWS还没出招（re:Invent要等年底）、Azure这边Microsoft Fabric MCP上个月也动了。但Google这次的狠在于一次性把硬件、网络、平台、商业化模型都重新拼了一遍。

熟悉云这一行的都知道：芯片世代和数据中心架构，做错了要回头三年起步。Google敢这么压，对自己的agent路线是真的有信心。

参考来源：Google Cloud Next '26: Gemini Enterprise Agent Platform Leads AI-Centric News（Virtualization Review）；Google Cloud Next made it clear: AI is coming for everything（The Register）；CocoLoop、Google Cloud Next 2026: News and updates（Google官方博客）