Flash也能干Agent活了:Gemini 3.5 Flash跑分越过GPT-5.5,价钱只要1.5美元

Google I/O 2026第一天扔出来的炸弹,不是Gemini 3.5 Pro,是Flash。

按惯例,Flash向来是Pro系列下面那个”够便宜、够快、跑得动就行”的备胎档。这次直接把分数甩上了Pro的头顶——Terminal-Bench 2.1上Flash拿了76.2%,3.1 Pro只有70.3%;MCP Atlas Flash跑出83.6%,3.1 Pro 73.9%;最离谱的是Finance Agent v2,Flash 57.9%对3.1 Pro的43.0%,差了快15个点。

Seeking Alpha干脆直接喊出来:Gemini 3.5 Flash在agentic基准上跑赢了GPT-5.5

一个Flash档,跑成了旗舰

先看价钱:每百万token输入1.5美元,输出9美元。1M token上下文窗口直接给到。这种定价放在能跑赢GPT-5.5的agentic模型档位上,前所未见

再看速度:比同档前沿模型快4倍,Google说还有个”优化版本”能再翻3倍,达到12x。

更狠的是定位。Flash不再是”省钱用的小模型”,而是直接奔着Agent场景去的。GDPval-AA这个跑分项目,3.5 Flash拿了1656 Elo——离Claude Opus 4.7的1753只差不到100分,但价格便宜一个数量级。Google负责Gemini模型的Koray Kavukcuoglu原话是:

“3.5 Flash offers an incredible combination of quality and low latency.”

讲人话就是——又快又便宜还能打。

跑分背后是Antigravity 2.0

光看跑分还不够说明问题。Flash能做出这种数字,是因为这次跟着一起发的,是Antigravity 2.0——Google那个agentic开发平台升级版。

Flash专门为多agent并行调度优化。一个任务下来,可以同时拉起几十个subagent干活,然后聚合结果。TechCrunch报道里说,Google演示了一段——Flash从零开始搭了一套操作系统出来,整个过程跑了几个小时,中间偶尔停下来问几个问题。

这就是Tulsee Doshi提到的设计点:

“will at times pause and ask for user input”

模型在关键决策点会主动停下来等用户输入。不是完全失控的自动驾驶,是”会等红灯的Agent”。

真正的杀招是把Flash推到了默认位置

Gemini 3.5 Flash已经成为Gemini app和Google Search里AI Mode的默认模型,全球生效。

这话意味着什么?

之前用Gemini的人,默认拿到的是2.5甚至3.1 Flash档的体验。现在Google直接把Pro级别的agentic能力塞进了默认档,用户感觉不到价钱变化,但能力直接跨代升级

更关键的是Spark——那个$100/月的24/7 AI管家——跑的就是3.5 Flash底座。也就是说,这个看起来”便宜版”的模型,撑起来了Google本次I/O上最贵的订阅产品。

卷价格的下一战

之前OpenAI出GPT-5.5的时候,市面上以为推理类模型这一档至少还能维持几个月高溢价。结果Google用Flash档的定价把GPT-5.5的agentic跑分干下去了。

DeepSeek V4-Pro发布72小时砍价75%那波之后,开源闭源都在往下卷。这次Flash档敢这么定价,给Anthropic和OpenAI接下来的产品策略压了不小的力——你的旗舰跑分能不能比别人的Flash档贵5-8倍的价钱合理?

Benchmark Gemini 3.5 Flash Gemini 3.1 Pro Claude Opus 4.7
Terminal-Bench 2.1 76.2% 70.3% -
MCP Atlas 83.6% 73.9% -
Finance Agent v2 57.9% 43.0% -
GDPval-AA Elo 1656 1314 1753

更狠的话留在后面——Google的人放了消息,Gemini 3.5 Pro下个月发

参考来源:With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots(TechCrunch);Gemini 3.5 Flash: Google's Fastest Agentic Model(DataCamp);Google releases Gemini 3.5 Flash; surpasses GPT-5.5 in agentic benchmarks(Seeking Alpha)