Google悄悄关掉了Project Mariner:靠截屏操控浏览器这条路,DeepMind自己先不走了

5月4日,Google那个曾经被吹成”AI互联网管家”的Project Mariner,登录页悄悄换成了一行字:服务终止,日期是2026年5月4日。

没有发布会,没有官方推文,没有产品负责人写blog告别。一个2025 I/O大会上压轴亮相的产品,17个月后无声地下架了

Mariner是什么,曾经被寄予什么希望

Project Mariner是Google DeepMind 2025年5月在I/O上扔出来的实验性Agent,要做的事情挺直白:让AI像人一样”看着浏览器、用鼠标”地操作互联网——填表、订票、查工作机会、刷Expedia。

它的核心技术路径是视觉识别+模拟点击:每隔几百毫秒截一次屏,然后用视觉模型识别页面上的按钮、输入框、链接,再让agent去点、去打字。这条路的好处是不用每个网站做适配——任何网站都能用,包括那些十几年没更新的老古董。

发布的时候DeepMind讲了一个很美的故事:未来你说一句”帮我把上周看上的那双鞋下单”,agent就自己去打开浏览器、登录账号、找购物车、结账。听起来比让你装一堆插件、连一堆MCP server要省心得多。

为什么Google自己先放弃了

放弃的原因,归根到底就两个:贵,还慢。

视觉处理太烧算力。 持续截屏、持续视觉识别,意味着每秒钟都在跑一个视觉大模型。一个看着电脑屏幕的agent,跑起来比一个写代码的agent要烧好几倍的GPU。在企业级场景里,单位任务成本根本压不下来

容易出错。 视觉识别靠的是模型对像素的理解,碰到弹窗、A/B测试、动态加载、CSS有更新,模型分分钟点错按钮。”选错了一个下拉选项”听起来像小事,放在订机票场景里就是一张错票。

还有一个隐形的麻烦:隐私。Mariner要持续看到你的浏览器内容才能干活——意味着它能看到你的银行账户、邮件、私密聊天。Google一直没把这个问题答漂亮过,企业用户更是直接绕开。

内部其实早就转向了

Wired早在2026年3月就报道过,Mariner团队的人正在被悄悄重新分配到其他项目。这是企业内部产品死亡的典型征兆——先抽调人,再砍预算,最后下架。

Google对这次关停的官方表态也耐人寻味:Mariner的技术”voyaged to other Google products”——已经”航行到”了Gemini API和新的Gemini Agent里。说人话就是:模型层的能力还会留下来,但作为独立产品,结束了。

但有意思的是Google同步发布的几个东西:

  • Gemini Agent 走的是更结构化的路径,能调用具体的Workspace工具,不靠纯视觉
  • Chrome的auto-browse 把一部分浏览器自动化能力嵌进了浏览器本身

换句话说,Google没放弃浏览器自动化的方向,只是放弃了”靠截屏理解页面”这条具体路线。

行业层面,这事说明了什么

Mariner死掉的真正原因,不是技术问题,是赛道变了

2025年Q4开始,AI Agent的核心阵地从”操控浏览器”快速转向”操控文件和代码”。OpenClaw、Claude Code、Cursor这一批工具能干的事情更具体:

  • 直接读写文件、改代码、跑命令
  • 通过MCP接服务,不用截屏识别
  • 跟开发者的工作流深度绑定,不是另起炉灶

这条路有几个特别明显的优势:

维度 截屏式agent (Mariner) 文件/代码级agent
计算成本 持续视觉推理,烧 文本I/O,便宜
错误率 像素变化随时翻车 文件读写极少出错
可观测性 黑盒:你不知道它在看啥 全程文本日志可审计
扩展性 每个网站独立适配难 MCP是开放标准

到了2026年5月,OpenClaw全球渗透率已经过千万企业用户,Claude Code在开发者圈基本是必装,Cursor估值冲到了500亿美元谈判桌。这些工具的共同点都是:绕开浏览器,直接操控生产环境

Mariner走的是另一条路:留在浏览器层、模拟用户行为、覆盖最大集合的网站。理论上两条路都能成立,但市场用脚投票了——做事的agent,不需要装得像个真人

留下的问题

Project Mariner的下架,把一个被搁置很久的问题重新摆到台面:如果AI Agent要替用户操作那些”没有API”的网站怎么办?

很多2C场景(订老旧的会员制网站、查国内政务办事、操作那些坚持不开API的小公司SaaS),暂时没有”文件/代码”路径可走。Anthropic的Computer Use、xAI的Grok Computer都还在往那个方向探,但效果距离”真正可用”都有差距。

Mariner走了。这条路上没死透,但也没活好。

接下来一两年,能不能有人把”视觉操控+文件操控”这两条路缝起来——做一个真正混合架构的agent,可能会决定AI Agent这个品类的天花板在哪。

至于Google,它的下一步看起来很明确:Gemini Agent继续往结构化方向推,让AI在Google自己的生态里先立住,再慢慢往外扩。这条路不那么fancy,但更像Google能跑赢的玩法。

参考来源:Google pulls the plug on Project Mariner, the AI agent that browsed the web like a human(Digital Trends);Google quietly kills Project Mariner as the AI agent race shifts gears(Android Authority);Google Quietly Shut Down Project Mariner on May 4 Without Public Announcement(Technobezz);Google shut down Project Mariner and folded its tech into Gemini(Gagadget)