OpenAI把Codex改成了桌面隐形员工:后台用鼠标、看屏幕、跑几天不用管

4月16日,OpenAI 给 Codex 推了一次大更新。不是小修小补——是把 Codex 从「聊天写代码」改造成了一个可以在桌面后台默默操作一切的 agent。同一天,Anthropic 发布了 Opus 4.7。两家在4月16号同时发力,AI 编程工具的正面竞争越来越明显。

后台 Computer Use:和以前的「控制电脑」有什么区别

这次更新最核心的功能叫做「background computer use」——Codex 现在可以在 macOS 上后台运行,用自己的鼠标指针操作你电脑上的其他应用,而不需要接管你的整个屏幕。

以前很多 Computer Use 的演示方式是:AI 占领你的屏幕,你只能在旁边看着它操作。OpenAI 选了另一条路:

“It can use apps on your computer in the background, as opposed to taking over your entire computer.”

区别很实际。Codex 可以在你继续正常工作的同时,后台帮你跑前端界面调试、测试应用、修复只能通过 GUI 才能复现的 bug——互不干扰。而且支持同时跑多个 agent。

这对那些有很多没有 API 的工具(比如老旧的测试软件、本地的 simulator、只有 GUI 的内部系统)的开发者来说,意义明显。

能干什么:功能列表比较长

除了 computer use,这次更新塞了很多东西:

  • 内置浏览器:可以打开本地或公网页面(不需要登录的),直接在页面上留评论,然后让 Codex 根据反馈修改
  • 图像生成:集成了 gpt-image-1.5,可以在开发流程里直接生成界面 mockup 和游戏素材
  • 90+ 新插件:包括 JIRA、CircleCI、GitLab、Microsoft Suite、Neon、Remotion、Render 等,几乎覆盖了完整的工程链路
  • SSH 接入远端开发机(alpha):不只是本地了,可以操作远程 devbox
  • 监听 Slack/Gmail/Notion:跟踪任务进度、处理 PR 评论、接收通知

最特别的是自我调度:Codex 可以给自己安排未来要执行的任务,然后到时候自动启动,不需要用户在场,理论上可以连续工作几天甚至几周。

跟 Claude Code Routines 的对比

有意思的是,Anthropic 在4月14日(比这次早两天)也发布了 Claude Code Routines,同样是「不需要用户开着笔记本电脑也能跑」的自动化功能。两家基本在同一时间点发力。

两者的架构选择不同:

  • Claude Code Routines:跑在 Anthropic 的云端基础设施上,通过调度、GitHub 事件或 API 触发,适合代码仓库相关的自动化(每晚 bug triage、PR review、代码规范检查)
  • Codex background computer use:在本地 Mac 上后台运行,可以直接操作本地 GUI 应用

前者更纯粹,后者更「野」。能操作本地软件这件事在某些场景下不可替代,但也意味着更复杂的权限和安全边界。

谁会用,谁不需要

几种开发者的情况:

适合用 computer use 的场景:

  • 需要测试有 GUI 界面的移动应用 simulator
  • 项目里有老旧的内部工具,只能鼠标点
  • 前端开发中需要频繁核对视觉稿和实现差距

不太适合的场景:

  • 纯后端服务,全部 API 可调用
  • 在 EEA、英国、瑞士——这几个地区目前不提供此功能

EU 和英国被排在外面不意外,OpenAI 在欧盟的新功能上线一直比其他地区慢,AI Act 的监管压力是主要原因。Windows 版什么时候来,OpenAI 没给时间表。

这波更新意味着什么

从 Codex 的发展轨迹来看,它已经走完了「代码补全 → 代码 agent → 跨应用 agent」三个阶段。能在后台控制整个桌面环境的 AI 开发工具,跟一年前「帮你补全一行代码」的 Copilot 已经不是同一类东西了。

自动调度、后台运行、跨应用操控——这条路的终点是什么,OpenAI 没明说,但方向挺清楚的。

参考来源:OpenAI turns Codex into an always-on coding agent that watches your screen(The Decoder);OpenAI drastically updates Codex desktop app to use all other apps on your computer, generate images, preview webpages(VentureBeat);OpenAI takes aim at Anthropic with beefed-up Codex that gives it more power over your desktop(TechCrunch);Computer Use – Codex app(OpenAI Developers)