GPT-5.4把Codex、推理、Computer Use全部合进了一个模型

 · 

3月5号OpenAI发了GPT-5.4,最大的变化是:不再搞专门的编程模型了

之前GPT-5.3-Codex是独立的编程专用模型,和主线GPT-5.x分开发布。现在GPT-5.4直接把前沿编程能力、推理能力和Computer Use统一到一个模型架构里。

三项全能

维度 GPT-5.4 对比GPT-5.3-Codex
编程(SWE-bench Pro) 57.7% 55.6%
电脑操控(OSWorld) 75% 64%
知识工作(GDPval) 83%

编程略强,电脑操控拉开一大截,知识工作能力则是Codex完全没有的。第一个在三个维度都达到前沿水准的单一模型

五个版本

  • Standard:常规版
  • Thinking:深度推理版
  • Pro:高配版
  • Mini:轻量版
  • Nano:超轻量版

从几美元到几十美元的API价位全覆盖。ChatGPT里叫”GPT-5.4 Thinking”,API里叫gpt-5.4

实验性支持100万token上下文,可以通过model_context_windowmodel_auto_compact_token_limit参数配置。

策略信号

GPT-5.4代表了OpenAI在产品策略上的一个明确转向:从”为不同场景做不同模型”转向”一个模型搞定一切”

这和DeepSeek V3.1的混合模型思路、Qwen3的双模式设计殊途同归。看来”统一模型”正在成为行业共识——用户不应该操心”这个问题该用哪个模型”。

参考来源:NxCode技术指南