3月5号OpenAI发了GPT-5.4,最大的变化是:不再搞专门的编程模型了。
之前GPT-5.3-Codex是独立的编程专用模型,和主线GPT-5.x分开发布。现在GPT-5.4直接把前沿编程能力、推理能力和Computer Use统一到一个模型架构里。
三项全能
| 维度 | GPT-5.4 | 对比GPT-5.3-Codex |
|---|---|---|
| 编程(SWE-bench Pro) | 57.7% | 55.6% |
| 电脑操控(OSWorld) | 75% | 64% |
| 知识工作(GDPval) | 83% | 无 |
编程略强,电脑操控拉开一大截,知识工作能力则是Codex完全没有的。第一个在三个维度都达到前沿水准的单一模型。
五个版本
- Standard:常规版
- Thinking:深度推理版
- Pro:高配版
- Mini:轻量版
- Nano:超轻量版
从几美元到几十美元的API价位全覆盖。ChatGPT里叫”GPT-5.4 Thinking”,API里叫gpt-5.4。
实验性支持100万token上下文,可以通过model_context_window和model_auto_compact_token_limit参数配置。
策略信号
GPT-5.4代表了OpenAI在产品策略上的一个明确转向:从”为不同场景做不同模型”转向”一个模型搞定一切”。
这和DeepSeek V3.1的混合模型思路、Qwen3的双模式设计殊途同归。看来”统一模型”正在成为行业共识——用户不应该操心”这个问题该用哪个模型”。
参考来源:NxCode技术指南