模型供应商一般不会主动让你”扔掉以前积累的东西”。但OpenAI这次破例了。
4月26日,OpenAI更新了GPT-5.5的官方prompt指南,态度异常直接:别把5.2、5.4那一套prompt直接搬过来,它们不是在帮你,而是在拖累5.5的发挥。
这个建议为什么反常
熟悉这行的都懂,”prompt资产”是企业接入大模型最大的隐性成本之一。你用GPT-4写了几百个prompt,迁到5.0、5.2、5.4都还能凑合用,迁到5.5突然要求重写——这事儿对企业是有真实迁移成本的。
OpenAI不是没意识到。他们这次的措辞值得逐字看:
“把GPT-5.5当作一个新的模型家族来调,不要当成gpt-5.2或gpt-5.4的drop-in replacement。从最小的、能跑通业务的prompt开始重新来。”
这句话翻译过来就是:别图省事,重新评估你的prompt栈。
旧prompt到底卡在哪
OpenAI给了两个非常具体的”反例”特征:
1. 过度规定流程
老prompt往往写满了”先做A,再判断B,然后调用C,最后输出D”——这是因为以前的模型推理弱,需要手把手带。但5.5不一样,给它结果就行,路径让它自己选。
OpenAI给的对比例子是这样:
| 写法 | 效果 |
|---|---|
| “解决客户的问题,端到端” | 推荐 |
| “第一步问清问题、第二步查知识库、第三步……” | 不推荐 |
后者不是不对,是抑制了模型的判断空间。
2. 强行规定输出schema
这点对开发者尤其有意义。以前为了让JSON结构稳定,prompt里塞一堆”必须包含字段X、字段Y、字段Z”的指令。GPT-5.5的建议是:能省则省,让模型自己组织——只在产品契约真的需要时才硬编码。
旧的”角色定义”反而回归了
有意思的是,过去两年prompt工程社区有一种倾向:”你是一个专家”这类角色定义被认为是噪声,删掉效果更好。
OpenAI这次的指南反过来推荐了一个七段式结构,第一段就是role:
- Role(角色)
- Personality(人格基调)
- Goal(目标)
- Success criteria(成功标准)
- Constraints(约束条件)
- Output format(输出格式)
- Stop rules(停止规则)
每一段写多少?OpenAI的建议是短而具体——比如success criteria不要写”用户满意”,要写”问题解决并提供下一步可执行动作”。
一个细节:reasoning effort默认值变了
GPT-5.5的另一个隐性变化:默认reasoning effort从high改成了medium。
这意味着如果你直接迁过来,模型实际”想”的程度比5.4要少。OpenAI建议把medium当成新的基线,只在确认medium不够时再往上调。这背后的考量是延迟和成本——5.5的medium已经比5.4的high更聪明,没必要再去开high。
检索预算和”短前导句”
两个偏工程的细节也值得记下来:
- Retrieval budget:对需要查资料的任务,明确告诉模型最多搜几次。OpenAI给的起手式是”用一次广搜,关键词要短而有区分度”
- Short preamble:流式输出场景下,工具调用前先吐一两个字的”acknowledge”,能让用户感知到响应更快
这两条都是为了让长任务感知上更顺——不是模型变快了,是给用户的反馈节奏变快了。
这个guide为什么这么直白
OpenAI过去发的prompt guide大多是”建议性”的,这次的5.5 guide语气重得多。背后的理由不复杂:
5.5在对外定价上和5.4是平价的,但内部成本结构变了——它对短而锋利的prompt响应最好,对冗长堆叠的prompt反而效率下降。如果开发者继续用老方式调用,OpenAI自己赚得也少。
某种程度上这是OpenAI第一次把”prompt是产品的一部分”摆到台面上说。模型在迭代,prompt不更新就等于在用旧版本——这件事过去几年大家都知道,但产品方一直含糊过去,没有人主动捅破。
至于会不会引起开发者抵触?大概率会。但等头部客户跑完一轮A/B,看到”重写prompt后准确率涨了几个点、成本降了几成”的对比数据,风向就稳了。
下一次模型升级,估计就该出现”GPT-5.5迁5.6还要重写吗”的争论了。
参考来源:OpenAI says old prompts are holding GPT-5.5 back and developers need a fresh baseline(The Decoder);GPT-5.5 prompting guide(simonwillison.net);Using GPT-5.5(OpenAI官方文档)