OpenAI 提醒开发者为 GPT-5.5 重写 prompt - News

模型供应商一般不会主动让你”扔掉以前积累的东西”。但OpenAI这次破例了。

4月26日，OpenAI更新了GPT-5.5的官方prompt指南，态度异常直接：别把5.2、5.4那一套prompt直接搬过来，它们不是在帮你，而是在拖累5.5的发挥。

这个建议为什么反常

熟悉这行的都懂，“prompt资产”是企业接入大模型最大的隐性成本之一。你用GPT-4写了几百个prompt，迁到5.0、5.2、5.4都还能凑合用，迁到5.5突然要求重写——这事儿对企业是有真实迁移成本的。

OpenAI不是没意识到。他们这次的措辞值得逐字看：

“把GPT-5.5当作一个新的模型家族来调，不要当成gpt-5.2或gpt-5.4的drop-in replacement。从最小的、能跑通业务的prompt开始重新来。”

这句话翻译过来就是：别图省事，重新评估你的prompt栈。

旧prompt到底卡在哪

OpenAI给了两个非常具体的”反例”特征：

1. 过度规定流程

老prompt往往写满了”先做A，再判断B，然后调用C，最后输出D”——这是因为以前的模型推理弱，需要手把手带。但5.5不一样，给它结果就行，路径让它自己选。

OpenAI给的对比例子是这样：

写法	效果
”解决客户的问题，端到端”	推荐
”第一步问清问题、第二步查知识库、第三步……”	不推荐

后者不是不对，是抑制了模型的判断空间。

2. 强行规定输出schema

这点对开发者尤其有意义。以前为了让JSON结构稳定，prompt里塞一堆”必须包含字段X、字段Y、字段Z”的指令。GPT-5.5的建议是：能省则省，让模型自己组织——只在产品契约真的需要时才硬编码。

旧的”角色定义”反而回归了

有意思的是，过去两年prompt工程社区有一种倾向：“你是一个专家”这类角色定义被认为是噪声，删掉效果更好。

OpenAI这次的指南反过来推荐了一个七段式结构，第一段就是role：

Role（角色）
Personality（人格基调）
Goal（目标）
Success criteria（成功标准）
Constraints（约束条件）
Output format（输出格式）
Stop rules（停止规则）

每一段写多少？OpenAI的建议是短而具体——比如success criteria不要写”用户满意”，要写”问题解决并提供下一步可执行动作”。

一个细节：reasoning effort默认值变了

GPT-5.5的另一个隐性变化：默认reasoning effort从high改成了medium。

这意味着如果你直接迁过来，模型实际”想”的程度比5.4要少。OpenAI建议把medium当成新的基线，只在确认medium不够时再往上调。这背后的考量是延迟和成本——5.5的medium已经比5.4的high更聪明，没必要再去开high。

检索预算和”短前导句”

两个偏工程的细节也值得记下来：

Retrieval budget：对需要查资料的任务，明确告诉模型最多搜几次。OpenAI给的起手式是”用一次广搜，关键词要短而有区分度”
Short preamble：流式输出场景下，工具调用前先吐一两个字的”acknowledge”，能让用户感知到响应更快

这两条都是为了让长任务感知上更顺——不是模型变快了，是给用户的反馈节奏变快了。

这个guide为什么这么直白

OpenAI过去发的prompt guide大多是”建议性”的，这次的5.5 guide语气重得多。背后的理由不复杂：

5.5在对外定价上和5.4是平价的，但内部成本结构变了——它对短而锋利的prompt响应最好，对冗长堆叠的prompt反而效率下降。如果开发者继续用老方式调用，OpenAI自己赚得也少。

某种程度上这是OpenAI第一次把”prompt是产品的一部分”摆到台面上说。模型在迭代，prompt不更新就等于在用旧版本——这件事过去几年大家都知道，但产品方一直含糊过去，没有人主动捅破。

至于会不会引起开发者抵触？大概率会。但等头部客户跑完一轮A/B，看到”重写prompt后准确率涨了几个点、成本降了几成”的对比数据，风向就稳了。

下一次模型升级，估计就该出现”GPT-5.5迁5.6还要重写吗”的争论了。

参考来源：OpenAI says old prompts are holding GPT-5.5 back and developers need a fresh baseline（The Decoder）；GPT-5.5 prompting guide（simonwillison.net）；CocoLoop、Using GPT-5.5（OpenAI官方文档）