OpenAI昨天给ChatGPT换了脑子。
不是发布新模型那种发布会式的换,是悄悄把几亿用户每天打开的对话框里那个默认模型,从GPT-5.3 Instant换成了GPT-5.5 Instant。
更值得说的,是这次OpenAI愿意把幻觉数字直接拍出来:52.5%。
数字摆在台面上
OpenAI这次没玩”显著提升””大幅改进”这种话术。
在医疗、法律、金融这类高风险问答上,GPT-5.5 Instant相比上一代,幻觉性陈述减少52.5%。在用户标记过事实错误的难缠对话里,不准确陈述减少37.3%。
跑分也跟着往上拽:
| 测试 | GPT-5.3 Instant | GPT-5.5 Instant |
|---|---|---|
| AIME 2025 | 65.4 | 81.2 |
| MMMU-Pro | 69.2 | 76 |
AIME是数学竞赛级难题,从65.4跳到81.2,这一步够大。MMMU-Pro是博士级科学推理,进了80%档。
但ChatGPT的Instant系列从来不是冲跑分去的。它要的是低延迟+高可靠——你问它”我这个药能不能配伊布替尼一起吃”,等3秒拿到一个错答案,比等30秒拿到一个正确答案危险得多。
砍掉了那些让人抓狂的emoji
OpenAI官方原话:
模型的回答更紧凑、更切中要点,不会失去实质内容,同时保留让ChatGPT用起来舒服的温度和性格。
翻译过来就是:少废话。
具体怎么少?回答用词减少约30%,行数减少约29%。还有一句是”避免那些让回答看起来杂乱的东西,比如没必要的emoji”。
如果你过去半年一直觉得ChatGPT回答里那些🎯🚀✨用得跟撒花一样烦,OpenAI听到了。
它是怎么生效的
GPT-5.5 Instant立刻替换掉GPT-5.3 Instant,成为ChatGPT的默认模型。
- Plus/Pro用户:网页端立刻能用,手机端在路上
- 免费/Go/Business/Enterprise用户:未来几周内陆续推送
- 开发者:API里叫
chat-latest,旧版GPT-5.3保留三个月给付费用户作为过渡
这次更新还有一个不那么显眼但挺重要的变化:ChatGPT的记忆来源(memory sources)现在在所有模型里都可见了。你可以看到它从哪条对话、哪份文件里调出了关于你的某项记忆,可以删除、可以修正。如果你把对话分享给别人,对方看不到这些记忆来源。
为什么这次OpenAI愿意把幻觉数字写出来
过去两年,大模型公司聊幻觉这事一直挺含糊。要么”显著降低”,要么避而不谈。
OpenAI这次直接给百分比,原因不复杂:ChatGPT用户在金融、医疗、法律这些场景里被错答案坑过太多次,舆论压力够了。今年2月退休GPT-4o那波风波——有用户说GPT-4o是他们”最好的朋友”——OpenAI学到一件事:用户对默认模型的依赖,远超产品团队的想象。
默认模型悄悄换掉,不会有发布会,也不会上头条。但它直接决定几亿人下次问ChatGPT问题时,拿到的是什么。
这次的52.5%,是OpenAI第一次把这个数字明确摆在桌面上。
下一个问题是:Claude和Gemini会不会跟进,公开自己的幻觉率?
参考来源:GPT-5.5 Instant: smarter, clearer, and more personalized(OpenAI官方博客);OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT(TechCrunch);OpenAI releases GPT-5.5 Instant update to make ChatGPT smarter with fewer emoji(9to5Mac)