Opus 4.5是Anthropic在2025年底发布的一个重要版本,也是他们第一个混合推理模型——一个模型里同时集成了快速响应和深度思考两种模式。
性能水平
SWE-bench Verified上拿到80.9%,截至发布时排名全球第一。在编程之外的几项benchmark上也普遍领先或持平。
Opus 4.5最明显的提升是在复杂、多步骤任务上的表现。比如需要理解一个大项目的多个模块后再做跨文件修改——这种”需要全局视野”的活儿,Opus 4.5的完成质量比前代有明显进步。
定位
在Claude的产品线里:
- Haiku:快而便宜,适合高频简单任务
- Sonnet:性价比最均衡
- Opus:能力天花板最高,适合高难度任务
Opus 4.5之后很快就迭代到了4.6(加了自适应思考和上下文压缩)。Anthropic在Opus系列上的迭代速度明显加快了——从一年多一个大版本变成了几个月一个。
市场反馈
开发者社区的评价主要集中在两点:
- 编程能力确实强,尤其是在agent场景下的多步骤任务完成率
- 成本偏高,API调用价格在所有前沿模型里排在最贵的梯队
对于个人开发者来说,日常使用Sonnet就够了。Opus更多是在关键任务、高价值场景下才值得调用。
参考来源:Anthropic官方发布