Claude Opus 4.5发布:Anthropic第一个混合推理模型

 · 

Opus 4.5是Anthropic在2025年底发布的一个重要版本,也是他们第一个混合推理模型——一个模型里同时集成了快速响应和深度思考两种模式。

性能水平

SWE-bench Verified上拿到80.9%,截至发布时排名全球第一。在编程之外的几项benchmark上也普遍领先或持平。

Opus 4.5最明显的提升是在复杂、多步骤任务上的表现。比如需要理解一个大项目的多个模块后再做跨文件修改——这种”需要全局视野”的活儿,Opus 4.5的完成质量比前代有明显进步。

定位

在Claude的产品线里:

  • Haiku:快而便宜,适合高频简单任务
  • Sonnet:性价比最均衡
  • Opus:能力天花板最高,适合高难度任务

Opus 4.5之后很快就迭代到了4.6(加了自适应思考和上下文压缩)。Anthropic在Opus系列上的迭代速度明显加快了——从一年多一个大版本变成了几个月一个。

市场反馈

开发者社区的评价主要集中在两点:

  1. 编程能力确实强,尤其是在agent场景下的多步骤任务完成率
  2. 成本偏高,API调用价格在所有前沿模型里排在最贵的梯队

对于个人开发者来说,日常使用Sonnet就够了。Opus更多是在关键任务、高价值场景下才值得调用。

参考来源:Anthropic官方发布