一天五次故障、八天两次大宕机:Claude的可靠性账单开始结清

2026-04-28,UTC时间11点53分,Claude Haiku 4.5开始报错。

到当天23点33分,Anthropic的状态页一共记了五条故障:Haiku 4.5、Sonnet 4.5、Opus 4.7轮流出问题,Claude.ai整个登录路径在17:34-18:52挂了78分钟,Claude Code的Code Review间歇性启动不了会话。

把这五条故障摞起来看,那一整天Anthropic的服务有差不多两个小时是部分或完全不可用的。

这次到底坏了什么

按Anthropic在状态页里的描述:

“We have identified an issue resulting in elevated errors on the Anthropic API, as well as issues accessing Claude.ai, including log-in paths for Claude Code.”

说人话:API在抛500,网页登不进去,Claude Code连”打开”都做不到。

Downdetector的数据更直观——到太平洋时间4月28日上午11点11分,超过5000名用户提交了故障报告。不是某个区域抽风,是全球范围的同时跌倒。

各服务故障的具体时间窗口(UTC):

服务 持续
Haiku 4.5 11:53 12:44 51分钟
Sonnet 4.5 13:22 13:39 17分钟
Claude.ai + API 17:34 18:52 78分钟
Opus 4.7 23:25 23:33 8分钟
Claude Code Review 多段 - 间歇

五次独立故障打在同一个工作日里,能完整跑完一个工作流的时间不多。

这不是这个月第一次

更扎眼的是节奏。8天前的4月20日,Claude刚经历过一次类似的大面积宕机,6500个用户在Downdetector上报了”Service is temporarily busy”和”Page not found”。

两次故障,Anthropic都没出postmortem。

对一个把”企业级”挂在嘴上的公司来说,这是个挺尴尬的姿态——按行业惯例,影响超过几千用户、跨多个产品线的故障,是要给客户一份带根因分析的事故报告的。

为什么这事现在重要

2025到2026年,Anthropic的故事是”营收三个月翻三倍”、”40%企业API市场份额”、”3800亿估值”。

这些数字背后的事实:增长速度甩开了基础设施的承载速度。

几个观察:

  • Claude Code在4月份刚被宣布要从$20 Pro套餐里移除,定价在重构
  • 4月24日,Anthropic公开复盘过去一段时间Claude Code质量下降的原因,承认是工程上的失误
  • 现在又叠加可靠性问题

讲白了,这家公司同时在做三件事:定价改造、模型迭代、企业扩张。每一件单独做都不轻松,叠在一起,事故率就是这么压上来的。

客户在看什么

企业用Claude的关键决策不是模型分数。SLA、可用性、事故响应速度——这些才是采购合同上写进去的硬条款。

接下来几周值得盯:

  • Anthropic会不会出postmortem,说明根因
  • 是不是只是控制平面(登录、API网关)的问题,还是计算资源层
  • AWS Trainium训练协议下,推理基础设施有没有跟上

如果这些问题没人正面回答,下一个被NEC、CBA、Canva这些大客户拿来当谈判筹码的,就不是价格了。

参考来源:Claude Status官方记录(status.claude.com)、Anthropic's Claude suffers alarming outage for thousands(Rolling Out)、Claude AI Services Suffer Repeat Outages Impacting Global Users(infonasional.com)、Claude AI was down — what we know so far about the outage(Tom's Guide)