OpenAI免费开放给医生:99.6%安全率、HealthBench碾压人类专家——这次不是噱头
美国有72%的医生现在用AI处理工作。 去年这个数字是48%。一年涨了整整24个百分点,比任何一家咨询公司预测的都快。 问题是,医生们用的AI是什么?大多数时候是通用版ChatGPT,是那个给所有人用的ChatGPT,没有特别针对临床场景设
美国有72%的医生现在用AI处理工作。 去年这个数字是48%。一年涨了整整24个百分点,比任何一家咨询公司预测的都快。 问题是,医生们用的AI是什么?大多数时候是通用版ChatGPT,是那个给所有人用的ChatGPT,没有特别针对临床场景设
昨天(4月23日),Anthropic做了一件少见的事:公开承认了错误。 不是公关措辞含糊带过,是列出了三个具体的技术决定——哪天改的、改了什么、为什么改、造成了什么后果、哪天修回来的。 从3月初到4月中,这三个改动叠加在一起,让Claud
今天(4月24日),DeepSeek发布了V4。 Bloomberg的标题是「一年后再次颠覆硅谷」。有没有这么夸张暂且不说,但这次确实是两件事一起发: V4-Pro:1.6万亿总参数,激活49B,支持100万token上下文 V4-Flas
昨天(4月23日),OpenAI扔出了GPT-5.5。 外号Spud(土豆)。距离GPT-5.4,刚好6周。 如果你还记得一年前,OpenAI每季度出一个大版本,大家都觉得研发速度够快了。现在6周出一个,节奏变得更像软件版本迭代。 先看定价
上周,GitHub悄悄停止接受新的Copilot订阅。 不是系统维护,不是临时故障。GitHub的官方解释很直接:agentic工作流——长时间运行的并行AI任务——消耗的计算资源,远超原有订阅方案所能支撑的上限。 受影响的包括Pro、Pr
2026年第一季度,Anthropic在华盛顿的办事处开始认真干活了。 根据美国国会的游说记录,Anthropic Q1的游说支出是156万美元。上一年同期是36万,一年时间翻了四倍多。 对比一下OpenAI:同期从56万涨到了102万,差
4月7日,Anthropic正式宣布Mythos。 那时候的讨论几乎全是:这模型有多可怕、会不会失控、白宫为什么要紧急开会。 15天后,微软宣布把Mythos接进了自家的安全开发生命周期(Security Development Lifec
Mira Murati是在2024年底离开OpenAI的,那时候OpenAI正处在上市前夕的高光时刻,她是技术总监,带着一批核心工程师走的。 大家都以为她会去做另一个追逐GPT的语言模型。 结果她做了Tinker。 Thinking Mac
这事过了43年。 1983年,John Billingsley发表了第一篇乒乓球机器人论文,叫”Robot Ping-Pong”。那时候能做到的,是用一个关节把球打回去,还得靠固定位置。 2026年4月22日,Nature发表了Sony A
4月22日,OpenAI发了一个叫 workspace agents 的东西,正式宣布:custom GPTs,要被替换了。 这不是功能升级,是逻辑的换挡。 GPTs是有问必答,agents是自主干活Custom GPTs的核心:用户问一句