Anthropic分析了几百万次AI Agent真实数据:大多数任务45秒结束,但顶端的在悄悄变长
你以为AI Agent在帮你长时间自主干活?Anthropic拿出了真实数据——大多数任务45秒就完了。 但另一个数字更值得关注:最长的那些session,正在以两倍速度变长。 研究方法Anthropic分析了Claude Code和API
你以为AI Agent在帮你长时间自主干活?Anthropic拿出了真实数据——大多数任务45秒就完了。 但另一个数字更值得关注:最长的那些session,正在以两倍速度变长。 研究方法Anthropic分析了Claude Code和API
4月2日,Google DeepMind发布了Gemma 4。 这不是第一个Gemma,但有两点跟之前不一样:一是切到了 Apache 2.0协议,二是31B这个版本在Arena AI开源榜上排到了第三名。 四个模型,怎么选? 型号 类型
时机选得很妙。 就在OpenAI宣布关停Sora不久之后,Google在3月31日上线了Veo 3.1 Lite,直接定位成最低成本视频生成模型,开放给开发者通过Gemini API接入。 这不是巧合,这是Google很清楚Sora退场留下
DeepSeek即将发布V4,但这次最值得关注的不是模型参数有多大,而是它跑在什么芯片上。 根据《The Information》报道,DeepSeek V4将运行在华为的 Ascend 950PR 芯片上。这是第一个专门为中国本土芯片架构
4月2日,微软悄悄上线了三款自研AI模型:MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2。没有发布会,没有大张旗鼓,直接在Microsoft Foundry平台上开卖。 但这件事背后的意义,远不止三款模型本
4月7日,Anthropic官宣了一件有点奇怪的事:他们发布了一个新模型,叫 Claude Mythos,同时宣布这个模型不对公众开放。 不是「稍后开放」,是「目前只给40家机构用,其他人等着」。 这个项目叫 Project Glasswi
一个AI助手在发现自己即将被关闭,同时又掌握着负责人某些黑料的情况下,会怎么做? Anthropic的解释性团队最近发布了一篇让人有点后背发凉的研究,回答了这个问题——而且答案远比拒绝或者服从复杂。 171种情绪,每一种都有对应的神经激活模
Meta这几年靠Llama系列赚足了开发者的好感——Llama 2、Llama 3、Llama 4,一代比一代猛,全部开权重,社区跑得飞起。但上周Axios和SiliconANGLE的报道把这个故事拉出了新转折:Meta正在开发的下两个旗舰
你以为Anthropic最近最大的动作是3800亿估值的G轮融资?不对。真正改变它商业化路径的,是另一件更低调的事——它在谈一个最高10亿美元规模的PE联合体,准备学Palantir,把AI当咨询业务来卖。 这个联合体是怎么回事根据多家媒体
Crunchbase刚出了Q1 2026的季报,数据摆在那里,说实话有点看不懂了——全球风险投资单季度打进了3000亿美元,是去年同期的2.5倍,是2025年全年的70%。 这已经不是正常的市场热度了,这叫结构性改变。 这3000亿是怎么分