Anthropic秘密造了个能挖出27年老漏洞的AI,但不敢公开发布
Anthropic昨天(4月7日)做了一件很反常的事:发布了一个新模型,但不让普通人用。 这个模型叫 Claude Mythos。Anthropic自己的内部评估写道,它在网络安全能力上远超任何其他AI模型。然后他们决定——不公开,只给一小
Anthropic昨天(4月7日)做了一件很反常的事:发布了一个新模型,但不让普通人用。 这个模型叫 Claude Mythos。Anthropic自己的内部评估写道,它在网络安全能力上远超任何其他AI模型。然后他们决定——不公开,只给一小
3月31日,OpenAI正式关闭了这轮融资。1220亿美元,估值8520亿,历史上从未有哪家非上市公司做到过这个规模。 谁在掏钱三个主角:亚马逊500亿、英伟达300亿、软银300亿。 亚马逊那500亿里有个细节——350亿是有条件的,条件
Perplexity最近两年的增长有点猛。在Google几乎垄断搜索市场二十多年后,居然有人从AI角度撕开了一个口子。 和传统搜索的区别Google给你的是链接列表——你需要自己点进去、阅读、判断、综合。 Perplexity给你的是直接回
两年前”开源能追上闭源吗”还是个有争议的问题,现在答案已经很清楚了:在大部分常规任务上,开源已经追平甚至超过了。 当前格局开源阵营: DeepSeek V3/R1——顶级性能,极低成本 Llama 4 Scout/Mav
2025到2026年,AI API的定价经历了一场堪比电商大战的价格厮杀。 降价潮DeepSeek的低成本策略给整个行业施加了巨大的降价压力。当R1的运行成本只有OpenAI同级模型的1/20到1/50时,闭源厂商的定价
AI大模型的能源消耗正在成为一个不可忽视的问题。 训练成本大模型训练的电力消耗极其惊人。以GPT-4级别的模型为参考: 单次训练消耗的电量相当于几百个美国家庭一年的用电量 微软、Google、Meta的AI数据中心建设正在推高全球数据中心的
每次AI编程工具有大更新,社交媒体上就会炸一波”程序员要失业了”的讨论。那实际情况怎样? METR的研究很打脸AI安全研究组织METR做了一个严格的实验:让有经验的开发者分别在有和没有AI辅助的情况下完成编程任务。 结果:用了AI工具的开发
“AI Agent”在2025年还是个有点模糊的概念,到了2026年已经变成了具体的产品和工具链。 几个明确的信号微软把Copilot改造成了agent架构(Copilot Cowork),5月上线Agent 365统一管理平面。GitHu
去年年初一度有人预言”RAG已死,长上下文模型会取代一切”。结果呢?RAG不但没死,反而进化了。 从RAG到Context EngineRAG最初的定义是”检索增强生成”——从外部数据库捞信息,塞给模型一起用。但到2025年底,这个概念已经
大模型能力越来越强,但部署成本也越来越高。量化和蒸馏是目前最主流的两种”把模型变小变快”的技术路线。 量化:降精度核心思路:把模型权重从高精度格式(FP32/FP16)压缩到低精度格式(INT8/INT4甚至更低)。 训