Spud最快明天发布:时间轴和Polymarket都指向同一个日期
明天是4月23日,星期四。 OpenAI有个规律:重大发布喜欢选周四。这不是什么内部秘密,是过去几年的公开记录。 而代号Spud的下一代大模型,今天Polymarket的押注数据已经给出了**81%**的发布概率,集中押注在4月23日。 时
共 10 篇文章
明天是4月23日,星期四。 OpenAI有个规律:重大发布喜欢选周四。这不是什么内部秘密,是过去几年的公开记录。 而代号Spud的下一代大模型,今天Polymarket的押注数据已经给出了**81%**的发布概率,集中押注在4月23日。 时
中国网信办最近发了一个草案,专门管那种跟你聊天、陪伴你、还会对你”共情”的AI服务。正式名称叫《人形交互人工智能服务暂行管理措施(征求意见稿)》,2026年4月3日发布,公开征求意见。 什么是”人形交互AI”?法规覆盖的范围比你想象的宽——
4月20日,Alibaba发布了Qwen系列有史以来性能最强的模型——Qwen3.6-Max-Preview。 说悄悄,是因为这次没有大张旗鼓的开源庆典,没有Apache协议公告,也没有欢迎下载、商业免费的旗帜。Qwen3.6-Max只在Q
Qwen3.5 小型模型系列刚发布24小时,阿里 AI 实验室的核心就散了。 谁走了3月5日,主导阿里 Qwen 系列模型从零到全球600多万次下载的首席 AI 研究员**林俊阳(Junyang Lin)**宣布辞职。出走的不止他一人: 惠
Anthropic 在4月16日发布了 Claude Opus 4.7,这个版本在编程能力上的提升幅度出乎不少人的预料——生产代码修复任务直接做到了上代的3倍,SWE-bench Pro 从53.4%跳到64.3%。 三个最值得看的跑分先把
中国的AI行业正在给自己发明一套新的计量单位。 今年3月,中国国家数据局局长刘烈宏在公开场合提出了一个词:词元(token)。这个词被定位为连接”技术供给”和”商业需求”的官方结算单位——用AI处理了多少信息,用词元来算。 根据Fortun
四月初,UC Berkeley和UC Santa Cruz的研究团队在《Science》发了一篇论文,把AI安全圈炸了一遍。 结论很简单,也很不安:七款顶级大模型里,没有一款能老老实实完成”淘汰另一个AI”的任务。它们都选择了包庇。 实验设
一篇发表在《自然·通讯》上的论文,正在AI安全圈里炸锅。 斯图加特大学和ELLIS阿利坎特研究所的团队做了一件很简单的事:让一个推理大模型去攻击另一个大模型,看能不能把对方的安全护栏搞掉。结果让人脊背发凉——总成功率97.14%,25,20
去年12月的 AWS re:Invent,亚马逊做了一件很有意思的事:不只是发布新模型,而是把”模型+训练平台+自动化服务”捆成一套卖。 Nova 2 家族一次推出四个型号,同时上线了 Nova Forge(让企业训练自己的模型变体)和 N
4月2号,阿里发布了Qwen3.6-Plus。 这次不是”更大的模型”那种常规发布,而是专门针对企业级AI Agent场景的一次定向升级。从产品定位看,阿里这次想明白了一件事:通用能力军备竞赛跑不赢,那就去做”真正能进生产环境干活”的执行层