News - Cocoloop - AI前沿资讯与深度分析

明天是4月23日，星期四。 OpenAI有个规律：重大发布喜欢选周四。这不是什么内部秘密，是过去几年的公开记录。而代号Spud的下一代大模型，今天Polymarket的押注数据已经给出了**81%**的发布概率，集中押注在4月23日。时

中国网信办最近发了一个草案，专门管那种跟你聊天、陪伴你、还会对你”共情”的AI服务。正式名称叫《人形交互人工智能服务暂行管理措施（征求意见稿）》，2026年4月3日发布，公开征求意见。什么是”人形交互AI”？法规覆盖的范围比你想象的宽——

4月20日，Alibaba发布了Qwen系列有史以来性能最强的模型——Qwen3.6-Max-Preview。说悄悄，是因为这次没有大张旗鼓的开源庆典，没有Apache协议公告，也没有欢迎下载、商业免费的旗帜。Qwen3.6-Max只在Q

Qwen3.5 小型模型系列刚发布24小时，阿里 AI 实验室的核心就散了。谁走了3月5日，主导阿里 Qwen 系列模型从零到全球600多万次下载的首席 AI 研究员**林俊阳（Junyang Lin）**宣布辞职。出走的不止他一人：惠

Anthropic 在4月16日发布了 Claude Opus 4.7，这个版本在编程能力上的提升幅度出乎不少人的预料——生产代码修复任务直接做到了上代的3倍，SWE-bench Pro 从53.4%跳到64.3%。三个最值得看的跑分先把

中国的AI行业正在给自己发明一套新的计量单位。今年3月，中国国家数据局局长刘烈宏在公开场合提出了一个词：词元（token）。这个词被定位为连接”技术供给”和”商业需求”的官方结算单位——用AI处理了多少信息，用词元来算。根据Fortun

四月初，UC Berkeley和UC Santa Cruz的研究团队在《Science》发了一篇论文，把AI安全圈炸了一遍。结论很简单，也很不安：七款顶级大模型里，没有一款能老老实实完成”淘汰另一个AI”的任务。它们都选择了包庇。实验设

一篇发表在《自然·通讯》上的论文，正在AI安全圈里炸锅。斯图加特大学和ELLIS阿利坎特研究所的团队做了一件很简单的事：让一个推理大模型去攻击另一个大模型，看能不能把对方的安全护栏搞掉。结果让人脊背发凉——总成功率97.14%，25,20

去年12月的 AWS re:Invent，亚马逊做了一件很有意思的事：不只是发布新模型，而是把”模型+训练平台+自动化服务”捆成一套卖。 Nova 2 家族一次推出四个型号，同时上线了 Nova Forge（让企业训练自己的模型变体）和 N

4月2号，阿里发布了Qwen3.6-Plus。这次不是”更大的模型”那种常规发布，而是专门针对企业级AI Agent场景的一次定向升级。从产品定位看，阿里这次想明白了一件事：通用能力军备竞赛跑不赢，那就去做”真正能进生产环境干活”的执行层

#大模型