OpenAI给Agent SDK加了沙箱:让AI在隔离环境里干活,失控的风险小多了
AI Agent的最大问题不是能不能干活,是敢不敢让它干过去一年里,AI Agent”失控”的故事没少见:帮你发了不该发的邮件,删了不该删的文件,把一个小任务滚成了一堆副作用。 这不是模型不够聪明,而是执行环境没有安全边界。 OpenAI在
AI Agent的最大问题不是能不能干活,是敢不敢让它干过去一年里,AI Agent”失控”的故事没少见:帮你发了不该发的邮件,删了不该删的文件,把一个小任务滚成了一堆副作用。 这不是模型不够聪明,而是执行环境没有安全边界。 OpenAI在
Qwen3.5 小型模型系列刚发布24小时,阿里 AI 实验室的核心就散了。 谁走了3月5日,主导阿里 Qwen 系列模型从零到全球600多万次下载的首席 AI 研究员**林俊阳(Junyang Lin)**宣布辞职。出走的不止他一人: 惠
4月3日,Anthropic 宣布了公司成立以来第一次重大收购。 目标是 Coefficient Bio——一家成立才8个月、员工不到10人的纽约生物科技初创。 价格:4亿美元,全部以股票支付。 Coefficient Bio 是谁核心团队
4月15日,The Information爆出一个有点好笑的消息:Apple正在把Siri团队的工程师批量送进AI编程培训营(bootcamp),专门学怎么用AI工具写代码。 时间点是WWDC前两个月。Apple原本要在六月的开发者大会上发
Factory刚宣布完成1.5亿美元B轮,估值15亿美元。Khosla Ventures领投,Sequoia、Insight Partners、黑石跟投。 创始人Matan Grinberg,UC Berkeley物理博士在读。2023年发
4月7日,Z.ai(原智谱AI)发布了GLM-5.1,754B参数,MoE架构,MIT协议开源。 跑分结果:SWE-Bench Pro 58.4%,全球第一。GPT-5.4是57.7%,Claude Opus 4.6是57.3%。 光这个数
造一颗先进芯片要多久?答案通常是3到5年。仅设计阶段就要吃掉两年。而且这两年不是坐着等的,是几百上千名工程师密集协作,一个验证错误可能就让整条流水线重来。 这就是Cognichip想解决的问题。这家2024年才成立的初创公司,刚刚拿到了60
如果你最近在用 ChatGPT Pro 里的 Codex,可能会注意到有个新选项叫 Codex-Spark,响应速度快得有点不像话。 这不是参数调优的结果,是底层硬件换了。 跑在什么芯片上GPT-5.3-Codex-Spark 运行在 Ce
4月16日,OpenAI 给 Codex 推了一次大更新。不是小修小补——是把 Codex 从「聊天写代码」改造成了一个可以在桌面后台默默操作一切的 agent。同一天,Anthropic 发布了 Opus 4.7。两家在4月16号同时发力
每次用AI都要重打一遍Prompt,烦了吗相信很多人都有这个体验:每次打开Chrome,发现自己在对Gemini粘贴同一段话——“帮我总结这篇文章的重点””找出这个页面上所有的营养成分数据”…… Google在4月14日推出的「Skills