Llama 4首次上MoE架构:Scout和Maverick同时登场
去年4月5号Meta放出了Llama 4,这是Llama系列第一次用MoE架构。同时发了两个型号: Llama 4 Scout 激活参数:17B / 总参数约109B 专家数量:16个 上下文窗口:1000万token 没错,一千
去年4月5号Meta放出了Llama 4,这是Llama系列第一次用MoE架构。同时发了两个型号: Llama 4 Scout 激活参数:17B / 总参数约109B 专家数量:16个 上下文窗口:1000万token 没错,一千
Google的NanoBanana是一个面向端侧部署的轻量级图像生成模型,和Stable Diffusion那种动辄几十GB的模型走了完全不同的路。 核心卖点在手机上跑图像生成。 不需要云端服务器,不需要强大的GPU。模型小到可以在移动设备
今年2月12号,Anthropic官宣完成了300亿美元G轮融资,投后估值3800亿美元。2026年最大的一笔风投,有史以来第二大——仅次于OpenAI去年拿到的400亿。 投资阵容领投:GIC(新加坡主权基金)、Coatue 联合领投:D
阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,
腾讯的QClaw是一个嵌入微信生态的AI agent,定位很清楚——不另起炉灶,就在微信里干活。 产品形态QClaw不是一个独立App,而是通过微信小程序和公众号生态触达用户。这意味着它天然拥有微信的十亿级用户基础,不需要从零开始拉新。 核
去年十月Demis Hassabis和John Jumper因为AlphaFold 2拿到了诺贝尔化学奖。一个AI系统,把困扰结构生物学五十年的蛋白质折叠问题给解了——预测精度达到原子级别,几个小时出结果,传统方法要几个月。 影响有多大Al
去年7月,月之暗面直接开源了Kimi K2——一个万亿参数的MoE大模型,每个token只激活32B参数。 架构亮点 总参数:1万亿 每token激活:32B 训练数据:约15.5万亿token 上下文:128K(后续升级到256K) 优化
今年1月27号,月之暗面发布了Kimi K2.5——在K2的基础上加了原生多模态和Agent Swarm功能。 Agent Swarm是什么核心概念:把一个复杂任务拆解成多个子任务,每个子任务分配给一个独立的agent并行执行。 举个例子—
去年Build大会上GitHub宣布了一个大更新:Copilot现在可以作为一个独立agent来干活了。 怎么用?操作很简单——在GitHub上把一个issue指派给Copilot,或者在VS Code里给它下指令。它会自动启动一个安全的开
3月5号OpenAI发了GPT-5.4,最大的变化是:不再搞专门的编程模型了。 之前GPT-5.3-Codex是独立的编程专用模型,和主线GPT-5.x分开发布。现在GPT-5.4直接把前沿编程能力、推理能力和Computer Use统一到