苹果的端侧AI路线：3B参数模型塞进iPhone还要保隐私

苹果的AI策略和其他家很不一样——不卷最强通用模型，主打端侧部署和隐私保护。

端侧模型：3B参数

2025年WWDC上苹果公布了Apple Foundation Models（AFM），端侧版本大约30亿参数，专门为Apple Silicon优化。

几个关键技术：

最终效果：一个3B参数的模型压缩到可以在iPhone上流畅运行，同时保持足够的能力水平。

处理不了的复杂任务交给服务端，但用的是苹果自己的Private Cloud Compute——在苹果自研芯片的云服务器上跑，数据不离开苹果的安全飞地。

服务端架构叫Parallel-Track MoE，由多个较小的Transformer”轨道”并行处理token，只在输入和输出边界做同步。同步开销减少了87.5%。

苹果这套设计的优先级排序很清楚：

这和OpenAI、Anthropic、Google那种”一切上云”的路线形成鲜明对比。苹果赌的是：用户愿意为隐私牺牲一些能力上限。

开发者也有福利——苹果开放了Foundation Models框架，第三方app可以直接调用端侧模型。不过能力上和GPT-4级别的云端模型还有差距，更适合做轻量级的文本处理和理解任务。

参考来源：Apple Machine Learning Research