算力太贵,Perplexity 想让你的笔记本替云端干一半活:拉上英特尔,敏感数据留在本地不上传

一家靠云端大模型起家的 AI 公司,突然说想把一半的活推回到你电脑上跑——这事听着反常,但 Perplexity 的算盘其实很实在:云太贵了。

6 月 2 日的台北 Computex,Perplexity CEO Aravind Srinivas 拉着英特尔 CEO 陈立武(Lip-Bu Tan)一起上台,亮了个新东西,他们管它叫”混合智能体推理”(hybrid agentic inference)。

让一个本地小模型当”交通警察”

核心机制不复杂:在你电脑上跑一个轻量的本地模型,让它当调度员,实时判断每一步该在哪儿算。

  • 简单活留在本地:总结一篇你已经写好的文档、调个格式、做点轻量分类——这些本地就办了
  • 重活才上云:需要前沿大模型硬实力的复杂推理,才往云端送
  • 敏感的部分留下来:财务记录、健康信息这类数据,能不出本机就不出,真要上云之前还会问你一句

这套逻辑最戳企业痛点的地方,不是快,是数据不用全交出去

企业用 AI Agent 最大的一块顾虑就是数据治理——你的合同、报表、客户资料,凭什么整个打包送到别人的服务器上。Perplexity 这套做法相当于给了一个折中:能在本地解决的就不外传,必须上云的,也尽量把敏感那部分摘掉再走。

7 月上线,先吃英特尔,但不绑死英特尔

落地的细节也给了:

项目 情况
上线时间 7 月,进 Perplexity Computer
首发平台 Windows PC 应用
演示硬件 英特尔 Core Ultra Series 3
芯片绑定 不绑——号称芯片无关,英伟达的处理器也支持

台上是英特尔的芯片,但 Perplexity 特意说了这套东西”芯片无关”,英伟达一样能跑。换句话说,它要的是把”本地+云”这个调度层做成标准,而不是给某一家硬件站台。对英特尔来说,能在 Computex 上站到 Perplexity 旁边,本身就是给自家 AI PC 芯片背书的好机会。

Srinivas 的真心话:有人一个月烧掉五个亿

为什么一家云 AI 公司要费劲把算力往回推?Srinivas 在台上说了句挺实在的:

“You don’t want all your compute centralized in servers… Some people are spending half a billion dollars per month.”

讲人话就是——你不会想把所有算力都堆在服务器上,有些公司一个月光这一项就烧掉五亿美金。

这句话背后是 Perplexity 自己的账。它的收入一年翻了五倍,到了 5 亿美元,可团队只扩了 34%。收入猛涨、人没怎么加,被撑大的就是云端推理那张账单。把一部分推理挪到用户自己的电脑上,等于让用户的硬件帮它分摊成本——这才是”端侧 AI”对一家烧钱公司最直接的吸引力。

这步棋指向哪

把这几件事串起来看就清楚了:算力越来越贵,企业又怕数据外流,而 PC 厂商正缺一个能让”AI PC”这个概念落地的杀手级理由。

Perplexity 这套东西,三头都想吃:替自己省云账单,给企业一个数据不全交出去的台阶,顺手把笔记本变成 AI 流量的调度中心。本地干轻活、云端干重活、敏感数据自己留着——这个分工要是真能跑顺,那”所有计算都在云端”的默认设定,可能就要松动了。

能不能兑现,7 月产品上线见真章。

参考来源:Perplexity AI unveils hybrid local-cloud inference system at Computex 2026(VentureBeat);Perplexity Wants Your Laptop to Do Part of the AI Work—So It Doesn't Have To(Decrypt);Perplexity Computer adding ability to split tasks between local and cloud models(9to5Mac)