Perplexity拉英特尔做混合推理，敏感数据留本地 - News

一家靠云端大模型起家的 AI 公司，突然说想把一半的活推回到你电脑上跑——这事听着反常，但 Perplexity 的算盘其实很实在：云太贵了。

6 月 2 日的台北 Computex，Perplexity CEO Aravind Srinivas 拉着英特尔 CEO 陈立武（Lip-Bu Tan）一起上台，亮了个新东西，他们管它叫”混合智能体推理”（hybrid agentic inference）。

让一个本地小模型当”交通警察”

核心机制不复杂：在你电脑上跑一个轻量的本地模型，让它当调度员，实时判断每一步该在哪儿算。

简单活留在本地：总结一篇你已经写好的文档、调个格式、做点轻量分类——这些本地就办了
重活才上云：需要前沿大模型硬实力的复杂推理，才往云端送
敏感的部分留下来：财务记录、健康信息这类数据，能不出本机就不出，真要上云之前还会问你一句

这套逻辑最戳企业痛点的地方，不是快，是数据不用全交出去。

企业用 AI Agent 最大的一块顾虑就是数据治理——你的合同、报表、客户资料，凭什么整个打包送到别人的服务器上。Perplexity 这套做法相当于给了一个折中：能在本地解决的就不外传，必须上云的，也尽量把敏感那部分摘掉再走。

7 月上线，先吃英特尔，但不绑死英特尔

落地的细节也给了：

项目	情况
上线时间	7 月，进 Perplexity Computer
首发平台	Windows PC 应用
演示硬件	英特尔 Core Ultra Series 3
芯片绑定	不绑——号称芯片无关，英伟达的处理器也支持

台上是英特尔的芯片，但 Perplexity 特意说了这套东西”芯片无关”，英伟达一样能跑。换句话说，它要的是把”本地+云”这个调度层做成标准，而不是给某一家硬件站台。对英特尔来说，能在 Computex 上站到 Perplexity 旁边，本身就是给自家 AI PC 芯片背书的好机会。

Srinivas 的真心话：有人一个月烧掉五个亿

为什么一家云 AI 公司要费劲把算力往回推？Srinivas 在台上说了句挺实在的：

“You don’t want all your compute centralized in servers… Some people are spending half a billion dollars per month.”

讲人话就是——你不会想把所有算力都堆在服务器上，有些公司一个月光这一项就烧掉五亿美金。

这句话背后是 Perplexity 自己的账。它的收入一年翻了五倍，到了 5 亿美元，可团队只扩了 34%。收入猛涨、人没怎么加，被撑大的就是云端推理那张账单。把一部分推理挪到用户自己的电脑上，等于让用户的硬件帮它分摊成本——这才是”端侧 AI”对一家烧钱公司最直接的吸引力。

这步棋指向哪

把这几件事串起来看就清楚了：算力越来越贵，企业又怕数据外流，而 PC 厂商正缺一个能让”AI PC”这个概念落地的杀手级理由。

Perplexity 这套东西，三头都想吃：替自己省云账单，给企业一个数据不全交出去的台阶，顺手把笔记本变成 AI 流量的调度中心。本地干轻活、云端干重活、敏感数据自己留着——这个分工要是真能跑顺，那”所有计算都在云端”的默认设定，可能就要松动了。

能不能兑现，7 月产品上线见真章。

参考来源：Perplexity AI unveils hybrid local-cloud inference system at Computex 2026（VentureBeat）；Perplexity Wants Your Laptop to Do Part of the AI Work—So It Doesn't Have To（Decrypt）；CocoLoop、Perplexity Computer adding ability to split tasks between local and cloud models（9to5Mac）