AMD 把 192 GB 内存焊进一颗 APU 里:本地能跑 300B 大模型,第一次

192 GB。这是 AMD 新一代 Ryzen AI Max 400 单颗芯片的统一内存上限。

这意味着——你电脑里装一颗 APU,本地能跑 300B 参数以上的大模型。在 x86 这边,这是头一次。

这颗芯片叫 Gorgon Halo

代号 “Gorgon Halo”,正式名 Ryzen AI Max 400 系列,是去年 Strix Halo(Ryzen AI Max 300)的小升级版。

规格抄一下——

Gorgon Halo (Max 400) Strix Halo (Max 300)
CPU 16 Zen 5 核 / 32 线程 16 Zen 5 / 32
CPU 频率上限 5.2 GHz 5.1 GHz
GPU 40 RDNA 3.5 CU 40 RDNA 3.5 CU
GPU 频率上限 3.0 GHz 2.9 GHz
NPU XDNA 2, 55 TOPS XDNA 2, 50 TOPS
统一内存上限 192 GB 128 GB
可作 VRAM 160 GB 96 GB

主升级就在最后两行——内存上限往上抬了 64 GB

CPU、GPU、NPU 都是小幅频率提升,没换架构。这本来是一颗”挤牙膏”芯片,但内存这一刀切下来,整个故事变了。

为什么 192 GB 是个分水岭

300B 参数的模型,4-bit 量化之后大概占 150 GB 显存。再加上 KV cache 和系统开销,160 GB 可用 VRAM 刚好够。

之前在 x86 客户端上跑 300B 模型基本不可能——

  • MacBook Pro M4 Max:最高 128 GB 统一内存,够 70B 但够不到 300B
  • 任何 RTX 5090 / 5080 配置:单卡 24-32 GB,三卡四卡的配置才能拼出 100+ GB,价格 $1 万起
  • Ryzen AI Max 300:128 GB 上限,跟 M4 Max 一档

Gorgon Halo 的 192 GB 是第一次把 “本地跑 300B 大模型” 这件事从”得攒一台服务器”变成”买台笔记本就能”。

讲人话:DeepSeek V4 Pro 1.6T 这种当然还跑不动,但 Llama 3.3 405B、Qwen3.6-Max 27B、GLM-5.1 中等档位,这一颗芯片全包了。

AMD 这步棋的真正算盘

不在游戏本市场,在 AI Agent。

agentic workload 跑起来的时候,一个 long-running agent 可能要在本地维护一份大模型权重几小时不卸载。如果走云 API,每秒推理调用的费用累积起来很贵;如果有本地能跑的设备,对于专业用户(开发者、研究员、企业内部工程团队),这个 ROI 算得过来。

具体场景——

  • Claude Code / Codex 的离线替代:开发者本地跑一个 70B-300B 模型做代码补全,不发数据出去
  • 企业敏感数据分析:法务、医疗、金融行业不能用云模型的,本地 LLM 是唯一解
  • 长跑 agent:研究员跑一个自动文献综述 agent 8 小时,云 API 账单会烧穿预算

XDNA 2 NPU 给到 55 TOPS,是给”小模型常驻”用的——常驻一个 7B 处理琐碎任务,主模型 300B 按需调用。这是个分层架构。

一个不太友好的细节

OEM 厂出货时间是 2026 Q3——ASUS、HP、Lenovo 三家先做。意味着真正能买到这颗芯片,最早是 7 月。

而且 192 GB 配置不会便宜。Strix Halo 满配版本现在零售价 $3000 美元上下,Gorgon Halo 满配预计 $4000+。再加上整机其他配件,一台能跑 300B 模型的笔记本电脑——大概率落在 $5000-6000 美元区间。

讲人话:这颗芯片不是给普通消费者的。是给那批”以前要买 H100 或 RTX 6000 Ada”的小团队、研究员、独立开发者的。

但对这群人来说,$5000 的笔记本能跑 300B 模型,比 $30,000 一张的 H100 划算得多。

这件事对生态的意义

AMD 这两年的 AI 策略其实变得很清楚——

  • 数据中心:MI300X / MI400 跟 Nvidia 死磕
  • 消费端 APU:把 NPU + 大 GPU + 大内存做一颗,让本地模型可跑

Nvidia 在消费端的 RTX 50 系列至今没给统一内存方案。AMD 这边相当于绕开正面战场,去另一条路上抢”本地 AI 推理”这个新市场。

如果 Gorgon Halo Q3 上市之后,本地 LLM 工具链(llama.cpp、Ollama、LM Studio)配合的好——这条路有可能跑得通。

接下来盯什么——Apple M5 Max 的内存上限。如果苹果今年秋天发的 M5 Max 也把内存往上提到 192 GB 甚至更高,这场本地 AI 推理的硬件战就要正经打了。

参考来源:AMD Ryzen AI Max 400 'Gorgon Halo' packs up to 192GB of unified memory(Tom's Hardware)、AMD Pushes Ryzen AI MAX 400 to 192GB Memory, Letting a Single Chip Run 300B+ Parameter LLMs Locally(WCCFTech)、AMD Ryzen AI Max 400: New APU Unlocks 192GB Unified Memory(HotHardware)、AMD confirms Ryzen AI MAX 400 will support up to 192GB memory and 160GB VRAM(VideoCardz)