Grok 4.3来了:视频分析、生成PPT、TTS比竞品便宜90%,但$300没有记忆是真的难绷

xAI在4月17日上线了Grok 4.3 Beta,但时机挺微妙——同一天Anthropic发布了Claude Opus 4.7。两个消息叠在一起,Grok 4.3的讨论量难免被分流。

不过4.3这次更新确实有几个值得说的地方。

这次更新了什么

视频输入来了

Grok 4.20只能处理图片,4.3加入了原生视频分析。可以直接分享视频片段,让Grok读内容、回答问题。

直接生成文档

对话框里就能生成:

  • 带格式的PDF
  • 完整填充的Excel表格
  • PowerPoint幻灯片

对需要频繁整理汇报的用户,这个实用性比较高。

开发者语音API:定价是亮点

同步开放的STT(语音转文字)和TTS(文字转语音)API,价格比主流竞品低得多:

服务 Grok 4.3 OpenAI ElevenLabs
TTS(每百万字符) 4.20美元 30美元+ 30美元+
STT(流式,每小时) 0.20美元 0.36美元 -

比竞品便宜86-92%,差距相当大。

STT支持25种以上语言,有说话人分离和词级时间戳;TTS有5种声音、20+种语言,还支持表情标签比如[laugh][sigh][whisper]

保留下来的核心优势

两个沿用自4.20的关键特性:

  • 2M token上下文窗口:目前西方闭源模型里最大的
  • 16-agent Heavy并行系统:处理复杂多步任务时可以同时跑16个子agent

参数量大约0.5T,据报道1T规模的训练已经完成,但还没有完全部署。

300美元没有记忆,这是最大的槽点

Grok 4.3 Beta只对SuperGrok Heavy开放,月费300美元。

但到现在,Grok还是没有会话记忆功能。每次对话都要重新介绍自己的背景、偏好和工作上下文。在20美元/月的工具上可以理解,在300美元这个价格上很难自圆其说:

  • Claude Max 200美元/月 → 有Project记忆
  • ChatGPT Pro 200美元/月 → 有记忆功能
  • Grok Heavy 300美元/月 → 无记忆

这个差距,xAI大概也知道是痛点,但这次更新没有解决。

跟谁竞争,竞争什么

Grok 4.3的方向是多模态生成和开发者工具:视频理解、文档生成、便宜的语音API。

Claude Opus 4.7的方向是深度推理和agentic任务:更强的多步任务执行、更可靠的Agent表现。

两款产品定位有差异,不是完全直接竞争的关系。

对语音产品开发者来说,Grok 4.3的TTS/STT定价优势很明显。对想要全能日常AI助手的个人用户来说,300美元/月没有记忆这件事,可能是让人打退堂鼓的主要原因。

完整推出预计在5月中下旬。

参考来源:Grok 4.3 Review: What's New in xAI's Latest Model (April 2026)(TechSifted);xAI rolls out Grok 4.3 beta for SuperGrok Heavy subscribers(PiunikaWeb)