xAI在4月17日上线了Grok 4.3 Beta,但时机挺微妙——同一天Anthropic发布了Claude Opus 4.7。两个消息叠在一起,Grok 4.3的讨论量难免被分流。
不过4.3这次更新确实有几个值得说的地方。
这次更新了什么
视频输入来了
Grok 4.20只能处理图片,4.3加入了原生视频分析。可以直接分享视频片段,让Grok读内容、回答问题。
直接生成文档
对话框里就能生成:
- 带格式的PDF
- 完整填充的Excel表格
- PowerPoint幻灯片
对需要频繁整理汇报的用户,这个实用性比较高。
开发者语音API:定价是亮点
同步开放的STT(语音转文字)和TTS(文字转语音)API,价格比主流竞品低得多:
| 服务 | Grok 4.3 | OpenAI | ElevenLabs |
|---|---|---|---|
| TTS(每百万字符) | 4.20美元 | 30美元+ | 30美元+ |
| STT(流式,每小时) | 0.20美元 | 0.36美元 | - |
比竞品便宜86-92%,差距相当大。
STT支持25种以上语言,有说话人分离和词级时间戳;TTS有5种声音、20+种语言,还支持表情标签比如[laugh]、[sigh]、[whisper]。
保留下来的核心优势
两个沿用自4.20的关键特性:
- 2M token上下文窗口:目前西方闭源模型里最大的
- 16-agent Heavy并行系统:处理复杂多步任务时可以同时跑16个子agent
参数量大约0.5T,据报道1T规模的训练已经完成,但还没有完全部署。
300美元没有记忆,这是最大的槽点
Grok 4.3 Beta只对SuperGrok Heavy开放,月费300美元。
但到现在,Grok还是没有会话记忆功能。每次对话都要重新介绍自己的背景、偏好和工作上下文。在20美元/月的工具上可以理解,在300美元这个价格上很难自圆其说:
- Claude Max 200美元/月 → 有Project记忆
- ChatGPT Pro 200美元/月 → 有记忆功能
- Grok Heavy 300美元/月 → 无记忆
这个差距,xAI大概也知道是痛点,但这次更新没有解决。
跟谁竞争,竞争什么
Grok 4.3的方向是多模态生成和开发者工具:视频理解、文档生成、便宜的语音API。
Claude Opus 4.7的方向是深度推理和agentic任务:更强的多步任务执行、更可靠的Agent表现。
两款产品定位有差异,不是完全直接竞争的关系。
对语音产品开发者来说,Grok 4.3的TTS/STT定价优势很明显。对想要全能日常AI助手的个人用户来说,300美元/月没有记忆这件事,可能是让人打退堂鼓的主要原因。
完整推出预计在5月中下旬。
参考来源:Grok 4.3 Review: What's New in xAI's Latest Model (April 2026)(TechSifted);xAI rolls out Grok 4.3 beta for SuperGrok Heavy subscribers(PiunikaWeb)