Grok 4.20:让四个AI在脑子里吵一架再给你答案,幻觉率从12%砍到4.2%
今年二月,xAI推出了Grok 4.20,不是Grok 5,而是一个结构上完全不同的东西:在同一个模型里跑四个有角色分工的agent,让它们互相质疑、辩论,最后合出一个答案。 这个想法听起来有点玄,但背后有一套具体的工程设计。 四个角色,一
共 2 篇文章
今年二月,xAI推出了Grok 4.20,不是Grok 5,而是一个结构上完全不同的东西:在同一个模型里跑四个有角色分工的agent,让它们互相质疑、辩论,最后合出一个答案。 这个想法听起来有点玄,但背后有一套具体的工程设计。 四个角色,一
马斯克旗下的xAI最近两件事叠在一起引发了大量讨论:Grok 4发布 + SpaceX可能以2500亿美元收购xAI的传闻。 Grok 4的表现Grok 4在多项benchmark上的成绩确实不错: 编程和推理任务上逼近GPT-5.x和Cl