MiniMax M1推理模型:闷声干活的实力派
MiniMax在推理模型赛道上的存在感不算高,但M1的成绩单说明他们是认真在做事的。 M1的定位M1是MiniMax的推理模型系列,对标的是OpenAI的o系列和DeepSeek的R1。核心能力集中在数学推理、代码生成和逻辑分析。 在SWE...
AI前沿资讯与深度分析
MiniMax在推理模型赛道上的存在感不算高,但M1的成绩单说明他们是认真在做事的。 M1的定位M1是MiniMax的推理模型系列,对标的是OpenAI的o系列和DeepSeek的R1。核心能力集中在数学推理、代码生成和逻辑分析。 在SWE...
MiniMax这家公司在国内AI圈一直比较低调,但海螺AI的视频生成能力在圈内已经有了不小的口碑。 产品形态海螺AI是MiniMax面向C端的产品,涵盖文本对话、语音合成和视频生成。其中视频生成是最拿得出手的。 用户可以通过文字描述生成短视...
OpenClaw爆火之后没多久就遇到了一个棘手的问题——有人在npm上发布了名称相似的恶意包,试图冒充OpenClaw的官方依赖。 事件经过攻击者注册了几个和OpenClaw官方包名称非常接近的npm包(典型的typosquatting攻击...
DeepSeek在数学定理证明领域搞了个专用模型Prover-V2,目标是用AI在Lean 4形式化验证系统里自动证明数学定理。 这个方向为什么重要?数学定理证明是AI能力的一个极端测试场。因为数学不接受”差不多对”——证明要么完全正确,要...
2026年的GitHub Copilot和两年前已经不是同一个产品了。 从补全到Agent最初Copilot就是个代码补全工具——你写一行,它补下一行。现在它能: 接收GitHub issue作为输入,自主完成整个开发流程 在VS Cod...
智谱AI最近有两件大事:发布了新一代的GLM-5模型,同时传出了赴港交所上市的消息。 GLM-5的升级GLM-5相比4.7系列的提升主要在: 推理能力进一步加强,数学和代码benchmark有明显提升 多模态能力扩展,支持图文理解和生成 ...
AI安全研究组织METR做了一个实验,结论让不少人大跌眼镜:有经验的开发者使用AI编程工具后,完成任务的速度反而下降了19%。 实验设计METR找了一批有经验的软件开发者,让他们在两种条件下完成相同的编程任务: 实验组:可以自由使用AI编...
Codex在OpenAI产品线里的定位一直在变。最早是代码补全工具,后来变成独立的编程模型(GPT-5.3-Codex),现在又并入了GPT-5.4的统一架构。 Codex CLI值得一提的是OpenAI后来开源的Codex CLI——一个...
马斯克旗下的xAI最近两件事叠在一起引发了大量讨论:Grok 4发布 + SpaceX可能以2500亿美元收购xAI的传闻。 Grok 4的表现Grok 4在多项benchmark上的成绩确实不错: 编程和推理任务上逼近GPT-5.x和C...
OpenAI宣布关停Sora视频生成服务的消息在圈内引发了不小的震动——毕竟这是当初发布时最轰动的产品之一。 为什么关了核心原因很现实:每天亏损约100万美元。 视频生成的计算成本远高于文本生成。每次生成一段视频需要的GPU算力是文本对话的...