AI推理资讯与深度分析

收录 AI推理相关 AI 新闻、产品动态和产业观察。本页收录 9 篇已发布文章。

美国还在收紧芯片出口，DeepSeek 这边换了个思路：既然高端卡拿不够，那就让每一张卡多干点活。 6 月 30 日，DeepSeek 联合北京大学开源了一个叫 DSpark 的推理框架。一句话说清它干嘛的——同样的模型、同样的卡，让 AI

先记住一个数：1000。这是小米 MiMo 团队 6 月 8 日甩出来的成绩——一个一万亿参数的大模型，每秒能吐出 1000 多个 token，峰值冲到 1200。这个数字什么概念？你平时用 ChatGPT、Claude，每秒大概也就几十

英伟达、AMD 和 CoreWeave 很少同时站到一张投资人名单上。Tensormesh 这轮融资之所以值得看，不是因为金额有多大，而是因为它切中了 AI 推理成本里最浪费的一块：重复计算。 5 月 27 日，Tensormesh 宣布完

MiniMax在推理模型赛道上的存在感不算高，但M1的成绩单说明他们是认真在做事的。 M1的定位 M1是MiniMax的推理模型系列，对标的是OpenAI的o系列和DeepSeek的R1。核心能力集中在数学推理、代码生成和逻辑分析。在

"Thinking model"在2025年彻底成了主流概念。几乎每家头部AI公司都推出了自己的推理模型，核心卖点都一样：模型在回答之前先在内部"想一想" 。各家路线 OpenAI o系列：最早把"思考"概念产品化的。o1到o3一路迭

ARC AGI这个测试一直被看作是衡量AI"通用推理能力"的硬指标——不靠死记硬背，不靠pattern matching，纯粹考察模型能不能在没见过的抽象任务上灵活应变。 GPT 5.2在ARC AGI 1上拿到了 72% ，ARC AGI

今年1月，DeepSeek把R1推理模型直接开源了，社区的反应很直接：没想到开源这边已经卷到这个程度了。先看硬指标： AIME数学竞赛：77.5分 MATH 500 ：96.2分 Codeforces编程：94百分位 MMLU ：0

去年3月底，Google放出了Gemini 2.5 Pro，官方说法是"迄今最智能的模型"。这种说法每家都会喊，但这次Gemini 2.5 Pro的跑分确实有点东西：数学和科学推理 AIME 2024 ：92.0% AIME 2025

2月5号Anthropic发了Opus 4.6，最核心的升级叫 Adaptive Thinking（自适应思考）。以前 vs 现在以前用extended thinking，得手动设预算——让模型想10秒还是30秒，全靠开发者拍脑袋定。

AI推理 资讯与深度分析