Qwen3-Max的混合推理模式:一个模型怎么做到"想不想随便你"
Qwen3系列里最有技术含量的设计之一是混合推理模式——同一个模型内置了thinking和non-thinking两种工作状态。 怎么工作的 Thinking mode:模型会先生成一段内部推理过程(类似Chain-of-Thought),
Qwen3系列里最有技术含量的设计之一是混合推理模式——同一个模型内置了thinking和non-thinking两种工作状态。 怎么工作的 Thinking mode:模型会先生成一段内部推理过程(类似Chain-of-Thought),
2026年AI编程工具三足鼎立的格局基本定型了。三家走了完全不同的路线: 定位差异 工具 本质 强项 Claude Code 终端agent 复杂多文件改动、大仓库理解 Cursor 独立AI IDE 日常编辑体验、补全速度 GitHub
有个数字挺有意思:2025年初,DeepSeek和Qwen加起来占全球AI市场份额不到1%;到2026年1月,这个数字变成了15%。 一年时间,从边缘选手跑到行业不能忽视的位置,速度快得有点离谱。 背后发生了什么,值得梳理一下。 DeepS
如果你最近在关注AI行业,应该注意到一件有意思的事:两个中国开源模型正在抢占同一片市场,而且都在用极低的成本挑战那些动辄要价几十美元每百万token的闭源巨头。 DeepSeek V4和Qwen 3.5(部分渠道已标注为Qwen 3.6-P
Claude Code和市面上的AI编程工具走了一条完全不同的路——它就是个命令行程序,没有GUI,没有花哨的编辑器界面。 乍一看像是在开倒车,但用过的开发者基本都表示”回不去了”。 为什么终端反而更强?终端意味着Claude Code可以
两年前”Prompt工程师”还像个段子。到了2025年底,这个领域已经分化成了两条路:日常提示(人人都能做)和生产级上下文工程(真正的工程活)。 核心技术不神秘 Zero-Shot:直接下指令,不给例子 Few-Shot:在提示里放几个示例
Cursor今年加的OS级别安全沙箱解决了一个AI编程工具的根本信任问题:你让AI在你的电脑上执行代码,它会不会搞出什么破坏? 问题背景AI编程agent不只是生成代码——它还要执行代码。跑终端命令、读写文件、安装依赖包。如果agent犯了
两年前主流模型的上下文窗口还在4K到8K这个量级,现在百万级token已经是旗舰模型的标配了。 当前格局 Gemini 2.5 Pro:100万token(可扩展到200万) Claude Opus 4.6:100万token(beta)
在H20之后,智谱在GLM-4.6版本上进一步探索了国产AI芯片的适配。 背景美国芯片出口管制在持续收紧。H20已经是”阉割版”,未来连H20也可能受限。中国AI公司需要为完全依赖国产芯片的场景做准备。 国产AI芯片生态目前可选的国产AI芯
Crunchbase年终盘点出了六张图,数据看完只有一个感受:AI正在虹吸全球的风险资本。 核心数字 2025年全球AI投资:$2023亿(同比+75%) AI占全球风投比例:接近50% 基础模型公司融资:$800亿(是2024年的2.6倍