DeepSeek V4和Qwen 3.5:当开源AI开始认真卷价格,闭源还剩什么优势?
有个数字挺有意思:2025年初,DeepSeek和Qwen加起来占全球AI市场份额不到1%;到2026年1月,这个数字变成了15%。 一年时间,从边缘选手跑到行业不能忽视的位置,速度快得有点离谱。 背后发生了什么,值得梳理一下。 DeepS...
AI前沿资讯与深度分析
有个数字挺有意思:2025年初,DeepSeek和Qwen加起来占全球AI市场份额不到1%;到2026年1月,这个数字变成了15%。 一年时间,从边缘选手跑到行业不能忽视的位置,速度快得有点离谱。 背后发生了什么,值得梳理一下。 DeepS...
如果你最近在关注AI行业,应该注意到一件有意思的事:两个中国开源模型正在抢占同一片市场,而且都在用极低的成本挑战那些动辄要价几十美元每百万token的闭源巨头。 DeepSeek V4和Qwen 3.5(部分渠道已标注为Qwen 3.6-P...
Claude Code和市面上的AI编程工具走了一条完全不同的路——它就是个命令行程序,没有GUI,没有花哨的编辑器界面。 乍一看像是在开倒车,但用过的开发者基本都表示”回不去了”。 为什么终端反而更强?终端意味着Claude Code可以...
两年前”Prompt工程师”还像个段子。到了2025年底,这个领域已经分化成了两条路:日常提示(人人都能做)和生产级上下文工程(真正的工程活)。 核心技术不神秘 Zero-Shot:直接下指令,不给例子 Few-Shot:在提示里放几个示例...
Cursor今年加的OS级别安全沙箱解决了一个AI编程工具的根本信任问题:你让AI在你的电脑上执行代码,它会不会搞出什么破坏? 问题背景AI编程agent不只是生成代码——它还要执行代码。跑终端命令、读写文件、安装依赖包。如果agent犯了...
两年前主流模型的上下文窗口还在4K到8K这个量级,现在百万级token已经是旗舰模型的标配了。 当前格局 Gemini 2.5 Pro:100万token(可扩展到200万) Claude Opus 4.6:100万token(beta) ...
在H20之后,智谱在GLM-4.6版本上进一步探索了国产AI芯片的适配。 背景美国芯片出口管制在持续收紧。H20已经是”阉割版”,未来连H20也可能受限。中国AI公司需要为完全依赖国产芯片的场景做准备。 国产AI芯片生态目前可选的国产AI芯...
Crunchbase年终盘点出了六张图,数据看完只有一个感受:AI正在虹吸全球的风险资本。 核心数字 2025年全球AI投资:$2023亿(同比+75%) AI占全球风投比例:接近50% 基础模型公司融资:$800亿(是2024年的2.6倍...
智谱的GLM-4.7发布时没有铺天盖地的benchmark战报,反而是主打生产环境的稳定性和一致性。 为什么稳定性这么重要?开发者在实际项目中遇到的最大痛点往往不是”模型不够聪明”,而是”模型表现不稳定”。同一个prompt跑十次,可能有七...
SWE-bench已经成了AI编程能力的”高考分数线”——每个新模型发布必报的数字。但这个benchmark到底在考什么?刷到80%以上就意味着AI真的能当程序员了吗? 测试方式SWE-bench用的是真实GitHub issue。从Dja...