Qwen3.5支持201种语言了,阿里的全球化野心藏不住了
今年2月17号,阿里在农历新年前夕放出了Qwen3.5——397B参数的开放权重模型,语言支持从82种直接拉到了201种。 主要升级原生多模态:文本、图片、视频在同一个模型里处理,不是外挂的adapter方案。这和Llama 4的early
共 5 篇文章
今年2月17号,阿里在农历新年前夕放出了Qwen3.5——397B参数的开放权重模型,语言支持从82种直接拉到了201种。 主要升级原生多模态:文本、图片、视频在同一个模型里处理,不是外挂的adapter方案。这和Llama 4的early
Qwen3系列里最有技术含量的设计之一是混合推理模式——同一个模型内置了thinking和non-thinking两种工作状态。 怎么工作的 Thinking mode:模型会先生成一段内部推理过程(类似Chain-of-Thought),
有个数字挺有意思:2025年初,DeepSeek和Qwen加起来占全球AI市场份额不到1%;到2026年1月,这个数字变成了15%。 一年时间,从边缘选手跑到行业不能忽视的位置,速度快得有点离谱。 背后发生了什么,值得梳理一下。 DeepS
如果你最近在关注AI行业,应该注意到一件有意思的事:两个中国开源模型正在抢占同一片市场,而且都在用极低的成本挑战那些动辄要价几十美元每百万token的闭源巨头。 DeepSeek V4和Qwen 3.5(部分渠道已标注为Qwen 3.6-P
阿里今年把Qwen3全系列模型用Apache 2.0协议开源了,从0.6B到235B一共8个尺寸,全线开放。 为什么Apache协议很重要?Apache 2.0基本上是最宽松的开源协议之一,意味着企业可以免费商用,不用额外谈授权。对比之下,