Qwen3.7-Plus 最值得说的一点,不是它会看图——是它答完一句不会停。
6 月 2 日,阿里 Qwen 团队上线了这款新模型。它是 Qwen3.7-Max 的多模态版:Max 只懂文字,Plus 能看懂图片和视频。但真正的卖点,在它”agent”的那一面。
一个会”自己循环”的模型
官方给 Qwen3.7-Plus 列了五样本事:
- 深度推理
- 自己写代码
- 调用工具
- 自我验证、测试
- 自主迭代
最后这条”自主迭代”是关键。说白了就是——它会自己 loop 到把任务干完,而不是答一句就撒手。这让它适合接那种要跑很久的长任务,不是一问一答的小活。
视觉这块排到第几
在 LM Arena 的 Vision Arena 榜上,Qwen3.7-Plus 排到第 16,把阿里送进了全球视觉能力的第 5 名梯队。OCR、读图表、逐帧分析视频这类活,是它的主场。
文字那边,兄弟款 Qwen3.7-Max 在 Artificial Analysis 智能指数上拿了 56.6 分,发布时是国产模型里排得最靠前的。
怎么做到”越用越准”
Qwen3.7-Plus 跟那些只会推理、不会进化的模型有个区别:它带一套 Agentic RL 机制,拿真实的执行结果回头修正自己的判断——干一次、看结果、改一次。
它现在只走 API,挂在阿里云的百炼平台上(国际版叫 Model Studio)。百炼自带一套安全护栏,把这些会自己执行命令的 agent 框在能动手的范围里——毕竟让模型自己跑命令,出岔子的代价不一样。
还没公开的几件事
有意思的是,阿里这次留了一手:定价、上下文窗口多大、最多输出多少 token、要不要开源——一个都没说。
模型本身是闭源的。对一向以开源出名的 Qwen 来说,这个选择本身就值得琢磨。越往 agent 这个方向走,开不开源、怎么收费,越成了真金白银的事。
参考来源:Alibaba's Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform(MarkTechPost)