2月17日,阿里巴巴在网页链接页面低调推出了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型,这两款模型均支持文本和多模态任务。Qwen3.5-Plus是Qwen3.5系列的最新大语言模型,而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型。华为计算官方宣布,Qwen3.5模型开源后,昇腾0day实现了基于MindSpeedMM在Atlas800A3、Atlas900A3SuperPoD上的训练复现,并支持基于vLLM-Ascend和SGLang在Atlas800A2、Atlas800A3上的高效推理部署。
Qwen3.5在底层模型架构上进行了全面革新,Qwen3.5-Plus版本总参数达到3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。在能力、效率与通用性三个维度上推进预训练,Qwen3.5-397B-A17B在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍,且性能相当。此外,Qwen3.5-397B-A17B的解码吞吐量分别是Qwen3-235B-A22B的3.5倍/7.2倍。多语言覆盖从119增至201种语言/方言,25万词表在多数语言上带来约10–60%的编码/解码效率提升。


