阿里Qwen3.5模型发布:性能超万亿参数,推理效率提升19倍
创始人
2026-02-17 14:25:58
0

2月17日,阿里巴巴在网页链接页面低调推出了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型,这两款模型均支持文本和多模态任务。Qwen3.5-Plus是Qwen3.5系列的最新大语言模型,而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型。华为计算官方宣布,Qwen3.5模型开源后,昇腾0day实现了基于MindSpeedMM在Atlas800A3、Atlas900A3SuperPoD上的训练复现,并支持基于vLLM-Ascend和SGLang在Atlas800A2、Atlas800A3上的高效推理部署。

Qwen3.5在底层模型架构上进行了全面革新,Qwen3.5-Plus版本总参数达到3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。在能力、效率与通用性三个维度上推进预训练,Qwen3.5-397B-A17B在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍,且性能相当。此外,Qwen3.5-397B-A17B的解码吞吐量分别是Qwen3-235B-A22B的3.5倍/7.2倍。多语言覆盖从119增至201种语言/方言,25万词表在多数语言上带来约10–60%的编码/解码效率提升。

相关内容

热门资讯

【2026新春走基层】广州从化... 2月17日,正月初一,市民蒋先生带着父母、女儿来到广州市从化区流溪温泉广场驿站游玩,他们穿梭在亲水栈...
领克900亮相春晚义乌分会场,... 近日,中央广播电视总台《2026年春节联欢晚会》义乌分会场,领克汽车以百余辆领克900组成“吉”字车...
多点发力畅通旅客出行“最后一公... 央视网消息:16日,全国铁路预计发送旅客710万人次,计划加开旅客列车301列。为方便夜间到达的旅客...
透过新春热力图看各地文旅市场“... 央视网消息:2月16日是春节假期的第二天,很多人选择走出家门,享受假期美好时光,全国文旅市场也持续火...
通讯|暖风拂动“中国红”——阿... 新华社迪拜2月17日电 通讯|暖风拂动“中国红”——阿联酋新春见闻新华社记者夏晓 温新年春节临近,阿...
视频丨加方人士期待中方对加免签... 中方决定自2月17日起,对加拿大持普通护照人员实施30天免签政策。对此,加拿大相关人士及官员表示,中...
【骐骥迎新】马年春晚,“骐骥驰... 作者:谢伟锋除夕爆竹声起,中央广播电视总台《2026年春节联欢晚会》如约而至。2月16日晚8点,全球...
2026春晚AI机器人大放异彩... 2月17日,2026年总台春晚以其高科技创新含量引发广泛关注。节目融合了杂技与科技的《难忘今宵》、机...
AI巨头月之暗面融资100亿美... 今日消息,AI模型开发公司月之暗面(MoonshotAI)于今年1月底启动了新一轮融资计划,目标是以...
除夕,他们坚守岗位 ↑ 2月16日,在云南红河站,铁路工作人员龚岸敏(右二)为旅客提供咨询服务。新华社发(薛莹莹摄)除夕...