阿里Qwen3.5模型发布:性能超万亿参数,推理效率提升19倍
创始人
2026-02-17 14:25:58
0

2月17日,阿里巴巴在网页链接页面低调推出了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型,这两款模型均支持文本和多模态任务。Qwen3.5-Plus是Qwen3.5系列的最新大语言模型,而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型。华为计算官方宣布,Qwen3.5模型开源后,昇腾0day实现了基于MindSpeedMM在Atlas800A3、Atlas900A3SuperPoD上的训练复现,并支持基于vLLM-Ascend和SGLang在Atlas800A2、Atlas800A3上的高效推理部署。

Qwen3.5在底层模型架构上进行了全面革新,Qwen3.5-Plus版本总参数达到3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。在能力、效率与通用性三个维度上推进预训练,Qwen3.5-397B-A17B在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍,且性能相当。此外,Qwen3.5-397B-A17B的解码吞吐量分别是Qwen3-235B-A22B的3.5倍/7.2倍。多语言覆盖从119增至201种语言/方言,25万词表在多数语言上带来约10–60%的编码/解码效率提升。

相关内容

热门资讯

特斯拉Robotaxi夜间无人... 5月5日,特斯拉在奥斯汀的Robotaxi服务实现了新的里程碑,首次在晚间开启无人监管运营模式,打破...
嘉兴移动充电站“五一”高效服务... 5月4日,全国高速公路在“五一”假期期间车流量激增,浙江嘉兴地区通过在服务区等地点部署移动充电设备,...
日产全固态电池突破:充电快、续... 近日,日产汽车在横滨工厂的试产线上完成了车用全固态电池原型测试。这一原型样品由23层电芯组成,其充放...
领克10量产车下线!最高续航8... 今日,领克汽车销售公司宣布领克10首台量产车正式下线。领克10推出三款配置,分别为701长续航版20...
“女司机炫耀自动驾驶双手离盘,... 近日,浙江温州高速交警接到举报,一名驾驶人在社交平台发布驾驶时双手脱离方向盘的视频。视频中,该驾驶人...
女司机高速上化妆跳舞,交警:辅... 近日,浙江温州高速交警接到群众举报,称一名女子在社交平台发布多条危险驾驶视频。视频中,该女子在高速公...
领克10量产车下线,预售价20... 5月5日,领克汽车销售公司常务副总经理周钘宣布,领克品牌的10首台量产车正式下线。这款新车在2026...
Meta收购AI机器人公司AR... Meta于5月1日完成了对物理AI模型初创企业AssuredRobot Intelligence(A...
OpenAI加速AI Agen... IT之家5月5日消息,天风国际分析师郭明錤更新产业调查报告,透露OpenAI可能正在加速开发首款AI...
大众汽车面临碳排放罚款压力,电... 5月5日,大众汽车集团面临欧盟电动化转型压力,需销售更多电动汽车以减少碳排放,避免巨额罚款。然而,电...