阿里发布Qwen3.5新模型:性能超万亿参数,推理效率飙升19倍!
创始人
2026-02-16 17:25:58
0

2月16日,阿里巴巴在网页链接页面低调发布了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型。Qwen3.5-Plus作为Qwen3.5系列的最新大语言模型,而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型,两者均支持文本和多模态任务。Qwen3.5-Plus版本拥有3970亿参数,激活170亿,性能超越了万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率显著提升,最大推理吞吐量可提升至19倍。

Qwen3.5-397B-A17B在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异,助力开发者与企业显著提升生产力。该模型采用创新的混合架构,结合线性注意力(GatedDeltaNetworks)与稀疏混合专家(MoE),实现出色的推理效率。总参数量达3970亿,每次前向传播仅激活170亿参数,在保持能力的同时优化速度与成本。此外,语言与方言支持从119种扩展至201种,为全球用户提供更广泛的可用性与更完善的支持。

Qwen3.5在能力、效率与通用性三个维度上推进预训练,通过早期文本-视觉融合与扩展的视觉/STEM/视频数据实现原生多模态,在相近规模下优于Qwen3-VL。多语言覆盖从119增至201种语言/方言;25万词表(vs.15万)在多数语言上带来约10–60%的编码/解码效率提升。Qwen3.5凭借高效的混合架构与原生多模态推理,为通用数字智能体奠定了坚实基础。下一阶段的重点将从模型规模转向系统整合,构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制,目标是能够长期自主运行、逻辑一致的系统,将当前以任务为边界的助手升级为可持续、可信任的伙伴。

相关内容

热门资讯

法拉利296Challenge... 近日,博主DerekPhotography曝光了一组法拉利原型车的路试谍照,该车型外观接近赛道机器,...
雪地里面过大年 旅游+民俗解锁... 新春将至,各地冰雪旅游与民俗巧妙融合,给游客带来更多体验。春节前夕,吉林敦化举办多场迎新春民俗活动。...
新春走基层·联播一瞬丨为“天梯... 依吞布拉克位于新疆与青海交界的阿尔金山南部,是格库铁路全线海拔最高的站区。这里坚守着一群为“天梯”拭...
经济高质量发展里的“心”与“新... 随着“最长春节假期”的到来,文旅消费市场持续升温、活力迸发。全国人大代表黄茂兴认为,推动文旅服务转变...
多国政要和国际组织代表向中国人... 2026马年新春将至,全球多国政要和国际组织代表向中国人民送上真挚的新春祝福。塞尔维亚副总理兼内务部...
卡塞飘香,藏着高原最暖的年味儿 春节、藏历新年将至,雪域高原年味渐浓。卡塞作为藏历新年必备传统美食,承载着吉祥团圆的美好祝福。今年,...
【2026新春走基层】养好每一... “无鸡不成宴”,这句流传在广东大地的老话,在梅州市五华县安流镇红山村有着别样的注解。新春前夕,年味渐...
硅谷首创:自动机械臂为电动汽车... 近日,一家瑞士公司Sofetin将特斯拉十年前展示的自动充电机械臂概念变为现实。这一系统在美国加州门...
豆包App新春活动火爆,通话功... 2月16日,豆包App的通话功能遭遇暂停,用户界面显示“新春人数较多,暂不支持此功能”。此前,豆包于...
阿里发布Qwen3.5新模型:... 2月16日,阿里巴巴在网页链接页面低调发布了Qwen3.5-Plus和Qwen3.5-397B-A1...