阿里巴巴发布Qwen3-Coder-Next:编程智能体新突破,效率性能双提升!
创始人
2026-02-04 07:20:58
0

2月4日,阿里巴巴千问宣布推出Qwen3-Coder-Next,一款专为编码代理与本地开发设计的开放权重语言模型。该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力与MoE的新架构,并通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,旨在降低推理成本同时提升编程与智能体能力。

Qwen3-Coder-Next的训练不依赖参数扩展,而是通过大规模可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括持续预训练、监督微调以及领域专精的专家训练,并将专家能力蒸馏到单一、可部署的模型中。该模型强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。

在编程智能体基准上,Qwen3-Coder-Next展现出良好表现,尤其在SWE-BenchVerified上达到70%以上,在多语言设置以及更具挑战的SWE-Bench-Pro基准上保持竞争力。尽管激活参数规模较小,该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。效率与性能的权衡方面,Qwen3-Coder-Next展现了其效率优势,其SWE-Bench-Pro表现可与激活参数量高10到20倍的模型相当。

相关内容

热门资讯

ChatGPT全球服务中断!官... 2月4日,OpenAI旗下的AI聊天机器人ChatGPT遭遇大规模服务中断,全球用户在北京时间凌晨4...
“2万购老头乐电车半月散架,增... 近日,网上销售的老头乐车型因缺乏合格证和统一质量标准而引发消费者投诉。河南任先生反映,他花费2万元网...
AI智能体OpenClaw被黑... 2月2日,密码管理工具1Password的安全团队揭露了一起针对macOS用户的安全威胁。攻击者利用...
华为鸿蒙智行问界M6曝光:增程... 2月4日,华为终端官方发布了鸿蒙智行问界M6汽车的银色官图。从官图中可见,问界M6在车侧尾部左右各设...
保时捷电动718项目或被新CE... 近日,保时捷的纯电动718 Boxster和718 Cayman项目面临重大调整。这两款车型的研发已...
走进广州闹市中的“世外桃源”,... 过年买桃花,来年大展宏图。在广州,关于桃花产地有一种说法是“北有石马,南有海北”。海北是指位于广州市...
一艘“佛山造”游艇 何以驶向千... 羊城晚报全媒体记者 李婷婷“2026年一季度公司订单稳步攀升,迎来新年‘开门红’,预测今年产值将增长...
首批A股上市银行2025年业绩... 近期,A股上市银行2025年度业绩快报密集出炉。截至2月3日,已有10家上市银行披露了相关数据,涵盖...
线上预约免费入园 “大湾鸡”奥... 不到50天,一座乐园从无到有:广州文旅跑出“加速度”千呼万唤始出来!万众期待的“大湾鸡”奥体嘉年华今...
“行天下”不止于货 解码广州商... 文/图 羊城晚报全媒体记者 孙绮曼2026年开年,一座高达10.88米、身披万片金箔的“龙马”装置在...