2月4日,阿里巴巴千问宣布推出Qwen3-Coder-Next,一款专为编码代理与本地开发设计的开放权重语言模型。该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力与MoE的新架构,并通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,旨在降低推理成本同时提升编程与智能体能力。
Qwen3-Coder-Next的训练不依赖参数扩展,而是通过大规模可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括持续预训练、监督微调以及领域专精的专家训练,并将专家能力蒸馏到单一、可部署的模型中。该模型强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。
在编程智能体基准上,Qwen3-Coder-Next展现出良好表现,尤其在SWE-BenchVerified上达到70%以上,在多语言设置以及更具挑战的SWE-Bench-Pro基准上保持竞争力。尽管激活参数规模较小,该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。效率与性能的权衡方面,Qwen3-Coder-Next展现了其效率优势,其SWE-Bench-Pro表现可与激活参数量高10到20倍的模型相当。

