阿里巴巴发布Qwen3-Coder-Next:编程智能体新突破,效率性能双提升!
创始人
2026-02-04 07:20:58
0

2月4日,阿里巴巴千问宣布推出Qwen3-Coder-Next,一款专为编码代理与本地开发设计的开放权重语言模型。该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力与MoE的新架构,并通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,旨在降低推理成本同时提升编程与智能体能力。

Qwen3-Coder-Next的训练不依赖参数扩展,而是通过大规模可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括持续预训练、监督微调以及领域专精的专家训练,并将专家能力蒸馏到单一、可部署的模型中。该模型强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。

在编程智能体基准上,Qwen3-Coder-Next展现出良好表现,尤其在SWE-BenchVerified上达到70%以上,在多语言设置以及更具挑战的SWE-Bench-Pro基准上保持竞争力。尽管激活参数规模较小,该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。效率与性能的权衡方面,Qwen3-Coder-Next展现了其效率优势,其SWE-Bench-Pro表现可与激活参数量高10到20倍的模型相当。

相关内容

热门资讯

特斯拉21万辆车因倒车影像延迟... 5月6日,美国国家公路交通安全管理局(NHTSA)宣布,特斯拉将在美国召回超过21万辆电动车,涉及2...
7年低息车贷全面下架,购车压力... 近日,新能源汽车市场出现了一项重大变化,7年超长低息车贷政策全面下架。此前,特斯拉、小米SU7、理想...
商汤科技挑战AI巨头:低成本高... 5月6日,商汤科技联合创始人兼首席科学家林达华透露,公司从DeepSeek获得启发,即便在资金和技术...
承载“广交天下”的国产无人机,... 文/图 羊城晚报全媒体记者 严锦程4月的广州,春潮涌动,珠江之畔的琶洲展馆人声鼎沸,第139届广交会...
以侨引商以侨促贸,助力经济高质... 羊城晚报讯 16日下午,由广东省侨办、广州市人民政府联合主办的“2026侨助广东经济高质量发展推进大...
以微光入眼以澄明观心 傅锡洪:... 文/羊城晚报全媒体记者 王倩图/羊城晚报全媒体记者 钟振彬 方浩四月的中山大学,草木葱茏。在陈寅恪故...
早筛早诊早治​“全链条”出击 ... 广州“肿瘤防治宣传周”系列活动启动,全市癌症总体5年生存率提升至49.57%羊城晚报全媒体记者 朱嘉...
广东强对流天气或迎“双休日” ... 羊城晚报讯 记者梁怿韬报道:广东多地在4月17日迎来强对流天气。截至17日17时,多地在白天时段录得...
消费新语|“首展”+“首秀”,... 监制:唐卫彬策划:陈发宝 姜 范统筹:潘笑天 李 劼记者:林语晋拍摄:甄子豪 李丹丹 张博雅 朱轶琳...
人民论坛网评 | 忙“事务”更... 习近平总书记强调,共产党人是唯物主义者,务实是必备品格,必须实事求是、求真务实、真抓实干。在日常工作...