智谱近日发布了新一代开源模型GLM-5.1,宣称其为全球最强的开源模型。该模型在SWE-benchPro基准测试中首次超越Opus4.6,实现了国产模型的重大突破。GLM-5.1能够在长程任务中独立工作超过8小时,自主规划、执行、自我进化,交付完整的工程级成果。在代码能力方面,GLM-5.1在全球模型中排名第三,国产模型和开源模型中均排名第一。此外,智谱GLM因新模型发布而提价10%,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下ClaudeSonnet4.6水平,标志着国产大模型首次在核心场景实现与海外头部厂商的价格对齐。
GLM-5.1在多个场景中展现出色的表现,包括从零构建Linux桌面系统、优化向量数据库和机器学习模型负载。在Linux桌面构建任务中,GLM-5.1在8小时内完成了1200多步操作,产出了一套功能完善的Linux桌面系统,相当于一个4人团队一周的开发工作量。在向量数据库优化任务中,GLM-5.1通过655轮迭代,将查询吞吐量提升了6.9倍。在机器学习模型负载优化中,GLM-5.1在24小时不间断迭代中,取得了3.6倍的几何平均加速比,显著高于网页链接模式的1.49倍。
智谱GLM-5.1的发布,不仅提升了国产模型在全球范围内的竞争力,也标志着AI技术在软件开发和系统优化领域的新突破。GLM-5.1的开源链接已在GitHub、HuggingFace和ModelScope上提供,供开发者和研究人员使用和研究。


