6月17日,昇腾AI开发者公众号宣布,昇腾0Day已支持GLM-5.2,为编程和长程任务提供全面推理优化。昇腾A3系列产品现已支持GLM5.2的单双机及大EP推理部署。昇腾针对GLM5.2模型特点,进行了多项技术优化,包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测优化、高并发调度与预填充延迟机制、智能缓存与索引优化、PD分离与PrefixCache等,以提升计算效率和长上下文推理性能。
智谱同日宣布上线并开源GLM-5.2。在全球百万用户参与的CodeArena前端开发评估系统中,GLM-5.2取得全球可用模型第一的成绩。GLM-5.2专为长程任务设计,具备Solid1M上下文、更强体感和更实用的Coding能力。在1M上下文长度下,GLM-5.2将单位token的FLOPs降低至2.9倍,并已完成与华为昇腾等国产算力平台的推理适配。预计下半年昇腾950超节点上市后,将成为GLM-5.2的强劲算力底座。


