12月29日,微软宣布向网页版、Windows 11版和移动端的Copilot用户全量推送GPT-5.2模型,并命名为“智能+”(SmartPlus)模式。此次更新作为免费升级,与上月发布的基于GPT-5.1的“智能”(Smart)模式共存。GPT-5.2的“Thinking(思考)”变体被定义为显著增强处理复杂任务的能力,支持用户快速完成电子表格构建、演示文稿制作、代码编写与审查、长文档理解及图像处理等办公任务,被官方定义为“专家级”工具。
在针对44种职业的“知识型工作”任务评估(GDPval)中,GPT-5.2Thinking在70.9%的测试案例中击败或持平了人类行业专家,而GPT-5仅为38.8%。GPT-5.2在多项权威基准测试中展现了统治级的技术实力,如在软件工程测试SWE-BenchPro中得分55.6%,在SWE-benchVerified中达到80%,均优于GPT-5.1Thinking。此外,GPT-5.2在AIME2025中取得100%满分,在GPQADiamond测试中得分92.4%,在CharXiv推理(含Python)测试中得分88.7%,并在ARC-AGI测试中实现了大幅分数增长。


