2月18日,人工智能公司Anthropic发布了其中等规模Sonnet模型的新版本Sonnet4.6,保持了每四个月更新一次的频率。此次更新特别强调了模型在代码能力、指令遵循和计算机操作方面的显著提升。Sonnet4.6将成为免费版与Pro版用户的默认模型,其测试版支持的上下文窗口达到100万token,是之前Sonnet模型的两倍,能够容纳完整的代码库、长篇合同或数十篇研究论文。
在性能方面,Sonnet4.6在多项基准测试中表现突出,包括OSWorld和SWE‑Bench,这些测试分别用于评估计算机操作能力和软件工程。最引人注目的是,Sonnet4.6在衡量类人智能的ARC‑AGI‑2测试中得分达到60.4%,超越了大多数同级别模型。尽管如此,它在得分上仍然落后于Opus4.6、Gemini3DeepThink以及某一精调版GPT5.2等旗舰模型。此次发布紧随Opus4.6的推出,而新版Haiku模型也预计将在未来几周内发布。


