11月25日,人工智能公司Anthropic宣布推出其最新AI模型“ClaudeOpus4.5”,该模型在编码、智能体操作和计算机操作方面表现出色,并在深度研究、演示文稿处理和电子表格任务上实现了显著提升。ClaudeOpus4.5在软件工程相关测试中达到了行业最先进水平,目前已在Anthropic的应用、API以及三大云平台上开放使用。模型的输入输出定价分别为5美元和25美元每百万tokens,旨在使更多用户能够使用到Opus级别的能力。
ClaudeOpus4.5在视觉、推理与数学方面也取得了显著进步,在多个领域达到行业先进水平。在τ2-bench基准测试中,模型展现出在规则允许范围内提供替代解决方案的能力,尽管这在特定测试中被判定为失败,但Anthropic认为这类“有洞察力的解决方案”是用户感受到的进步。此外,ClaudeOpus4.5在安全性方面也有所提升,Anthropic表示这是其迄今对齐程度最高的模型,并推测其对齐水平在行业前沿模型中也处于领先位置。
随着模型能力的增强,Anthropic还更新了ClaudeDeveloperPlatform、ClaudeCode以及面向消费者的应用,加入了支持更长时间运行的智能体工具,并扩展了Claude在Excel、Chrome以及桌面端的使用方式。在ClaudeCode中,Opus4.5带来了PlanMode的升级,现在会先通过提问澄清需求,再生成可编辑的网页链接文件并执行任务。消费者应用方面,Claude现在可自动总结对话上下文以支持更长的交流内容。


