2月8日,ClaudeCode宣布推出快速模式(Fastmode)研究预览版,旨在通过优化Opus4.6的API配置,降低响应延迟的同时保持模型质量不变。官方强调,快速模式并非独立模型,而是使用相同的Opus4.6模型,仅通过不同的API配置,以速度为优先而非成本效益,确保响应质量和功能与标准模式完全一致,但响应速度更快。
快速模式适用于Pro、Team等订阅用户及Console用户,并通过“额外用量”计费。值得注意的是,第三方提供商如AmazonBedrock、GoogleVertexAI和MicrosoftAzureFoundry不支持快速模式。目前,快速模式的定价为每百万Token输入30美元、输出150美元。为庆祝新功能的推出,太平洋时间2月16日晚上11:59前,所有方案均可享受50%的限时折扣。
此外,2月6日Anthropic发布了新一代ClaudeOpus4.6模型,支持200K上下文窗口(测试版提供100万token),最大输出token数提升至128K,较前代64K限制翻倍。新模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的maxeffort参数。同时,新版本还推出上下文压缩功能,当对话接近窗口限制时自动总结早期内容,实现近乎无限长度的对话。
