6月10日,人工智能研究公司Anthropic发表博文,讨论了人工智能(AI)在自我改进方面取得的进展。博文指出,AI正在加速其自身的研发进程,逐步迈向递归自我改进的阶段。这一过程意味着AI系统能够自主设计、训练、评估并迭代自己的下一代版本,形成自我改进的闭环。尽管这一阶段尚未到来,但相关信号显示,技术进步的速度可能将更多依赖于算力、基础设施与验证机制,而不再主要受限于人工研发节奏。
博文中提到,AI的能力加速表现在多个方面。例如,AI独立完成任务的时间长度每4个月翻倍,从2024年3月的4分钟软件任务,到2026年3月能处理12小时任务。在公开基准上,模型进步迅速,如SWE-bench衡量真实软件工程修复能力,模型在2年内从个位数成绩逼近饱和。Anthropic内部数据显示,截至2026年5月,超过80%的合入代码由AI编写,而在2025年2月之前,这一比例还只是个位数。此外,AI在执行复杂任务上的效果也更强,如在2026年3月的调查显示,AI帮助下,产出中位数约为无AI时的4倍。
尽管AI在执行上逼近甚至超过人类,但博文强调,人类在研究判断、问题选择、结果信任与方向把控上仍具有优势。AI自我改进并不会凭空爆发,它仍受算力约束,企业若想把这种闭环推向更高强度,仍需要更大规模的计算资源。

