Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

Anthropic上周发了一篇博客,标题叫“When AI builds itself”(当AI开始建造自己),讨论的是一个在AI圈内被反复议论、但很少有公司愿意公开正面回答的问题:AI系统最终会不会进化到可以完全自主地设计和改进自己的下一代?

这个能力有个正式的名字,叫递归自我改进(Recursive Self-Improvement),简称RSI。用大白话讲就是:一个AI模型训练出了下一代模型,下一代模型又训练出下下一代,每一代都比上一代更强,而且这个过程里人类逐渐退出核心环节。

递归自我改进指的是AI系统具备完全自主设计和开发自身后继版本的能力:AI系统可以优化自身的架构、训练方法、代码等,生成能力比自己更强的新版本AI,而新版本又可以继续优化生成下一代,形成”自我改进”的递归循环。

Anthropic拿出了实锤数据

这篇博客最有价值的部分,不是它对RSI下什么结论,而是它首次公开了大量来自Anthropic内部的真实数据,讲清楚了”AI到底在多大程度上已经在加速AI开发本身”这个问题。

一个很惊人的数字是:截至2026年5月,Anthropic代码库里超过80%的代码是由Claude编写的。而在2025年2月Claude Code推出之前,这个比例还只是个位数。每个工程师每天合并的代码行数,2026年第二季度已经是2024年的8倍

Anthropic自己也很谨慎地说,代码行数不是衡量生产力的完美指标,但这个8倍的数字至少说明了一件事:AI辅助开发已经不是”有帮助”的程度了,它在实实在在改变一家AI公司的开发节奏。

差距在缩小,但还没到那一步

他们把目前的差距描述得很具体。今天的Claude可以在别人明确指定目标的情况下运行实验、优化代码、甚至修复bug。但在”选择值得研究的问题”这件事上,Claude和人类之间还有很大的性能差距。

用Anthropic自己的话说:目前人类的比较优势仍然在于”看到更大的图景”,以及超越即时任务的局限进行思考。

问题是,这个差距也在缩小。Anthropic做了一个实验:让不同版本的Claude只看一段研究对话中”跑偏之前”的部分,然后问它”接下来你会怎么做”。2025年11月的最佳模型(Opus 4.5)在人类的选择更好的比例上只赢了51%,到2026年4月(Mythos Preview),这个比例涨到了64%

这件事为什么重要

把上面的线索放在一起,Anthropic描绘了一幅有点微妙的图像:RSI不会明天就到来,但那些曾经被认为是”只有人类才能做”的判断力工作,正在一点一点地被AI系统蚕食。

这篇博客没有给出一个明确的结论说”RSI会在某年某月到来”,但它做了一件更重要的事:把这个问题从抽象的哲学讨论,拉到了可以用数据衡量的实证层面。


接下来会怎样

Anthropic在文末说,接下来几个月他们会组织政策制定者、研究人员和公民社会之间的对话,讨论怎么为RSI的可能性做准备。这件事值得关注的原因很简单:如果RSI真的到来了,人类怎么保证自己还有能力理解和控制这些系统,会是一个完全不同的问题。

而Anthropic这篇博客,是目前一线AI公司在这个问题上给出的最坦诚、数据最扎实的公开表态。


📍 原文来源:Anthropic – When AI builds itself
📍 报道来源:The Verge – Anthropic made a statement about recursive self-improvement

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注