Anthropic抛出一枚深水炸弹：AI迟早会自己改进自己

作者：

在

Anthropic抛出一枚深水炸弹：AI迟早会自己改进自己

Anthropic上周发了一篇博客，标题叫“When AI builds itself”（当AI开始建造自己），讨论的是一个在AI圈内被反复议论、但很少有公司愿意公开正面回答的问题：AI系统最终会不会进化到可以完全自主地设计和改进自己的下一代？

这个能力有个正式的名字，叫递归自我改进（Recursive Self-Improvement），简称RSI。用大白话讲就是：一个AI模型训练出了下一代模型，下一代模型又训练出下下一代，每一代都比上一代更强，而且这个过程里人类逐渐退出核心环节。

递归自我改进指的是AI系统具备完全自主设计和开发自身后继版本的能力：AI系统可以优化自身的架构、训练方法、代码等，生成能力比自己更强的新版本AI，而新版本又可以继续优化生成下一代，形成”自我改进”的递归循环。

Anthropic拿出了实锤数据

这篇博客最有价值的部分，不是它对RSI下什么结论，而是它首次公开了大量来自Anthropic内部的真实数据，讲清楚了”AI到底在多大程度上已经在加速AI开发本身”这个问题。

一个很惊人的数字是：截至2026年5月，Anthropic代码库里超过80%的代码是由Claude编写的。而在2025年2月Claude Code推出之前，这个比例还只是个位数。每个工程师每天合并的代码行数，2026年第二季度已经是2024年的8倍。

Anthropic自己也很谨慎地说，代码行数不是衡量生产力的完美指标，但这个8倍的数字至少说明了一件事：AI辅助开发已经不是”有帮助”的程度了，它在实实在在改变一家AI公司的开发节奏。

差距在缩小，但还没到那一步

他们把目前的差距描述得很具体。今天的Claude可以在别人明确指定目标的情况下运行实验、优化代码、甚至修复bug。但在”选择值得研究的问题”这件事上，Claude和人类之间还有很大的性能差距。

用Anthropic自己的话说：目前人类的比较优势仍然在于”看到更大的图景”，以及超越即时任务的局限进行思考。

问题是，这个差距也在缩小。Anthropic做了一个实验：让不同版本的Claude只看一段研究对话中”跑偏之前”的部分，然后问它”接下来你会怎么做”。2025年11月的最佳模型（Opus 4.5）在人类的选择更好的比例上只赢了51%，到2026年4月（Mythos Preview），这个比例涨到了64%。

这件事为什么重要

把上面的线索放在一起，Anthropic描绘了一幅有点微妙的图像：RSI不会明天就到来，但那些曾经被认为是”只有人类才能做”的判断力工作，正在一点一点地被AI系统蚕食。

这篇博客没有给出一个明确的结论说”RSI会在某年某月到来”，但它做了一件更重要的事：把这个问题从抽象的哲学讨论，拉到了可以用数据衡量的实证层面。

接下来会怎样

Anthropic在文末说，接下来几个月他们会组织政策制定者、研究人员和公民社会之间的对话，讨论怎么为RSI的可能性做准备。这件事值得关注的原因很简单：如果RSI真的到来了，人类怎么保证自己还有能力理解和控制这些系统，会是一个完全不同的问题。

而Anthropic这篇博客，是目前一线AI公司在这个问题上给出的最坦诚、数据最扎实的公开表态。

📍 原文来源：Anthropic – When AI builds itself
📍 报道来源：The Verge – Anthropic made a statement about recursive self-improvement

AI AI伦理 AI安全 AI技术 Anthropic

Anthropic抛出一枚深水炸弹：AI迟早会自己改进自己