AI递归自我改进报告出炉，Anthropic说80%代码是Claude写的，但“研究品味”还差得远

作者：

在

Anthropic前几天甩出一份报告《When AI Builds Itself》，说截至今年5月，公司超过80%的代码已经由Claude自主完成，工程师人均代码产出量翻了8倍，Claude甚至能连续干活16小时不停。报告里还预测，照这个趋势下去，AI完全自主设计并构建下一代系统迟早成真。

递归自我改进（RSI）：AI界的“永动机”梦想

要理解这份报告在说什么，得先搞清楚RSI是什么。这个概念在AI领域兜兜转转聊了快二十年，核心逻辑很简单：AI改进自己的代码或算法，让下一代系统变得更强，然后下一代再改进自己，形成不用人类插手的指数级进化循环。

学术界通常把这个过程切成六个阶段，从最基础代码优化一路走到完全自主的“超智能体”构建。Anthropic在报告里说自己目前处在第四阶段——AI开始主导部分研究闭环。

Anthropic报告披露：超过80%的代码已由Claude自主完成，工程师人均代码产出量激增8倍。但AI在“研究品味”上仍显著落后于人类。

数据很亮眼，但“研究品味”是硬伤

报告里晒了不少漂亮数据。比如Claude自主完成一个AI安全研究项目，烧了800小时算力和1.8万美元，恢复了97%的性能缺口，而人类团队苦干一周才完成23%。还有代码优化实验，Claude自己改工具链把模型训练速度提升了52倍，人类研究员折腾半天只能搞出4倍。

但报告也老实承认，AI在“研究品味”上还差得远。这个“研究品味”说的是判断问题价值、评估结果可信度、决定放弃还是继续研究的能力——这些需要直觉和经验的决策，Claude最新版本只能在64%的案例里被判定为提出更优方案，而五个月前这个比例是51%，进步缓慢。更关键的是，现在所有测试都在边界清晰的问题框架下进行，真实场景里的复杂决策能力根本没被验证过。

三条路：停滞、协作、还是失控

Anthropic在报告里给出了三种可能的发展路径。第一条是停滞路径：AI进步被架构限制、算力短缺或者地缘冲突卡住，形成能力的“天花板”。第二条是协作路径：AI和人类分工，AI负责执行，人类握着决策权，但这也会带来新的瓶颈。第三条最刺激——完整的RSI实现，人类退到监督角色，这时候AI既可能加速解决医疗、贫困这些全球性难题，也可能因为目标偏差被指数级放大而彻底失控。

报告结尾，Anthropic呼吁建立全球协调机制，风险累积到一定程度就暂停前沿AI开发。这个说法挺微妙——既表达了对技术失控的担忧，又暗示自己在行业里的领导地位。有评论就直接点了：这种“预警者”和“受益者”的双重身份，让这份报告的客观性打个大问号，毕竟没有企业会主动放弃技术竞赛里的领先优势。

📎 原文来源：AI递归自我改进：Anthropic报告揭示进展与风险，未来何去何从？

AI AI技术

AI递归自我改进报告出炉，Anthropic说80%代码是Claude写的，但“研究品味”还差得远

递归自我改进（RSI）：AI界的“永动机”梦想

数据很亮眼，但“研究品味”是硬伤

三条路：停滞、协作、还是失控

评论

发表回复 取消回复

更多文章

Anthropic的AI模型被政府盯上了，Fable 5和Mythos 5遭全面封禁

四大会计师事务所用AI写报告，结果闹了个大笑话

法拉利找IBM搞了个AI粉丝助手，F1比赛数据秒变故事

亚马逊做了个AI手环，戴在手上24小时录音，这体验有点诡异

发表回复取消回复