Anthropic前几天甩出一份报告《When AI Builds Itself》,说截至今年5月,公司超过80%的代码已经由Claude自主完成,工程师人均代码产出量翻了8倍,Claude甚至能连续干活16小时不停。报告里还预测,照这个趋势下去,AI完全自主设计并构建下一代系统迟早成真。

递归自我改进(RSI):AI界的“永动机”梦想
要理解这份报告在说什么,得先搞清楚RSI是什么。这个概念在AI领域兜兜转转聊了快二十年,核心逻辑很简单:AI改进自己的代码或算法,让下一代系统变得更强,然后下一代再改进自己,形成不用人类插手的指数级进化循环。
学术界通常把这个过程切成六个阶段,从最基础代码优化一路走到完全自主的“超智能体”构建。Anthropic在报告里说自己目前处在第四阶段——AI开始主导部分研究闭环。
Anthropic报告披露:超过80%的代码已由Claude自主完成,工程师人均代码产出量激增8倍。但AI在“研究品味”上仍显著落后于人类。
数据很亮眼,但“研究品味”是硬伤
报告里晒了不少漂亮数据。比如Claude自主完成一个AI安全研究项目,烧了800小时算力和1.8万美元,恢复了97%的性能缺口,而人类团队苦干一周才完成23%。还有代码优化实验,Claude自己改工具链把模型训练速度提升了52倍,人类研究员折腾半天只能搞出4倍。
但报告也老实承认,AI在“研究品味”上还差得远。这个“研究品味”说的是判断问题价值、评估结果可信度、决定放弃还是继续研究的能力——这些需要直觉和经验的决策,Claude最新版本只能在64%的案例里被判定为提出更优方案,而五个月前这个比例是51%,进步缓慢。更关键的是,现在所有测试都在边界清晰的问题框架下进行,真实场景里的复杂决策能力根本没被验证过。
三条路:停滞、协作、还是失控
Anthropic在报告里给出了三种可能的发展路径。第一条是停滞路径:AI进步被架构限制、算力短缺或者地缘冲突卡住,形成能力的“天花板”。第二条是协作路径:AI和人类分工,AI负责执行,人类握着决策权,但这也会带来新的瓶颈。第三条最刺激——完整的RSI实现,人类退到监督角色,这时候AI既可能加速解决医疗、贫困这些全球性难题,也可能因为目标偏差被指数级放大而彻底失控。
报告结尾,Anthropic呼吁建立全球协调机制,风险累积到一定程度就暂停前沿AI开发。这个说法挺微妙——既表达了对技术失控的担忧,又暗示自己在行业里的领导地位。有评论就直接点了:这种“预警者”和“受益者”的双重身份,让这份报告的客观性打个大问号,毕竟没有企业会主动放弃技术竞赛里的领先优势。
发表回复