
上周五,在Meta举办的@Scale开发者大会上,观众问了Claude Code的创造者Boris Cherny一个问题:AI里的”循环”(loops)到底是下一个炒作周期,还是来真的?
Cherny的回答很干脆:来真的,而且这一步和当年从手写代码过渡到AI agents一样重要。
“两年前我们手写源代码。然后过渡到让agents写代码。现在我们正在过渡到agents prompting agents、再由后者写代码的阶段。从源代码到agents是一步大跨越,loops是同样重要、同样大的一步。”
一个agent在后台永不停工
Cherny在演讲中(YouTube视频32分钟左右)具体描述了他自己在用的loop:一个agent持续寻找改进代码架构的方法,另一个agent寻找可以合并的重复抽象层。它们像普通程序员一样提交pull request,而由于代码在不断变化,这两个agent永远不会停止运行。
这个想法听起来激进,但背后逻辑其实很直接。agentic AI的主流用法是”管好你的agents”——设清楚目标,检查进度,别让它们跑太远。loop把这个逻辑再推一步:授权一群agents在后台持续工作,没有止境。这是对AI的极大信任,但随着模型能力快速提升,让AI处理真实工作,loop可能是下一步。
不是什么新鲜事,但也不一样
严格来说,递归循环(recursive loops)并不是新东西。函数在自己内部调用自己来重复执行某个操作,再加一个停止条件——这是计算机科学入门课的基本内容。
但今天的agentic loops遵循的是非确定性逻辑——停止循环的时机由一个子agent来判断,而不是明确的边界条件。只要程序员开始用AI完成任务,某种版本的递归循环(AI监督AI)迟早会出现。
流行的一种做法是”Ralph Loop”(以《辛普森》里的Ralph Wiggum命名),基本思路是让模型总结自己已经做了什么,然后判断目标是否完成。这是应对AI模型运行时间过长后”迷失方向”的一种办法——本质上就是把模型来回”弹”,直到任务完成。
烧token的速度会很快
另一种理解loop的角度是:这是业界推动test-time compute(推理时计算)更大规模使用的一部分。OpenAI研究员Noam Brown本月初指出,当代模型只要砸足够多的算力进去,几乎能解决任何问题。这意味着确保一个问题被解决的一个办法,就是不停地砸算力,直到完成为止。
对于”爬山坡”类的问题(比如改进代码库),模型可以不断做增量改进,直到达到某个阈值。或者,像Cherny的例子一样,只要有算力可花,它就可以一直做增量改进。
如果这听起来很烧钱,那是因为它确实很烧钱。和agentic AI一样,AI loops消耗token的速度比简单问答机器人快得多——而且因为设计目标就是让loop一直运行,你能花多少钱没有天花板。对Anthropic来说这没问题,毕竟它本质上就是卖token的生意。但对其他所有人来说,这可能是一种昂贵的工作方式。
当然,只要agentic loop要解决的问题值得,而且设置有得当的监督(token支出、漂移等经典AI问题),好处可能足够大,值得这个成本。
这场”loop革命”目前还处在非常早期的阶段。Cherny的公开表态意味着Anthropic正在认真押注这个方向。问题是,大多数公司有没有足够的算力预算来跑一群不停工作的agents?答案可能取决于你的代码库有多大、问题有多难,以及你愿意为自动化付出多少。
发表回复