AI正在进入「循环」时代：当AI开始指挥AI干活

作者：

hiyoho

在

AI资讯

AI agent loops conceptual illustration — AI agents working in recursive loops — 概念图

上周五，在Meta举办的@Scale开发者大会上，观众问了Claude Code的创造者Boris Cherny一个问题：AI里的”循环”（loops）到底是下一个炒作周期，还是来真的？

Cherny的回答很干脆：来真的，而且这一步和当年从手写代码过渡到AI agents一样重要。

“两年前我们手写源代码。然后过渡到让agents写代码。现在我们正在过渡到agents prompting agents、再由后者写代码的阶段。从源代码到agents是一步大跨越，loops是同样重要、同样大的一步。”

一个agent在后台永不停工

Cherny在演讲中（YouTube视频32分钟左右）具体描述了他自己在用的loop：一个agent持续寻找改进代码架构的方法，另一个agent寻找可以合并的重复抽象层。它们像普通程序员一样提交pull request，而由于代码在不断变化，这两个agent永远不会停止运行。

这个想法听起来激进，但背后逻辑其实很直接。agentic AI的主流用法是”管好你的agents”——设清楚目标，检查进度，别让它们跑太远。loop把这个逻辑再推一步：授权一群agents在后台持续工作，没有止境。这是对AI的极大信任，但随着模型能力快速提升，让AI处理真实工作，loop可能是下一步。

不是什么新鲜事，但也不一样

严格来说，递归循环（recursive loops）并不是新东西。函数在自己内部调用自己来重复执行某个操作，再加一个停止条件——这是计算机科学入门课的基本内容。

但今天的agentic loops遵循的是非确定性逻辑——停止循环的时机由一个子agent来判断，而不是明确的边界条件。只要程序员开始用AI完成任务，某种版本的递归循环（AI监督AI）迟早会出现。

流行的一种做法是”Ralph Loop”（以《辛普森》里的Ralph Wiggum命名），基本思路是让模型总结自己已经做了什么，然后判断目标是否完成。这是应对AI模型运行时间过长后”迷失方向”的一种办法——本质上就是把模型来回”弹”，直到任务完成。

烧token的速度会很快

另一种理解loop的角度是：这是业界推动test-time compute（推理时计算）更大规模使用的一部分。OpenAI研究员Noam Brown本月初指出，当代模型只要砸足够多的算力进去，几乎能解决任何问题。这意味着确保一个问题被解决的一个办法，就是不停地砸算力，直到完成为止。

对于”爬山坡”类的问题（比如改进代码库），模型可以不断做增量改进，直到达到某个阈值。或者，像Cherny的例子一样，只要有算力可花，它就可以一直做增量改进。

如果这听起来很烧钱，那是因为它确实很烧钱。和agentic AI一样，AI loops消耗token的速度比简单问答机器人快得多——而且因为设计目标就是让loop一直运行，你能花多少钱没有天花板。对Anthropic来说这没问题，毕竟它本质上就是卖token的生意。但对其他所有人来说，这可能是一种昂贵的工作方式。

当然，只要agentic loop要解决的问题值得，而且设置有得当的监督（token支出、漂移等经典AI问题），好处可能足够大，值得这个成本。

这场”loop革命”目前还处在非常早期的阶段。Cherny的公开表态意味着Anthropic正在认真押注这个方向。问题是，大多数公司有没有足够的算力预算来跑一群不停工作的agents？答案可能取决于你的代码库有多大、问题有多难，以及你愿意为自动化付出多少。

📎 原文来源：The AI world is getting ‘loopy’ — TechCrunch

AI AI Agent AI技术 AI推理 AI智能体

AI正在进入「循环」时代：当AI开始指挥AI干活

一个agent在后台永不停工

不是什么新鲜事，但也不一样

烧token的速度会很快

评论

发表回复 取消回复

更多文章

Milvus：高性能云原生向量数据库，为AI应用打造的神经记忆中枢（44.9K Stars）

近400家地方报纸联名起诉OpenAI和微软：AI版权大战烧到地方媒体

都说AI要取代程序员，数据却显示工程师比谁都抢手

企业AI狂欢结束，Accenture们开始严控员工用AI的”零花钱”

发表回复取消回复