
本周 AI 编程里被重复最多的一句话,只有六个词长,而说这句话的人里,几乎没人能把它定义清楚。本周有一条推文把整条时间线都卡住了,于是我对大家吵得最凶的那个词跑了一次 /last30days。答案确有其事,它有五年的演化脉络,而真正的包袱在于,如今贵的部分已经不是模型,而是循环。
那条把时间线卡住的推文
这周有一条推文让整个 AI 编程时间线都着了魔。Peter Steinberger 在 6 月 7 日发了它,浏览量突破 220 万,回复区也因为它到底是什么意思打成一团。
“Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that prompt your agents.”
@steipete,2026 年 6 月 7 日
这就是所有人都在引用的那句话。最说明问题的一条回复来自 Varadh Jain,他问了唯一重要的问题,这东西在实践里到底长什么样。而后来成了全场情绪总结的回答,则出自 Matthew Berman。
“nobody knows but him and boris.”
@MatthewBerman,2026 年 6 月 7 日
这才是真正的故事。不是说循环就是未来,而是一个六个词的说法拿到了两百万浏览量,可帮着推它的人,却还在回复区里争它到底是什么意思。对此我没有翻白眼,因为我自己每晚都会跑一个循环,在我睡觉时给大约三十个开源仓库自动开 pull request。九十秒的研究给我带回了十五个 Reddit 讨论串、二十一个 X 帖子,还有一个不太舒服的模式,AI 编程里最响亮的概念,恰恰是大多数复述它的人解释不清的概念。一派人在喊 prompt engineering 已死。另一派,也就是手真放在键盘上的那群人,则谨慎得多。
“It's not ralph/goal loops, that's old hat by now. It's probably some kind of continuous orchestration loop that oversees other threads/agents.”
@trashpandaemoji,2026 年 6 月 7 日
这条回复,是当时所有人里最接近正确答案的一条。先记住它。
循环真正是什么
Boris Cherny 在 2024 年 9 月把 Claude Code 做成了一个副项目。据说它现在支撑着 GitHub 上接近百分之四的公开提交。6 月 2 日,在 WorkOS 主办的 Acquired Unplugged 活动台上,他给出了你能找到的最干净定义。
“Now it's actually leveled up, I think, again, to the next wave of abstraction where I don't prompt Claude anymore. I have loops that are running. They're the ones that are prompting Claude and figuring out what to do. My job is to write loops.”
Boris Cherny,WorkOS Acquired Unplugged,2026 年 6 月 2 日
所以,简单说就是这样。循环是你写的一个小程序,它替你去提示编程 agent,读取它产出的内容,判断它是不是已经做完,如果还没做完,就再提示一次。你不再是那个坐在循环里面手打提示词的人。你成了循环的作者。模型则成了一个子程序。
Boris 把这件事讲成三个阶段,而把自己放到他的这把梯子上,是理解它最快的办法。一年前,他还在手写代码,配合自动补全。之后他开始并行跑五到十个 Claude 会话,分别给它们下提示。现在他已经完全不亲自提示了。他写的是提示 Claude 的循环,同时有几百个 agent 读取他的 GitHub、Slack 和 Twitter,决定接下来该构建什么。他有凭据。
“In the last 30 days, 100% of my contributions to Claude Code were written by Claude Code. I landed 259 PRs.”
Boris Cherny,经 Simon Willison 转述,2025 年 12 月 27 日
他在 11 月删掉了自己的 IDE,此后再也没打开过。那些高喊 prompt engineering 已死的人跳过了一个关键细节,他并不是说工程师已经没用了。还是得有人决定该做什么,还是得有人跟客户交流、协调团队,而且他说,优秀工程师比以往任何时候都更重要。工作没有消失。只是上移了一层,从写代码,变成写那个会写代码的东西。
光谱:从 ReAct 到编排
回复区之所以一团乱,是因为循环这个词至少藏着五种不同的东西。下面按时间顺序,从旧到新,把这把梯子摆出来,这样大家就不用再各说各话。
第一阶段是学术界的 while-loop。2022 年的 ReAct 论文把它形式化了,模型先推理,再调用工具,再读取结果,重复直到完成。一个模型,一个循环,一个人在旁边盯着。第二阶段是 2023 年的 AutoGPT,它给循环一个目标,让它自己给自己下提示,后来也因为空转半天什么都不干而出了名。这个失败给后面好多年都埋下了一个印象,agent 不过是玩具。
第三阶段,就是 Trash Panda 说的 old hat,也就是 Geoffrey Huntley 在 2025 年 7 月发布的 ralph loop。它简单得近乎侮辱人,本质上就是一句 bash one-liner,把同一个提示文件一遍又一遍喂给 agent。它真正的创新不在花样,而在纪律,每一轮都会把上下文重置到一组固定的锚点文件,而不是任由对话无限膨胀。Huntley 用它做出了一整门编程语言,成本大约 297 美元。第四阶段则把这件事产品化了,到了 2026 年春天,Codex 和 Claude Code 都上线了 /goal 命令,让 ralph loop 一直跑,直到一个小型验证模型确认任务已经完成。
第五阶段,才是 Boris 和 Steinberger 真正指的东西,而且这次确实是新东西,不是换个名字而已。有四件事变了。循环本身成了工作单元,不再只是任务。循环开始监管其他循环,并且是并发地、按调度来做。调度取代了人工启动,于是循环跑在基础设施的时间上,而不是跑在你的注意力上。还有,持久性被明确提出了,状态放进 git,有崩溃恢复,因为这些东西必须能扛过重启。ralph 默认你的终端会一直开着。2026 年这一版默认它不会。于是 Trash Panda 说对了两次,单 agent 的 ralph loop 已经不新鲜了,而叠在它上面的多 agent 编排循环,才是新层次。
这不过是戴了帽子的 cron job
在所有材料里,最好的怀疑派一句话只有四个词。它出现在某人激动地说循环会走向未来的帖子下面。
“Cronjobs have funny re-branding rn.”
X 回复,loops 讨论,2026 年 6 月
这句话值得正面回答,不该绕,因为它对了一半。对,调度这一层就是 cron。Boris 真的就是用 cron 跑的。Claude Code 里的 /loop 命令,底层用的也是 cron。如果你对循环的全部定义,就是一个按定时器运行的东西,那没错,这玩意 1975 年就发明了,你可以回家了。
但 cron 从来没有中间那一块。cron job 运行的是固定脚本。循环运行的是模型,它会查看当前状态,决定下一步做什么,去做,再检查是否生效,然后决定要不要继续。这个决策是 agent 做的,不是你做的,也不是硬编码分支。把这些层层叠起来,让一个循环去分发和监管其他循环,再给它们持久化共享状态,你就得到了 cron 无法表达的东西。最诚实的说法不是循环是什么新魔法,也不是循环不过是 cron。真正的说法是,循环等于 cron 加上一个在执行体内部做决策的人,而真正有意思的工程工作,是你围绕这个决策加上的全部保护,避免它一路冲下悬崖。
真做一个出来时,它到底长什么样
理论说够了。入门只要一行。Claude Code 上线了 /loop,而 Boris 自己给的例子,就是最标准的起步方式。把这段贴进去,再把名词改掉。
/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.
下面是他更完整的配方。几天后,Boris 发了五条建议,讲怎么让 Opus 自主跑上几小时甚至几天。
Five tips, in his words: use auto mode for permissions so Claude doesn't ask for approval; use dynamic workflows to have Claude orchestrate hundreds or thousands of agents to get a task done; use /goal or /loop to nudge Claude to keep going until it's done; use Claude Code in the cloud so you can close your laptop; and make sure Claude has a way to self-verify its work end to end.
@bcherny,2026 年 6 月
第五条,正是被热潮跳过、却被实干派死盯不放的那条,循环值不值得信任,完全取决于它能不能检查自己的工作。
这就是整个思路的缩影。步骤不是你写的。你写的是意图和停止行为,而循环会在每一次 tick 时去提示 agent。在 TikTok 上,这个表述对大众也很容易落地。
“Loop mode is one of the clearest signs that AI coding is moving from one-off prompts to background operations.”
TikTok 上的 @ai.native.founder,2026 年 6 月
更深的一端,是 Steve Yegge 在 1 月推出的 Gas Town,二十到三十个 Claude Code 实例,由一个 Mayor agent 协调,巡逻 agent 跑持续循环,状态则存进 git,因此哪怕崩溃,工作也能保住。这就是 Trash Panda 想表达的那种持续编排循环,它监管其他线程,已经上线,而且是开源的。
不过,这次研究里最实用的教训仍然是,循环能有多好,全看它有多会检查自己。增长最快的子主题不是编排,而是验证。
“Your coding agent can move fast, but bad commits compound fast too.”
@DanKornas,2026 年 6 月
Kornas 正在发布 roborev,这个工具会在后台审查每一次提交,并在上下文还新鲜的时候,把发现再喂回 agent。一个开放循环如果只是写代码,却没有反馈,那就是一台大批量制造自信错误的机器。真正能工作的,是那种会写、会跑、会读结果、会修正的循环。魔法不在循环本身。魔法在里面的反馈。
剧情反转,如今贵的是循环本身
研究到这里,话题就从哲学转成了财务问题。对整套 agents 神话最尖锐的一次拆解,来自一个真正在线上干活的工程师。
“Every ai agent i shipped this year is a for-loop, an llm call, and a try/catch around the json parsing. The only thing agentic about it is the anthropic bill at the end of the month.”
@rohit_jsfreaky,2026 年 6 月
那张账单可不是笑话。本月最硬的一张收据是,Uber 在四个月内烧完了全年 AI 预算,于是给工程师在 Claude Code 和 Cursor 上都设了上限,每人每工具每月 1500 美元。等模型几乎不要钱就能把代码写出来之后,成本就转移到了让循环持续运行这件事上。
“The costliest thing in AI coding is no longer writing code, it's managing the agent loop.”
@runes_leo,2026 年 6 月
而所有真正在线上环境里跑的人,最怕的失败模式,就是停不下来的循环。
“Without guardrails, you get infinite loops and billing surprises orders of magnitude over budget.”
@cv_usk,2026 年 6 月
所以,2026 年所有认真写循环的人,最后都会收敛到同样的三个硬停止条件,最大迭代次数、无进展检测、token 或美元预算上限。循环最浪漫的版本,是你写好循环,一千个 agent 一夜之间帮你把公司搭起来。循环在线上环境里的版本,是你写好循环,然后你大部分工作都花在确保它们会停上。Gartner 把 agentic AI 放在了期望膨胀的峰值,但真正部署 agent 的组织只有大约百分之十七。时间线上的热闹,和账单上的现实,中间的落差,才是真实局面。
重点不是循环,而是技能
下面说说我自己的看法。这是一周看下来之后,我最后落脚的地方。循环是管道。真正的资产,是它调用的技能。
Steinberger 还有一个经常一起讲的观点,通常会和循环搭配出现,而且它更耐久,如果一件事你做了不止一次,就把它变成自动化技能。如果一件事很难,就在做完之后把它也变成技能,这样下一次就是白赚。一个循环如果里面没有可复用的技能,那它不过是在一个陌生人外面包了一层 while true。一个循环如果调用的是一套锋利、经过验证、带名字的技能库,它才会越滚越强。Reddit 上那个真正已经开始转型的实干派,说得最好。
“A lot of people are rolling their eyes on Twitter, but my ears are perked up.”
r/ChatGPTCoding,2026 年 6 月
所以,WTF is a loop 的答案,不是什么 prompt engineering 已死的热评。真正的答案是,把自己从循环里面拿出来。把循环写一次,给它值得调用的技能,也给它能自查的反馈,再给它设上限,让它会停,然后把它交给 cron 去跑,你自己去决定下一个该造什么。Steinberger 和 Boris 说的是同一种动物,只是站在两侧描述它。真正懂的人,只有那些已经亲手造出一个的人。好消息是,至少从这个月起,入门坡道已经变成了一条斜杠命令。
研究里的关键模式
循环就是 cron 加上一个在执行体内部做决策的人,也就是模型,而不是硬编码分支,来决定每一次 tick 的下一步动作。
这条谱系是真实存在的,2022 年的 ReAct,2023 年的 AutoGPT,2025 年的 ralph,2026 年春天的 /goal,以及现在的编排循环。单 agent 的 ralph 已经不新鲜了,多 agent 监管才是新的一层。
循环的好坏,完全取决于它的反馈。持续审查和验证闸门,才是让循环值得信任的东西。
昂贵资源已经从 token 转移到了循环管理。要限制迭代次数,要检测无进展,要设置美元预算。
循环里面真正可复用的单位是技能,不是提示词。会调用锋利命名技能的循环会不断积累价值,而每次都从头推导一切的循环只是在烧钱。
所有 Agent 都回报了结果
Reddit:17 个声音,来自 r/ClaudeAI、r/AI_Agents、r/ExperiencedDevs,47 个讨论串,3.4 万赞
X:21 个声音,包括 steipete、bcherny、runes_leo,56 条帖子,175 次转发
YouTube:4 个声音,包括 WorkOS、Lenny's Podcast、Y Combinator,来自演讲转录
TikTok:6 个声音,包括 ai.native.founder、nikpolale,34 个片段
Instagram:4 个声音,包括 sequenzy_com、ai.builders,14 条 reels
Hacker News:12 个声音,54 个帖子,1000 条评论
GitHub:6 个仓库,包括 gastownhall/gastown、NousResearch/hermes,steipete 有 259+ 个 PR
最核心的声音:steipete、bcherny、runes_leo、rohit_jsfreaky、MatthewBerman
以上内容整理自 2026-06-07 的 /last30days 运行结果。切面包括 designing loops that prompt coding agents、ai loops、coding loops。
联合创办过一家自动驾驶烤箱公司,后来被 Weber 收购,也联合创办过后来变成 Lyft 的那家公司。现在又在重新创业,很快会有更多消息。我会在睡觉时跑循环,让它们自动提交开源 PR,而我则在后台一边写这些循环,一边跑 /last30days 研究。