AI领域爆火的循环工程(Loop Engineering)并非全新发明,核心是将人与AI的多轮协作自动化,重构了人智协作模式。 ## 1. 什么是循环工程:并非全新创造,是协作单位升级 - 过去提示词工程、Harness工程分别以优化提示词、搭建运行框架为核心,循环工程的核心是设计自动运行的闭环,而非人工逐轮推动。 - 技术上没有全新发明,本质是将原本人手动推动的「行动-观察-修正-再行动」流程写成规则,交给AI系统自动执行,人智协作单位从单次对话升级为完整闭环,要求AI完成任务需明确启动规则、可用工具、错误识别、记忆存储、终止条件。 ## 2. 可落地循环工程的核心组成 一套完整的循环工程由5个功能模块加1个状态文件组成: 1. **定时任务**:配置运行频率、目标,是自动化循环的启动基础。 2. **独立Worktree**:给每个Agent分配独立工作目录,避免修改冲突。 3. **Skill模块**:存储项目知识、团队规则、踩坑记录,给Agent提供任务参考。 4. **连接器**:通过MCP协议对接外部系统获取信息,完善循环内容。 5. **子Agent分工**:不同任务(如写代码、审代码)分配给不同Agent,提升结果准确性。 - 额外配置状态文件:在单次对话外存储已确认信息、偏好、未解决问题,让AI每次启动可承接过往工作,避免重复踩坑。 ## 3. 循环工程的适用场景与落地门槛 - 循环工程最初在编程领域受关注,因代码有天然测试反馈机制;目前适用范围已扩展至内容选题整理、客服分单、用户反馈汇总、科研动态追踪等,适合反复出现、流程稳定、可自动检查结果,且核心判断仍保留给人类的任务。 - 落地存在明确门槛:首先需要token额度充足,循环反复读取上下文会持续消耗token,普通付费用户容易快速达到限额;其次仅适合可重复的任务,一次性任务用提示词更快更便宜;同时需要配套自动验证机制,才能在无人值守时拦截不合格产出。 ## 4. 循环工程的核心价值:重构人智协作分工 - 循环工程本质是把协作成本从「人工逐轮跟进」的时间成本,转移为「系统自动运行」的token成本。 - 随着模型能力提升,单次循环的token成本已经接近人工逐轮追问的成本,优化方向从单条提示词转向整个反馈回路。其核心价值不在于创造新学科,而在于明确了当下人智协作的分工:简单任务用优质提示词,复杂重复任务搭建可自动运行的闭环流程,这种分工边界比「循环工程」这个名词更有意义。
Codex和Claude Code负责人都不写提示词了,AI 圈爆火的Loop到底是什么
2026-06-14 10:12

Codex和Claude Code负责人都不写提示词了,AI 圈爆火的Loop到底是什么

本文来自微信公众号: APPSO ,作者:发现明日产品的


要不说AI圈都是造词大师呢,回看过去这一年,都已经造出了多少个新词了。


提示词工程火了,火完之后Harness工程,现在又轮到了循环工程。以前是把提示词写好最重要,模型的能力体现在我们喂给它什么样的提示词。后面是Harness重要,要想模型产出稳定的结果,给它套一个马鞍,让它在框架内运作很重要。


再到现在,Loop Engineering,循环工程,写提示词、写Harness都比不过写好一个循环。



龙虾之父在X发文,不要在Coding Agent类产品里面写提示词了,我们应该设计一些循环来使用这些Agent。Codex负责人Tibo也很快转发了这则推文,问网友是否已经开始写嵌套循环了。


Codex的对家,Claude Code产品负责人Boris Cherny也在接受播客采访时提到,「不跟Agent对话,跟loop对话,让loop替我来prompt」。


Claude Code的负责人Boris Cherny,和产品负责人Cat Wu在Claude官方回顾Claude Code第一年的节目上,聊天过程中两人都表示很喜欢loop,认为Loop是下一个Leap(飞跃)


和loop对话?所以loop到底是什么。仿佛还没有看到所谓的Loop Engineering到底给一个项目带来了什么改变。例如用控制变量法,一个采用循环工程,一个不使用,两者最后的产出会有什么区别吗?


这些术语就莫名其妙地出现在了社交媒体上,有人说不用管「loop工程」是什么,它本质就是一种炒作和营销的手段。


一个正在使用Agent的用户,自然而然就实现了所谓的loop工程,而不是专门有一套流程,符合那套标准,需要被单拎出来,才可以被叫做是Loop Engineering。



所以是新瓶装旧酒,一套过去的思维方法论,重新套上了新名词吗?


人从写提示词,变成写循环


如果只看技术实现,Loop Engineering其实没有发明什么全新的东西。Harness、Skill、Agent Workflow这些系统,过去几年都在尝试让Agent自己规划、执行、反思和继续执行。


但今天大家重新开始讨论Loop,是因为模型终于开始能把循环跑下去了。当Agent能连续工作几十分钟、几个小时,甚至跨天完成任务时,人和AI协作的单位,也开始从一次对话变成一个完整回路。


什么是Loop Engineering,这个词听起来很新,讲的事其实很日常:你让AI写代码,它写完后你跑测试;测试报错,你把错误贴回去;它再改;你再跑。来回几次,直到代码能用。


这就是一个最原始的loop:行动、观察、修正、再行动。


区别在于,过去每一轮都靠人手动推动。人要复制报错、追问原因、提醒它别改错文件、判断什么时候该停。Loop Engineering做的事,是把这些反复发生的动作写成规则,交给系统去执行。



一个完整的loop,至少要回答五个问题:AI什么时候开始干活?它能调用哪些工具?它怎么知道自己做错了?它把每一轮结果记在哪里?它什么时候必须停下来交给人?


所以Loop Engineering更接近一套工作制度:给AI设任务、设工具、设反馈、设记忆、设刹车;prompt只是这套系统里最小的零件。


放到代码项目里,它可能是这样:每天早上,系统自动检查昨晚失败的代码提交。


AI读日志,判断是测试波动、依赖问题,还是最近提交引入的bug。能复现的,它在单独的worktree里尝试修复,跑测试,通过后开一个草稿PR。原因不清楚的,它把现场、尝试过的方法和下一步建议写进一个文件,等人来接手。



放在我们的工作流里,它就是每天早上,AI自动扫指定的新闻源、社交平台和公司博客。它挑出5个可能成稿的选题,补上来源、关键人物、争议点、可用截图和一句话判断。资料不足的地方,它标出来。到我们面前时,它已经整理成一张选题卡。


龙虾之父也在X分享了自己的循环工程实践,他让Codex维护自己的代码仓库,每5分钟唤醒一次并将工作分配给不同的线程。他说通过运用统筹能力,结合分类、自动审核和Computer Use技能,已经能让一些工作自主完成。



听起来也很像之前Claude Code主打的「做梦」机制,以及Hermes Agent的自进化功能,让Agent自己从过往上下文学习知识并完善所有的流程。


这也就是Loop Engineering的核心变化:Prompt Engineering时代,人负责写一句好提示词。Harness Engineering时代,人开始给模型搭框架。到Loop Engineering,人的工作进一步后退了一层。


一个loop由什么组成


一个能跑起来的loop,通常有几样东西。



根据Google Cloud AI总监Addy Osmani在X发布的循环工程文章,一套完整的循环工程,同样是五个积木加一个用来记录的记事本。



五个积木分别是定时任务、worktree、Skill、连接器、子Agent,以及一个记事本叫状态文件。


定时任务,在Codex里它叫Automations,在OpenClaw里面叫HEARTBEAT,在Claude Cowork里面是Scheduled。通过配置定时任务,我们可以选择对应的项目,自定义一段提示词,再设置对应的运行频率。


这是自动化循环的第一步。在设置定时任务时,也像使用Codex里面的Goal模式,让Agent自动跑,直到完成我们设定的目标。



Worktree存在的意义,是给每个Agent一个独立的工作目录,可以确保Agent在循环工程中只是修改各自的分支。


有了Skill,循环每一圈都可以不用猜测我们的项目是什么。Skill通过把项目知识写在文件里:构建步骤、团队约定、「上次就是这么出事的,所以不允许这么做了」,让Agent有了更充分的记忆,去处理任务。


连接器的主要目的是靠MCP协议跳出这个单独的文件系统,获取外界的给定数据库和其他系统信息,来完善整个循环。


子agent也是整个体系里最重要的结构,写代码的和审代码必须是两拨人。换一个指令不同、甚至模型都不同的agent来挑刺,才能审核出真正的问题。



记忆也很重要。很多AI工作流每天都会重复,但每天都从零开始。昨天已经确认过的事实,今天还要再查一次;上周已经否掉的标题风格,这周又被生成出来;某个来源经常不可靠,但AI下次仍然引用它。


除了用Skill的更新来规范Agent的行为,循环还需要一个聊天框外的记忆位置。


记事本,一个状态文件,它在单次对话之外,可以是一个文档、表格、看板,也可以是一份项目规则。里面记录已确认的信息、踩过的坑、偏好的格式、禁用的表达、上次没解决的问题。AI每次启动时先读它,就能接着往下走。



上手Loop Engineering


Loop Engineering常被开发者讨论,是因为代码有天然的反馈机制:测试能不能过,程序能不能跑,错误日志在哪里。这让代码场景看起来特别适合loop。


但就像Coding Agent最后变成了所有人的Agent,loop的适用范围也远不止编程。


内容工作里,它可以做选题筛选、资料整理、初稿生成、事实检查、标题优化和发布前检查。


客服工作里,它可以先读客户来信,判断问题类型,整理历史记录,生成回复草稿,并把敏感投诉留给人工处理。AI不需要直接发出所有回复,它先把问题分好、材料备好,就已经省掉很多时间。


产品和运营工作里,它可以定期整理用户反馈、应用商店评论、社媒讨论和竞品更新。


研究工作里,它可以追踪一个主题下的新论文、新报告、新数据。每天或每周更新一次,把新增内容和已有判断放在一起。


这些场景共同点都是任务会反复出现,流程相对稳定,结果可以被检查,关键判断还在人的手里。



想要真正入门循环工程也不是一件容易的事情,它有个前提:token管够。


循环会反复读上下文、反复重试、四处探索,不管最后有没有产出,Token都在燃烧。拥有无限额度的人觉得循环是常识,就像龙虾之父、Claude Code负责人、Google Cloud AI总监,他们都有无上限的Token。


但月付20美元的我们,循环跑了两天就达到了周限额。


还有,任务得每周都重复,如果是一次性的活,一句好提示词又快又便宜,重复太少,Agent又无法从循环中学习到知识。


而反复的循环又得有自动验证、测试、类型检查、构建,需要确保Agent在没人盯着的时候可以把烂活拦下来。Agent还得有高级工程师的素养:日志、复现环境、能跑自己写的代码。



随便缺这里哪一条,循环的成本可能就会高过回报。而token成本其实把这个热词拉回了现实,Loop Engineering不会让AI协作变得无成本,它只是把成本从「人一轮轮盯着」的时间成本,转移到「系统一轮轮运行」Money成本。


新的问题在于,随着模型越来越强,这笔账正在发生变化。


过去,一个任务失败了,人只能回来继续追问、补充上下文、重新解释需求。今天,很多时候AI已经能自己尝试、自己验证、自己修正,再把结果交回来。


如果一次循环消耗的Token,已经接近一个人来回追问几轮的成本,那么真正值得优化的,可能就不再是某一句提示词,而是整个反馈回路。



所以Loop Engineering最值得讨论的地方,未必是它算不算一个新学科。


更现实的问题是,当AI已经能连续处理多轮任务,人还要不要继续把自己卡在每一次追问里。


有些工作,确实只需要一句好提示词。有些工作,则需要一套能反复运行、能留下记录、能及时停手的流程。


这个分界线,在当下看来,可能比「循环工程」这个名字本身重要得多。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定