AI领域爆火的循环工程（Loop Engineering）并非全新发明，核心是将人与AI的多轮协作自动化，重构了人智协作模式。 ## 1. 什么是循环工程：并非全新创造，是协作单位升级 - 过去提示词工程、Harness工程分别以优化提示词、搭建运行框架为核心，循环工程的核心是设计自动运行的闭环，而非人工逐轮推动。 - 技术上没有全新发明，本质是将原本人手动推动的「行动-观察-修正-再行动」流程写成规则，交给AI系统自动执行，人智协作单位从单次对话升级为完整闭环，要求AI完成任务需明确启动规则、可用工具、错误识别、记忆存储、终止条件。 ## 2. 可落地循环工程的核心组成一套完整的循环工程由5个功能模块加1个状态文件组成： 1. **定时任务**：配置运行频率、目标，是自动化循环的启动基础。 2. **独立Worktree**：给每个Agent分配独立工作目录，避免修改冲突。 3. **Skill模块**：存储项目知识、团队规则、踩坑记录，给Agent提供任务参考。 4. **连接器**：通过MCP协议对接外部系统获取信息，完善循环内容。 5. **子Agent分工**：不同任务（如写代码、审代码）分配给不同Agent，提升结果准确性。 - 额外配置状态文件：在单次对话外存储已确认信息、偏好、未解决问题，让AI每次启动可承接过往工作，避免重复踩坑。 ## 3. 循环工程的适用场景与落地门槛 - 循环工程最初在编程领域受关注，因代码有天然测试反馈机制；目前适用范围已扩展至内容选题整理、客服分单、用户反馈汇总、科研动态追踪等，适合反复出现、流程稳定、可自动检查结果，且核心判断仍保留给人类的任务。 - 落地存在明确门槛：首先需要token额度充足，循环反复读取上下文会持续消耗token，普通付费用户容易快速达到限额；其次仅适合可重复的任务，一次性任务用提示词更快更便宜；同时需要配套自动验证机制，才能在无人值守时拦截不合格产出。 ## 4. 循环工程的核心价值：重构人智协作分工 - 循环工程本质是把协作成本从「人工逐轮跟进」的时间成本，转移为「系统自动运行」的token成本。 - 随着模型能力提升，单次循环的token成本已经接近人工逐轮追问的成本，优化方向从单条提示词转向整个反馈回路。其核心价值不在于创造新学科，而在于明确了当下人智协作的分工：简单任务用优质提示词，复杂重复任务搭建可自动运行的闭环流程，这种分工边界比「循环工程」这个名词更有意义。

2026-06-14 10:12

Codex和Claude Code负责人都不写提示词了，AI 圈爆火的Loop到底是什么

AppSo

本文来自微信公众号： APPSO ，作者：发现明日产品的

要不说AI圈都是造词大师呢，回看过去这一年，都已经造出了多少个新词了。

提示词工程火了，火完之后Harness工程，现在又轮到了循环工程。以前是把提示词写好最重要，模型的能力体现在我们喂给它什么样的提示词。后面是Harness重要，要想模型产出稳定的结果，给它套一个马鞍，让它在框架内运作很重要。

再到现在，Loop Engineering，循环工程，写提示词、写Harness都比不过写好一个循环。

龙虾之父在X发文，不要在Coding Agent类产品里面写提示词了，我们应该设计一些循环来使用这些Agent。Codex负责人Tibo也很快转发了这则推文，问网友是否已经开始写嵌套循环了。

Codex的对家，Claude Code产品负责人Boris Cherny也在接受播客采访时提到，「不跟Agent对话，跟loop对话，让loop替我来prompt」。

Claude Code的负责人Boris Cherny，和产品负责人Cat Wu在Claude官方回顾Claude Code第一年的节目上，聊天过程中两人都表示很喜欢loop，认为Loop是下一个Leap（飞跃）

和loop对话？所以loop到底是什么。仿佛还没有看到所谓的Loop Engineering到底给一个项目带来了什么改变。例如用控制变量法，一个采用循环工程，一个不使用，两者最后的产出会有什么区别吗？

这些术语就莫名其妙地出现在了社交媒体上，有人说不用管「loop工程」是什么，它本质就是一种炒作和营销的手段。

一个正在使用Agent的用户，自然而然就实现了所谓的loop工程，而不是专门有一套流程，符合那套标准，需要被单拎出来，才可以被叫做是Loop Engineering。

所以是新瓶装旧酒，一套过去的思维方法论，重新套上了新名词吗？

人从写提示词，变成写循环

如果只看技术实现，Loop Engineering其实没有发明什么全新的东西。Harness、Skill、Agent Workflow这些系统，过去几年都在尝试让Agent自己规划、执行、反思和继续执行。

但今天大家重新开始讨论Loop，是因为模型终于开始能把循环跑下去了。当Agent能连续工作几十分钟、几个小时，甚至跨天完成任务时，人和AI协作的单位，也开始从一次对话变成一个完整回路。

什么是Loop Engineering，这个词听起来很新，讲的事其实很日常：你让AI写代码，它写完后你跑测试；测试报错，你把错误贴回去；它再改；你再跑。来回几次，直到代码能用。

这就是一个最原始的loop：行动、观察、修正、再行动。

区别在于，过去每一轮都靠人手动推动。人要复制报错、追问原因、提醒它别改错文件、判断什么时候该停。Loop Engineering做的事，是把这些反复发生的动作写成规则，交给系统去执行。

一个完整的loop，至少要回答五个问题：AI什么时候开始干活？它能调用哪些工具？它怎么知道自己做错了？它把每一轮结果记在哪里？它什么时候必须停下来交给人？

所以Loop Engineering更接近一套工作制度：给AI设任务、设工具、设反馈、设记忆、设刹车；prompt只是这套系统里最小的零件。

放到代码项目里，它可能是这样：每天早上，系统自动检查昨晚失败的代码提交。

AI读日志，判断是测试波动、依赖问题，还是最近提交引入的bug。能复现的，它在单独的worktree里尝试修复，跑测试，通过后开一个草稿PR。原因不清楚的，它把现场、尝试过的方法和下一步建议写进一个文件，等人来接手。

放在我们的工作流里，它就是每天早上，AI自动扫指定的新闻源、社交平台和公司博客。它挑出5个可能成稿的选题，补上来源、关键人物、争议点、可用截图和一句话判断。资料不足的地方，它标出来。到我们面前时，它已经整理成一张选题卡。

龙虾之父也在X分享了自己的循环工程实践，他让Codex维护自己的代码仓库，每5分钟唤醒一次并将工作分配给不同的线程。他说通过运用统筹能力，结合分类、自动审核和Computer Use技能，已经能让一些工作自主完成。

听起来也很像之前Claude Code主打的「做梦」机制，以及Hermes Agent的自进化功能，让Agent自己从过往上下文学习知识并完善所有的流程。

这也就是Loop Engineering的核心变化：Prompt Engineering时代，人负责写一句好提示词。Harness Engineering时代，人开始给模型搭框架。到Loop Engineering，人的工作进一步后退了一层。

一个loop由什么组成

一个能跑起来的loop，通常有几样东西。

根据Google Cloud AI总监Addy Osmani在X发布的循环工程文章，一套完整的循环工程，同样是五个积木加一个用来记录的记事本。

五个积木分别是定时任务、worktree、Skill、连接器、子Agent，以及一个记事本叫状态文件。

定时任务，在Codex里它叫Automations，在OpenClaw里面叫HEARTBEAT，在Claude Cowork里面是Scheduled。通过配置定时任务，我们可以选择对应的项目，自定义一段提示词，再设置对应的运行频率。

这是自动化循环的第一步。在设置定时任务时，也像使用Codex里面的Goal模式，让Agent自动跑，直到完成我们设定的目标。

Worktree存在的意义，是给每个Agent一个独立的工作目录，可以确保Agent在循环工程中只是修改各自的分支。

有了Skill，循环每一圈都可以不用猜测我们的项目是什么。Skill通过把项目知识写在文件里：构建步骤、团队约定、「上次就是这么出事的，所以不允许这么做了」，让Agent有了更充分的记忆，去处理任务。

连接器的主要目的是靠MCP协议跳出这个单独的文件系统，获取外界的给定数据库和其他系统信息，来完善整个循环。

子agent也是整个体系里最重要的结构，写代码的和审代码必须是两拨人。换一个指令不同、甚至模型都不同的agent来挑刺，才能审核出真正的问题。

记忆也很重要。很多AI工作流每天都会重复，但每天都从零开始。昨天已经确认过的事实，今天还要再查一次；上周已经否掉的标题风格，这周又被生成出来；某个来源经常不可靠，但AI下次仍然引用它。

除了用Skill的更新来规范Agent的行为，循环还需要一个聊天框外的记忆位置。

记事本，一个状态文件，它在单次对话之外，可以是一个文档、表格、看板，也可以是一份项目规则。里面记录已确认的信息、踩过的坑、偏好的格式、禁用的表达、上次没解决的问题。AI每次启动时先读它，就能接着往下走。

上手Loop Engineering

Loop Engineering常被开发者讨论，是因为代码有天然的反馈机制：测试能不能过，程序能不能跑，错误日志在哪里。这让代码场景看起来特别适合loop。

但就像Coding Agent最后变成了所有人的Agent，loop的适用范围也远不止编程。

内容工作里，它可以做选题筛选、资料整理、初稿生成、事实检查、标题优化和发布前检查。

客服工作里，它可以先读客户来信，判断问题类型，整理历史记录，生成回复草稿，并把敏感投诉留给人工处理。AI不需要直接发出所有回复，它先把问题分好、材料备好，就已经省掉很多时间。

产品和运营工作里，它可以定期整理用户反馈、应用商店评论、社媒讨论和竞品更新。

研究工作里，它可以追踪一个主题下的新论文、新报告、新数据。每天或每周更新一次，把新增内容和已有判断放在一起。

这些场景共同点都是任务会反复出现，流程相对稳定，结果可以被检查，关键判断还在人的手里。

想要真正入门循环工程也不是一件容易的事情，它有个前提：token管够。

循环会反复读上下文、反复重试、四处探索，不管最后有没有产出，Token都在燃烧。拥有无限额度的人觉得循环是常识，就像龙虾之父、Claude Code负责人、Google Cloud AI总监，他们都有无上限的Token。

但月付20美元的我们，循环跑了两天就达到了周限额。

还有，任务得每周都重复，如果是一次性的活，一句好提示词又快又便宜，重复太少，Agent又无法从循环中学习到知识。

而反复的循环又得有自动验证、测试、类型检查、构建，需要确保Agent在没人盯着的时候可以把烂活拦下来。Agent还得有高级工程师的素养：日志、复现环境、能跑自己写的代码。

随便缺这里哪一条，循环的成本可能就会高过回报。而token成本其实把这个热词拉回了现实，Loop Engineering不会让AI协作变得无成本，它只是把成本从「人一轮轮盯着」的时间成本，转移到「系统一轮轮运行」Money成本。

新的问题在于，随着模型越来越强，这笔账正在发生变化。

过去，一个任务失败了，人只能回来继续追问、补充上下文、重新解释需求。今天，很多时候AI已经能自己尝试、自己验证、自己修正，再把结果交回来。

如果一次循环消耗的Token，已经接近一个人来回追问几轮的成本，那么真正值得优化的，可能就不再是某一句提示词，而是整个反馈回路。

所以Loop Engineering最值得讨论的地方，未必是它算不算一个新学科。

更现实的问题是，当AI已经能连续处理多轮任务，人还要不要继续把自己卡在每一次追问里。

有些工作，确实只需要一句好提示词。有些工作，则需要一套能反复运行、能留下记录、能及时停手的流程。

这个分界线，在当下看来，可能比「循环工程」这个名字本身重要得多。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定