本文梳理了AI编程从Prompt到Agent Control Plane的演化逻辑，指出人类正从亲自编程转向设计任务系统。 ## 1. AI编程迭代的核心脉络：围绕降低人类注意力消耗推进 AI编程的迭代不是孤立新词的出现，从Prompt、Skill、Loop到RTS，每一步都围绕同一个核心瓶颈——解放人类注意力：Prompt减少表达成本，Skill减少重复成本，Loop减少纠错成本，RTS减少等待成本，下一步需要解决多Agent的调度与管理成本。 ## 2. 前四阶段的定位与各自的瓶颈 1. **Prompt阶段：人是手把手的提示词作者** 人需要将所有信息一次性塞进提示词，长任务中AI易忘前文、走偏，需要人反复修正，本质还是人维持任务，未解放人类注意力。 2. **Skill阶段：人是可复用能力的封装者** Skill将个人固定的工作方法、标准提前封装为可复用模块，避免重复输入，本质类似软件工程抽离函数，解决了重复交代的问题，但无法应对需要动态修正的复杂任务。 3. **Loop阶段：人是循环推进的设计者** AI可以自主完成「执行-观察-修正-再执行」的循环，比如自动跑测试、改报错，让AI从输出答案转向执行任务，但Loop通常是单线程，复杂任务中容易在错误方向消耗过多时间。 4. **RTS阶段：人是多路径的并行调度者** RTS类比实时战略游戏，核心是同时启动多个Agent从不同方向并行尝试，人类只需要把控方向、风险，叫停无效路线，确认可行方案，核心逻辑是用低计算成本替代昂贵的人类注意力，但同时启动大量Agent后，人类会被方案评审、合并、状态管理等新工作淹没。 ## 3. 下一步方向：Agent控制平面（Agent Control Plane）这不是更大的聊天窗口或更花哨的IDE，而是一套AI任务控制系统，负责管理任务队列、角色化Agent池、适配的上下文装载、独立工作区隔离、自动化验证流程、多候选方案比较、可追溯证据包、可复用项目记忆，核心是帮人管理一群做任务的Agent，而非直接帮人完成单个任务。 ## 4. AI编程下开发者角色与工具判断标准开发者角色逐步上移，从亲自写代码的执行者，变为设计AI任务生产系统的设计者，核心工作转向定义任务边界、验收标准、风险规则、沉淀项目经验。判断AI编程工具的进阶性，不应只看所用模型，而要看它是否支持并行候选路线、自动隔离与验证、多方案比较、失败沉淀、成本权限控制，只在必要时请求人类介入，满足这些才是靠近Agent控制平面的下一代工具。

2026-06-17 01:08

刚搞懂Loop，又来了RTS：AI 编程到底在往哪走？

AIGC从0到1

本文来自微信公众号： AIGC从0到1 ，作者：王零壹，原文标题：《刚搞懂 Loop，又来了 RTS：AI 编程到底在往哪走？》

我最近看AI编程这条线，有一个很强烈的感受：新词来得太快了。

去年之前还在讨论Prompt。2026明显加速了，大家开始说Skill，说不要每次都写一大段提示词，要把可复用的能力沉淀下来。最近又开始说Loop，说Agent不能只回答一次，要能自己执行、观察、修正、继续。

我刚把Loop这件事想明白，又看到RTS。

一开始我有点疲惫。

倒不是RTS这个说法不好。我真正疲惫的地方，是自己又被拖进了新名词里。每一个词看起来都很新，每一个词都像要开一扇门，但你追着追着就会忘记最开始的问题：这些东西到底想解决什么？

所以这篇文章，我不想再追名词。

我想把这件事从头捋一遍。Prompt、Skill、Loop、RTS，这些东西一路往前走，背后不变的东西是什么？如果RTS继续往前，开发工具会变成什么？

我的分析结论很简单：

AI编程真正变化的地方，是人类正在从“亲自做事的人”，一点点变成“设计任务系统的人”。

再往后走，它大概率会走向Agent Control Plane。

也就是一个能管理Agent、任务、上下文、验证、权限、成本和合并流程的控制平面。

一、最早的问题：人还在一遍遍教AI

Prompt阶段，我们其实是在手把手教AI。

你想让模型做一件事，就得把背景、目标、约束、输出格式、注意事项，全都塞进一段提示词里。

短任务还好。写邮件、翻译、解释概念，模型一般能接住。

但任务一长，问题就出来了。

它会忘前文，会误解你的目标，会在一个小地方走偏。你发现以后，只能重新解释一遍。它再偏，你再拉回来。

这时候你表面上是在用AI，实际上一直是你在维持整个任务。

你像一个人坐在副驾驶，不停提醒司机：这里左转，那里减速，前面别走错。

这就是Prompt的瓶颈。

它把AI接进了工作流，但人的注意力没有被解放出来。你还是要盯着，你还是要反复说，你还是要处理每一次偏航。

二、Skill出现以后，人开始少说重复的话

后来大家开始谈Skill，我觉得这一步是很自然的。

因为所有认真用过AI的人，都会很快遇到一个问题：很多话每次都要重复。

你有一套写测试的习惯。

你有一套审查代码的标准。

你有一套写公众号的结构。

你有一套拆需求的方法。

每次都把这些东西重新塞进Prompt里，很笨，也很浪费。

Skill做的事情，就是把这些可复用的能力提前封装起来。下次你不用再解释一遍“我希望你怎么做”，而是直接调用那套流程。

这一步的本质，是把人的经验从一次性对话里拿出来，变成可以反复使用的模块。

它有点像软件工程里的函数。

第一次写一段逻辑时，你可能直接写在业务代码里。写多了以后，你会发现它应该被抽出来。因为它不是某一次任务的临时表达，它已经变成了一种能力。

Skill也是这样。

它让AI不再每次都从零开始，也让人不用每次都重复交代。

但Skill还不够。

因为很多任务不是“照流程做一次”就能完成的。写代码尤其如此。你做一步，结果会变。测试会报错，环境会缺依赖，需求会露出新的边界。复杂任务需要来回修正。

所以会走到Loop。

三、Loop真正让我意识到：AI开始像做事的人了

Loop这个词，我觉得比Skill更重要。

Skill解决的是复用，Loop解决的是推进。

AI不再只是按你的要求输出一个答案，而是开始进入一个循环：执行一步，看结果，发现问题，修改，再执行。

写代码时，这个变化很明显。

过去你让AI写一段代码，它给你一个版本。能不能跑，得你自己试。

到了Loop，它可以自己跑测试。测试失败了，它去读报错。读完再改。改完再跑。

这个过程很像人做事。

人也不是一上来就把所有事情做对。人是试一下，发现不对，改一下，再试。

所以Loop的意义，不只是“多跑几轮”。它让AI从回答问题，开始靠近执行任务。

但我后来又发现，Loop也有一个很明显的边界：它通常还是一条线。

一个Agent沿着一条路径往前走。它可以纠错，可以回头，可以继续试，但它大多数时候还是单线程的。

这在小任务里够用。

可是一旦任务变复杂，单线程就慢了。

同一个bug，可能有好几种切入方式。可以从测试失败入手，可以从issue描述入手，可以从最近的commit入手，可以先做复现，也可以先读架构。

如果只让一个Agent一条路走到底，它很可能在一个错误方向上消耗很久。

这个时候，RTS这个比喻就突然变得有意思了。

四、RTS说的不是游戏，是人的位置又变了

RTS是实时战略游戏。

这个比喻最直观的地方在于：你不能只盯着一个条生产线。

真正会玩RTS的人，要同时看资源、基地、兵线、侦察、前线和防守。他不会把注意力全部放在某一个小兵怎么走位上。

放到AI编程里，意思也很清楚。

你不再只开一个Agent，让它慢慢想、慢慢改、慢慢跑。

你会同时拉起多个工作区，分给多个Agent，让它们从不同方向去试。

一个去复现问题。

一个去读测试。

一个去查历史提交。

一个去做最小修改。

一个尝试更大的重构，但先放在隔离环境里。

人类做什么？

人类不再盯每一行代码。

人类看方向，看风险，看哪些路线值得继续，哪些路线应该停掉。某个Agent做出了一个看起来能跑但侵入性太强的方案，人要叫停。另一个Agent找到了一个很小的修复点，人要判断它是不是足够稳。

这就是RTS方法里最打动我的地方。

它不是一个炫技概念。它说的是人的位置变化。

在Prompt阶段，人是提示词作者。

在Skill阶段，人是能力封装者。

在Loop阶段，人是循环设计者。

到了RTS，人变成了调度者。

你问的问题变了。以前是“我怎么把这段代码写对”，现在是“我怎么让多条尝试同时发生，并且在合适的时候介入”。

这个转变很大。

因为它承认了一件事：人的注意力比token贵。

只要试错成本足够低，很多时候就没必要让一个人坐在那里苦想最优路径。你可以让系统多试几条路，再让人判断哪条路更可信。

五、但RTS也会很快撞到墙

RTS听起来很兴奋，但它也不是终点。

你同时开三个Agent，可能还能盯得住。

开五个，已经有点吃力。

开十个、二十个呢？

很快，问题就从“能不能并行”变成“并行以后谁来管理”。

这才是关键。

如果每个Agent都在改代码，每个Agent都生成diff，每个Agent都有自己的解释和失败记录，人类很快会被新的工作量淹没。

你原来是被写代码淹没。

现在可能被review淹没，被合并淹没，被判断这些候选方案淹没。

更麻烦的是，多Agent并不天然更聪明。

如果任务边界不清楚，它们会互相踩文件。

如果共享状态不清楚，它们会基于过期信息做判断。

如果没有验证机制，它们会一起产出一堆看起来很努力、实际没法合并的东西。

所以RTS真正往前走，一定不能只停留在“开更多Agent”。

它需要一套管理层。

谁来分配任务？

谁来决定每个Agent读什么上下文？

谁来隔离工作区？

谁来跑测试？

谁来比较多个候选方案？

谁来记录失败路径？

谁来生成PR证据包？

谁来决定什么时候必须叫人？

这些问题一出现，下一步就很清楚了：Agent Control Plane。

六、Agent Control Plane是什么

我理解的Agent Control Plane，不是一个更大的聊天窗口，也不是一个更花哨的IDE。

它更像一层任务控制系统。

它知道现在有哪些任务在跑，哪些Agent在工作，分别用了什么模型，在哪个worktree里改了什么文件，跑过哪些测试，失败过哪些路线，当前风险在哪里。

开发者不再一个个窗口盯过去，而是在一个控制平面上看整体状态。

它至少要管几类东西。

第一，任务队列。

哪些任务可以并行，哪些任务必须串行，哪些任务风险高，哪些任务只是小改。

第二，Agent池。

不同Agent可以有不同角色。有的负责复现，有的负责修复，有的负责写测试，有的负责审查，有的负责总结失败经验。

第三，上下文装载。

上下文不是越多越好。要给Agent足够的信息。少了会误判，多了会迷路。

第四，工作区隔离。

每个Agent在独立worktree或sandbox里尝试，避免互相污染。

第五，验证流程。

测试、lint、类型检查、安全扫描、回归测试，应该成为系统默认动作。不能只靠Agent自己说“我觉得好了”。

第六，候选方案比较。

多个Agent产出多个方案以后，系统要能比较它们：改动范围、测试结果、复杂度、风险、可回滚性。

第七，证据包。

人类review的时候，不应该只看一坨diff。最好能看到：它为什么这么改，试过哪些路，哪些测试过了，哪些风险还在，回滚方式是什么。

第八，经验沉淀。

某条路线失败了，不应该只留在这次会话里。这个失败应该进入项目记忆，变成下次Agent不再重复犯错的上下文。

这就是Agent Control Plane和普通coding agent的区别。

普通coding agent是帮你做一个任务。

Agent Control Plane是帮你管理一群做任务的agent。

七、未来的开发者会更像系统设计者

如果这条线继续走，开发者的角色会继续上移。

这句话以前大家也说过很多次，但这次我觉得它变得更具体了。

以前说“开发者会变成产品经理”太泛。

现在看，开发者更像是在设计一个软件生产系统。

你要会写需求，但不只是写需求。

你要会定义验收标准。

你要会判断哪些任务适合并行。

你要会设计测试和验证。

你要知道哪些权限能放开，哪些操作必须卡住。

你要知道什么时候应该让Agent多试，什么时候必须人来做架构判断。

你还要知道哪些经验应该沉淀成Skill，哪些规则应该写进项目policy，哪些失败应该成为测试。

更重要的问题是：

我能不能设计一套让AI稳定产出、可验证、可回滚、可复用的系统？

这件事听起来更抽象，但其实更接近工程本身。

工程从来不是只把代码写出来。工程还包括边界、流程、验证、协作、风险和维护。

AI只是把这个问题推到了台前。

八、这条线里真正不变的东西

回到最开始那个困惑。

为什么刚理解Loop，又来了RTS？

为什么这些词一层层冒出来？

我现在的理解是：它们没有在描述一堆互相独立的新潮玩法。它们一直围绕同一个瓶颈往前推进。

这个瓶颈就是人类注意力。

Prompt想减少人的表达成本。

Skill想减少人的重复成本。

Loop想减少人的纠错成本。

RTS想减少人的等待成本。

Agent Control Plane想减少人的调度成本和判断负担。

每往前一步，人都从更底层的细节里退出来一点。

但这不代表人不重要。

恰恰相反，人的判断会变得更集中。

以前你的一小时，可能花在写代码、改报错、整理上下文上。

以后你的一小时，可能花在判断任务边界、验证标准、风险等级和系统规则上。

从某种意义上说，人不是被AI替掉了。

人是被迫站到了更高的位置。

站上去以后，问题也更难了。

因为你不能只会操作一个工具，你要理解一套系统怎么运转。

九、我会怎么判断一个AI编程工具有没有走到下一步

以后再看AI编程工具，我大概不会只问“它用了哪个模型”。

模型当然重要，但只问模型，太像只看发动机，不看整辆车。

我会问这些问题：

它能不能同时跑多条候选路线？

它能不能自动隔离每条路线？

它能不能自动生成和执行验证？

它能不能比较多个结果？

它能不能告诉我每个方案为什么留下、为什么放弃？

它能不能把失败经验沉淀下来？

它能不能控制权限和预算？

它能不能在真正需要人判断的时候，再把人叫进来？

如果这些问题都答不上来，那它可能还是一个更会写代码的助手。

如果这些问题慢慢能答上来，它就开始靠近Agent Control Plane。

十、别把每个新词都理解成一个时代。

很多文章就是把每个新词都写成一个时代。

这样写看起来很清楚，其实很容易把人带乱。

真正值得写的，是一个普通开发者、产品人、创业者看到这些变化时的那种追问：

为什么会从Prompt走到Skill？

为什么Skill之后还需要Loop？

为什么Loop不够，又会出现RTS？

为什么RTS继续往前，会需要一个控制平面？

沿着这条线看，很多东西就没那么玄了。

它一直在处理同一个问题：把便宜的计算组织起来，减少昂贵的人类时间消耗。

但减少人类时间，不等于减少人类判断。

恰恰是判断变得更贵了。

所以我会把这条演化线写成：

Prompt：人教AI做一次。

Skill：人把经验封装起来。

Loop：人让AI自己纠错推进。

RTS：人同时调度多条尝试。

Agent Control Plane：人设计一套系统，让调度、验证、记忆和风险控制自动运转。

这条线的终点暂时还看不清。

但方向已经很明显。

AI编程不会只停留在“帮我写代码”。它会越来越像一套软件生产系统。

而开发者要学的，也不只是怎么和模型聊天。

更重要的是，怎么设计这套系统。

AI原生产品日报频道: 前沿科技

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定