纠正大众对AI领域Harness是「模型能力补丁、会随模型变强消失」的错误认知,提出Harness是释放模型能力的核心基础设施。 ## 1 流行认知被事实证伪 大众普遍认为Harness是弥补当前模型能力不足的临时性补丁,模型足够强后就会消失。但实际与该认知矛盾:Claude最新模型比一年多前的Sonnet 3.5能力提升显著,Claude Code的Harness模块反而在各维度都变厚了。 ## 2 Harness的核心本质:模型能力的释放基础设施 Harness和模型的关系,同管理体系与员工、操作系统与CPU的关系同构:能力越强,可调动资源越多、影响越大,越需要精密的协调管控机制。Harness本质是解决「强大但无边界的模型如何安全可控嵌入真实世界」的问题,和操作系统一样是基础支撑,而非临时补丁。 ## 3 Harness的四大核心职能,全部与模型能力正相关 - **上下文管理**:模型不仅有上下文窗口物理限制,无限窗口也存在注意力信噪比问题,Harness的compact机制类似虚拟内存,模型越强、单次会话任务越长,对这套机制的需求越大。 - **权限边界**:模型越强大,越能正确执行高危操作,越需要更精细的权限围栏管控风险,需求随模型能力提升而增长。 - **任务编排**:模型越强,可承接的任务规模越大,越需要拆解调度子任务、回溯问题,这套编排逻辑只会随任务膨胀变复杂。 - **人机协议**:模型越自主,越需要任务进度可视化、方向纠正、审批机制等人机信任基础设施,需求不会随模型变强减少。 ## 4 区分两类Harness,明确发展趋势 Boris提到的随模型能力增强会消失的是防御性Harness,这类Harness是不信任模型判断的额外校验,确实属于补丁,模型能力足够后会退出。但使能性Harness是为了释放更强模型能力搭建的运行时基础设施,只会随模型能力增长持续发展。作者判断,Harness Engineering会成为独立且越来越重要的工程学科。
我发现很多人都误解了Harness这个概念
2026-05-14 20:25

我发现很多人都误解了Harness这个概念

本文来自微信公众号: 碳基智 ,作者:碳基智


最近因为工作关系,我花了不少时间研究AI编程产品的架构设计,尤其是Claude Code、Cursor、CodeBuddy这类产品背后的Harness Engineering。


在看了大量技术博客、社区讨论、还有Anthropic团队在各种场合的分享之后,我发现一个问题:


很多人对Harness最流行的那套理解,很可能是错的。


1


在很多人的理解里,Harness就是一个补丁,因为模型现在还不够好,所以需要在外面包一层东西来补它的缺陷。等模型足够强了,这层东西就会消失,大家又可以回到「直接把任务丢给模型」的简单世界。按这个逻辑,Harness就是一种临时性的补丁,是从AI辅助写代码到AI独立工作这条路上的过渡态。


这个理解非常符合大家对技术进步的直觉判断,缺陷被能力抹平,工具被智能取代,好像……没毛病?


但它解释不了一个很具体的事实,而事实是证伪最好的依据。


Claude最新的模型比一年多前的Sonnet 3.5强了不止一个量级,无论是代码能力、推理深度还是指令跟随,都能给到一个夯。


可你去看Claude Code这一年多的演进,你会发现:


query loop变复杂了,权限策略变细了,compact机制从简单截断变成了带摘要的上下文换页,hook系统从无到有,sub-agent并行架构从单线程变成了多worker协作。



不对啊,这不都是Harness的东西吗,它甚至在每一个维度上都变厚了。


如果Harness只是能力补丁,模型变强应该让补丁变少才对。实际情况正好相反。


2


Harness到底在做什么?我举个更好理解的例子:


想想你们公司管理新来实习生和管理一个总监的区别。实习生你基本不怎么管,给他派个活儿,他做完拿给你看就行了。为什么不管?因为他能干的事本来就少,权限有限,出不了大乱子。


但一个总监呢?OKR对齐、跨部门协调、定期汇报、预算审批、权限分级、下属管理……围绕他建立的管理机制比实习生复杂十倍。这是因为总监能力不行吗?恰恰相反,是因为他能调动的资源太多了、做的决策影响太大了、涉及的协作面太广了,所以需要更精密的协调和管控机制来确保他的能力被正确释放。


Harness和模型的关系,跟管理体系和员工的关系是同构的。模型越强,它能做的事越多、单次操作的影响越大、需要协调的上下文越复杂,围绕它建立的运行时机制就必须越精密。


换个更底层的类比:CPU和操作系统。Intel 8086时代的DOS几乎没有进程管理、没有内存保护、没有权限隔离。现在M4 Ultra上跑的macOS有虚拟内存、有沙箱、有进程调度器、有精细到每个文件的权限系统。


CPU从8086进化到M4 Ultra,操作系统从来没有因此变薄过。因为操作系统解决的问题是:一个强大但无状态、无边界的计算引擎,如何安全、可控地嵌入到一个有状态、有后果的真实世界中。



Harness就跟个操作系统一样。


3


具体拆解下来,Harness有四个职能,每一个都跟模型能力正相关而非负相关:


上下文管理。模型有context window的物理限制,但更关键的是,即使窗口无限大,注意力也有信噪比。塞进去的信息越多,每一条信息被有效利用的概率越低。Claude Code的compact机制就是在做虚拟内存——把当前不用的东西换出去、需要的时候换回来、中间做摘要保持连续性。模型越强、单次会话做的事越多,这套机制的压力就越大。


权限边界。一年前的模型大多数时候不敢也不会执行高危操作。现在的模型不但敢,而且真的能正确判断"该删的时候删"。恰恰因为它"能"了,围栏就得更精细。一个笨小孩拿剪刀你不太操心,一个身手灵活的成年人拿刀你得更关心他往哪挥。


任务编排。模型弱的时候,你给它的活是"改这个函数"。模型强了之后,你可以说"重构整个认证系统"。后者需要拆解成子任务、决定执行顺序、并行处理独立部分、在子任务间传递上下文、出了问题能回溯。这套调度逻辑只会随着任务规模的膨胀而变复杂。


人机协议。模型越自主,人的焦虑越大——它在做什么?走偏了怎么办?怎么纠正方向?Task list、plan mode、审批机制、进度可视化,这些不是"模型不行才需要的辅助轮",是信任基础设施。你把一个天才员工放到高度自主的岗位上,反而需要更清晰的汇报制度和决策边界,不是更少。



四个职能里没有任何一个会因为模型变强而趋向消失,它们全部是正相关!


模型能力越强,对这四层基础设施的需求越大。现在你告诉我,Harness怎么可能随着模型能力的增长被填平?Tell me!


4


写到这里,可能有人要搬出Claude Code的创造者Boris在红杉AI大会上的发言来杠我了。


他说:


随着模型能力增强,产品层的重要性会下降,很多原来由产品层做的事模型会自己完成。他还具体点了名,比如防prompt注入、命令静态校验、权限模式、人工审批,这些都是模型能力不足时的补丁,模型够强就会退出。


理解起来,好像确实是在说Harness会消失啊?


但你再看下他后面提到的Claude Code正在推进的工作呢?


让loop成为一等功能、大规模并行Agent管理、Claude Design、computer use持续进化……


这些东西,不还是Harness的范畴吗?


防prompt注入、静态校验、人工审批,这些东西存在的原因是「我不信任模型的判断,所以在外面加一道校验」。这是防御性Harness,它确实是补丁,模型判断力够了,它确实可以跪安。


但loop一等化、并行agent编排、computer use,这些东西存在的原因是「模型已经够强了,我需要更复杂的运行时来释放它的能力」。这是使能性Harness(原谅我实在不想用赋能这个词),它是基础设施,只会随着模型能力的增长而增长。



5


所以,我觉得,更合理的理解是,Harness压根就不是补丁,它也不可能随着模型能力的增强被填平,反而会成为模型之外一个十分重要的,像操作系统一样的东西。


我个人判断,Harness Engineering会成为一个独立的、越来越重要的工程学科。


操作系统工程从来不会因为CPU变强而消失,反而随着硬件能力解锁而变得更复杂、更精妙。


这也是为什么Anthropic花巨大精力做Claude Code的harness,而不是只堆模型参数。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定