2026-06-16 09:15

AI 原生怎么搭建？工具、流程、组织与评价权

叶小钗

本文来自微信公众号：叶小钗，作者：叶小钗，原文标题：《【万字】AI 原生怎么搭建？工具、流程、组织与评价权》

上周六的时候，跟训练营小伙伴进行了一场关于AI原生组织/团队搭建的高质量分享。

这次分享几乎将我三年关于AI项目的认知全部点了一次，我觉得非常有意义于是准备整理成课件，今天先去除敏感、重要的部分整理成文，让大家感受下什么是AI原生：

我认为要聊清楚这个话题，可能需要从我的三次AI原生组织搭建的经历做展开：

第一次：CEO数字分身

两年半之前，我就在回答AI应该如何与团队协作的课题。当时我的解法是：方法论+工具链。

其中的方法论如果完全打开就是一些机制、流程；工具链打开的话是两套东西：

一、AI效能助手，其本质是构建企业信息流，将AI所需上下文沉淀下来；

二、流程引擎，其本质是构建用于承载企业工作流的容器，当时我们是自己实现了一套AI表格；

大家要特别注意这个组合：机制流程+企业信息通道建设+企业工作流承载平台，事实上所有的AI原生组织或者说数字分身平台，最终就是要搭建一套这个系统：

只不过，在两年前这套系统的实践落地是很失败的，原因很简单：没有企业买单，而原因同样简单：认知差距太大，企业和我之间没有共同语言，他们觉得我是疯子...

第二次：企业全案设计

然后就是第二次AI原生实践了，这次运气较好，当时受DeepSeek发布影响，国内多数老板出于极端焦虑当中。

PS：其实这批老板不焦虑就怪了，他们平时也不认真好好学习，遇到技术大的迭代只能抓瞎，真的请我去做咨询也很难认真听，因为AI知识这东西确实不性感，或者他们感兴趣只有提效的那个数字...

因为焦虑，所以之前对CEO数字分身不屑于顾的老板，又将我“请了”过去，要做全业务的AI化处理，并且这次他们是下了很大的决心的！

于是这次与之前就有很大的不同：

之前是团队无认知+无意愿，这次是团队无认知+有意愿

于是在一号位迫切的配合下，我们很快的拿到了结果：

如果你问我做了什么，那么依旧会回归到之前的机制流程+工具链（信息流建设+工作流承载平台建设）逻辑；

而如果你问我为什么会成功，我会说：因为一号位的AI焦虑，所以团队对我们（外部AI专家）的所有要求极其配合。

最后，如果你问我他们现在怎么样，我会告诉你：他们在自运行半年后放弃了整套系统！

至于原因是以下几点：

他们对AI几无认知，完全是我们强行拔高做出来的，后续业务流程上一些小的改变，都倾向于手动解决，不会/也没能力用AI去解决；
他们一号位焦虑感过去了，觉得AI有用，但似乎没那么神奇，并且整体机制维护起来太麻烦，下面员工投诉也多，他也就算了；

所以，得之易则失之易，他们很快的成功了，但是因为本来就没有相关的认知，也就很快的“失败”了。

第三次：全链路升级

到这里意愿x认知的四象限图就出来了，不同的现象会产生不同的问题，也有对应的解决策略：

前两次实践，一次死于认知鸿沟，一次败于管理惰性。这迫使我开始反思核心问题：当代码生产速度被AI拉起来后，究竟什么才是阻碍团队级提效的真正瓶颈？

前两次实践，第一次目标团队无认知、无意愿；第二次无认知、有意愿；然后就是第三次，我们做了一次有认知+有意愿的案例，AI基于产研团队的全链路优化：

这次实践的契机出现在今年上半年，两个前置条件：

各个老板又被小龙虾OpenClaw搞得焦虑的不行；
AI Coding工具已经相对成熟，个人提效的案例层出不穷；

但是现在问题也出现了：个人提效不等于整体提效。

这里的原因是：程序员用AI写代码可能快了三倍，但他的上下游并没有变化，比如需求依旧会反复沟通，并不会加速、下游的测试依旧需要一个个点，整体依旧会卡在那里。

所以，这里的结果是：代码变快了，交付没有。或者说全链路中某个节点/某个人快了，但整体并没有什么变化...

综上，又要回归我们最初的AI原生框架了：机制流程+企业信息通道建设+企业工作流承载平台。

至此，我们几乎可以为AI原生做下一个判断：

很多同学认为AI原生是个工程技术问题，其实我几次实践下来他是个机制协作问题

比如，AI Coding解决的是代码生产效率，但他并不会解决产研协作效率，因为需求歧义、验收扯皮、规范缺失，这些才是真正的瓶颈。

如果想要团队能够整体提效，就需要全链路升级，而在这个场景下就不得不涉及四个方面：流程标准化、需求结构化、知识库建设、Skills沉淀。

因为：AI原生组织，本质上是一场组织变革。

工具链解决的可能只是10%的问题，剩下90%是管理机制的重构，需要重新定义人和AI的工作边界，让AI处理大量重复、结构化的执行，让人聚焦在判断和兜底上：

说完三个案例，接下来正文就可以展开了：

AI进入组织，要爬四层坡

所以，什么是AI原生组织？

其实就是：大模型这个跨时代的技术进入组织后引起的复杂度爬坡罢了。

一开始，AI只是进入工作任务：写文档、写代码、查资料、做方案；

上述都是技术进入的工作，并且他们还仅仅都是围绕在个人做展开，所以他首先很具体，其次很简单。

然后，AI开始进入流程：它改变输入、输出、协作、交付和验收标准；

从这里开始就不仅是工具导入的问题，影响面开始从个人到组织，这里会涉及前面说的机制流程，会引发很多人的不适感，最终体现出来的就是各种管理成本。

再往后，AI会进入组织：它会冲击角色边界、责任边界、资源调度和评价体系；

终于在不断拉扯中，新技术和组织开始真正的融合，组织效率达到了某个平衡点。

最后，AI会倒逼商业模式......

所以AI进入组织:

最初是单点效率提升；
其次是组织为匹配个人效率提升最初的机制流程改变；
最后是稳定后整个评价体系基于新技术的重塑;

这套东西在执行过程中会带来一连串连锁反应：工具使用导致系统内部发生变化，超出了组织正常的消化能力。

这也是为什么很多公司买了AI工具，做了AI培训，搞了AI试点，但最后效果很一般。

因为他们以为自己在解决怎么用AI的问题，实际上真正的问题是：

组织有没有能力消化AI带来的新复杂度

在这个基础之下，我们来讨论四层爬坡：

第一层：个人工具适配

刚开始接触AI的时候，大家都会把AI当成工具来使用，这个阶段的核心需求是：怎么把AI用起来。

实际卡点也很明显：很多人心态上抗拒，不想学也不知道怎么学，很多员工真实的想法是：

我为什么要花额外的时间，去帮公司学习AI？

这句话不好听，但很真实。因为对于团队来说，要达到理想中个人使用AI所达到的效率，很多时候唯一的办法就是：在日常工作基础上，用加班来补全效率差额。

这也解释了为什么很多人用了AI以后，反而更累了。因为AI没有自动让组织变轻，只是让个人承担了更多学习和兜底的成本。

并且这里大家很快就意识到了本质的问题：个人效率不等于团队效率。

一个人用AI写代码快了、写方案快了，生成文档快了，这些当然有价值。但如果他的上下游没有变化，团队整体效率并不会同步提升：

甚至，上游用AI加速内容生产，下游可能更难消化。

这一方面是AI制造出来的新问题；另一方面，是原本就没有处理、只是放在那里的问题，在AI引入的时候被暴露出来了。

比如需求本来就不清楚，过去只是慢慢沟通、慢慢磨；现在AI把需求文档生成得很快，看起来更完整了，但下游会发现：它只是看起来完整，实际上不能用。

于是矛盾就出现了：

上游觉得自己已经很完整了；
下游觉得你只是把消化成本转给我了；
老板觉得AI都用了，效率为什么还没提升？

最终结果是，从个人视角用AI都觉得很爽，但团队视角用AI却很虚，所以第一层的核心结论是：

AI可以提升个人效率，但个人效率提升之后，会把团队协作问题暴露出来。

这时候就进入第二层。

第二层：流程适配

团队经过新技术（AI）导入后，已经开始爆发问题了：个人效率很高，团队效率没办法。

但组织也想吃AI的红利啊，所以他们必须思考一个命题：

团队的流程和标准，能不能承接AI带来的效率变化

换句话说，我们应该如何优化流程，以便于能够更好的配合AI？

这里就会开始涉及上下游协作，涉及输入输出标准化，也涉及需求准入、质量评价和验收机制。

说白了，就是要重新定义：

什么样的需求可以进入开发？
什么样的文档算合格？
什么样的代码可以验收？
什么样的测试算完成？

这个阶段最大的卡点是：上下游没有共同的输入输出标准。

在之前，产品、开发、测试各有一套标准，并且他们的标准往往不能统一，之所以能工作，多半是下游在补位上游。

只不过，AI出现在任务链条中后，问题开始变得不可避免，也就是：之前靠扯皮、妥协可以正常工作的系统玩不了了，因为：

AI不会补位，他只认上下文...

这里有些同学可能不理解问题到底在哪，我赘述一句：AI虽然让输出变快了，但并没有让输出变得更容易被消费。

这是什么意思呢？意思是：产品花费之前1/10时间，糊弄出来的需求文档，程序员读不懂，AI也读不懂；技术快速代码生成的界面，测试已经需要每个按钮点一次才算通过...

所以这个阶段要做的事情，就是SOP优化、输入输出标准重建。在我们过往实践中，真实可操作的策略是，双方往彼此靠：

产品往下走一点，不只是写需求文档，而是直接输出更可交互的原型；
开发往上走一点，不只是等需求，而是主动补全业务理解和技术实现方案；

这里大家也要看明白，这也是为什么产品、技术、测试正在走向融合的原因

只不过，明眼人这里也看出问题了，这套策略其实对每个人的能力要求更高了，要求他们更加多面手了，但并不是所有的岗位都可以走向融合，所以他不可避免会导致下一层的问题：

流程顺了，不等于组织顺了

什么意思呢？意思是部门内部的流程通了，跨部门流程还是不通。

产研内部可以优化得很好，但一个真实项目从开始到结束，不只产研这一个环节，他会涉及销售、售前、产品、开发、测试、交付、运维、客服、财务、法务、客户成功等多个角色。

产研流程再顺，在整个业务流程里也可能只占一部分，编码速度再快，在整个交付链路里也只是一部分，甚至只是一小部分，在这里大家会更加能感受到，什么叫：

代码变快了，交付没有变快

因为每个角色在传递过程中，都要同步上下文、协调资源、解释边界、处理非标问题，而这些角色是真的不好再想产研体系那样做补位和融合了...

于是依旧会有很多一事一议，也依旧会有很多扯皮，而这些损耗的大头，已经跟AI没有太大关系了。所以第二层的核心结论是：

AI可以推动流程标准化，但流程标准化之后，会把组织协作问题暴露出来

第三层：组织适配

到了第三层，问题就不再是流程，而是组织。

因为前面说的部门墙（责任边界、资源调度、评价体系）会把效率吃掉，所以这个阶段的核心需求是：组织内部交互整体最优。

这里要特别说一嘴，很多人对部门墙的理解比较简单，以为部门墙就是大家不配合，是态度问题。

其实，部门墙不是态度问题，而是组织结构允许的结果，如图所述：

每个部门负责人都会基于自己的责任，选择对自己最有利的目标解释方式。

每个部门都会说自己是为公司好。

每个部门都会觉得自己已经很配合了。

换个说法：这东西从设计上就是个追求局部最优的系统。但因为是追求局部最优，那问题就来了：

每个部门都在优化自己的接口，希望其他部分按照我的规则来走，但显然这不一定能优化整体效率

而，这就是组织复杂度

并且，这是不可调和的，部门和部门之间，部门和老板之间，天然都有目标、资源、责任和风险上的冲突。

这种情况下，你很难单纯要求其他部门应该怎么做。所以组织适配阶段，真正要解决的不是让大家更配合，而是重新设计责任边界和目标解释权。

在过往实践中，有两个策略是比较好用的：

第一类是柔性的，靠利益交换、靠刷脸去追求局部协作。说白了，就是你不要只想着别人应该做什么，而是要让别人愿意跟你一起做。

第二类是强硬的，靠组织调整、岗位合并、部门接管，直接拿到目标解释权，打破常规协作方式。

但组织架构调整也不是万能解，它只是把成本前置了，因为公司之所以拆成不同部门，本身就是一种信息压缩方式。意思是：

业务复杂的评价成本、技术壁垒的判断成本依旧在那里，所以谁去负责或者买单呢？

举个例子：你将技术团队合并给销售团队，虽然可以解决技术不懂业务的问题，但依旧不能解决技术问题复杂的问题，甚至整体迭代速度还可能更慢！

且不论过程中还会涉及到外行指导内行、员工成长、价值观冲突等问题。

所以第三层的核心结论是：

AI可以推动组织重构，但组织重构之后，会把专业评价问题暴露出来

谁该为复杂的业态、高壁垒的专业最终负责，是这个阶段遗留的问题

第四层：评价权重构

所以，第四层关注的不是组织要不要合并，而是应该解决合并后带来的组织复杂度：谁来评价、能不能评价的问题。

举个例子，就只是说AI原生这个事情，问题都会变得很残酷了，因为就我真实的企业AI咨询实操来说：

不是所有公司都需要快速智能化。
不是所有业务都值得重构组织。
不是所有流程都值得做Agent。
不是所有AI转型都是正收益。

很多时候，过早转型其实是负优化，但是谁应该去对这些结果负责？

所以，这里的问题是：谁应该去评价这一切，谁又有能力去评价这一切，更进一步：如何将AI完整的嵌入公司的业务流程评价和管理流程评价体系之中。

要注意，这个评价问题会比之前的所有问题更加棘手，因为他之前没有出现过，也没有可以抄的答案。

并且，现阶段AI真的在补足每个员工各种能力，岗位合并、部门融合似乎已经成了一个趋势。

比如我们前面说的产品要更懂技术，技术要更懂业务，交付要更懂客户，售前要更懂方案，大家不要以为他是天方夜谭，因为这个岗位已经被挂出来了，他的名字叫FDE。

FDE表面上是一个跨域交付岗位，本质上是AI进入业务流程后，评价权前移所产生的组织接口人：

所以第四层的核心问题是：

AI原生组织必须重新定义评价权

而评价权背后的涵义很丰富，他包括质量标准、验收机制、责任边界等等，如果要进一步打开，就又有四个问题需要回答：

谁定义好坏？
谁负责验收？
谁承担风险？
谁拥有最终解释权？

这个就是AI原生的终极问题：当业务判断、专业判断、客户反馈、AI建议互相冲突的时候，谁说了算？

因为组织结构可以调整，岗位可以合并，流程可以重写，工具可以替换，但评价权不是那么容易转移的。评价权背后是专业壁垒、组织权力、责任归属和风险承担。

至于这个问题的解法，就留给大家思考吧......

四层爬坡：问题递归

总结一下，AI进入组织以后，是一个连续爬坡的过程：

第一层解决个人工具问题，会暴露团队协作问题；
第二层解决流程标准问题，会暴露组织边界问题；
第三层解决组织协作问题，会暴露专业评价问题；
第四层解决评价权专业问题，又会最终暴露商业模式问题；

其实很多人做到第四层就会开始质疑，因为他们会发现：

就算做到了组织适配这一层，就算已经利用AI将效率达到了机制，但公司业务未必会带来什么增长

这里的原因又很简单，个人能控制的是对工具的使用，组织能控制的也只有员工罢了，我们都仅仅能控制自己能控制的那一部分。

除自身以外的商业模式不是你想优化就能优化的，甚至来说：

乙方其实是甲方的补丁

如果甲方本质上就很低效，甲方也不想在这个过程中提效，他本来就是花钱让乙方去干他不想干的事情。

这个时候乙方再拼命提效，意义可能并没有想象中那么大，这里再次进入了更大的圈层循环：你解决了部门墙，但你解决不了公司墙...

这里如果要展开会很复杂，所以我们回归AI原生转型过程中的四层爬坡，大家会发现他居然是个递归问题：上一层的问题解决以后，会把下一层的问题推出来。

但你不能认为这些问题是AI带来的，事实上就我对管理及AI的认知，我会认为：AI暴露的不是AI的问题，而是组织原本就存在的问题。

只是过去这些问题可以被低效率掩盖，但AI进来以后，某些节点突然变快了，旧系统的不均衡就被放大了，所以你想推AI原生，就必须关注到每一层的问题，解决每一层的问题：

组织变革，双向依赖

这一段对于今天的内容也许不是必须，但他却是我在做企业咨询过程中关于组织一号位非常感性的体悟：AI和组织变革之间，其实是双向依赖：

AI要发挥效果，往往需要推动流程变革和组织优化

但一把手如果看清趋势，推动了部门调整、岗位合并、流程重构，又会依赖AI真的能发挥效果

这就是双向依赖

过程中，我见过的每个企业，老板一定是最受伤的那个人：

如果一把手走得太激进，下面的人会觉得老板是不是被自媒体忽悠了；
如果一把手因为一些原因（业务压力、认知限制或者现金流约束），没法调整组织，又会有人觉得公司跟不上AI时代；

总而言之，作为一号位，你只有赢才能堵住他们的嘴，但是多数公司实际去做执行落地的并不是老板，而是CTO或者CIO或者AI项目负责人。

这个时候，就要非常注意AI原生推进的节奏了，主要是要把老板和员工两个角色串起来（欺上瞒下）：

一边要把老板的焦虑，转移成组织演进可以成功执行的真金白银；
一边要把一线的真实问题，翻译成老板能理解的要不要继续的判断，也就是一切尽在掌握，员工虽有问题，但最近效率提升明显，大家正在攻克难关；

说得难听点，是两边哄，说得好听点，是和团队一起慢慢把认知、方法、流程、工具、组织和结果串起来！

而这个人的角色画像，大家可以认为是我这样的人，一个带顾问属性的AI专家。

前面根据我三次实践案例，我们为AI原生做了一个定义：机制流程+企业信息通道建设+企业工作流承载平台；

而后我们提出了AI进入组织，要爬四层坡：个人工具适配→流程适配→组织适配→评价权适配。

而现在理论的部分差不多了，似乎还差一个复杂的案例将他们串起来：

第四次：复杂案例说明

下面这个案例，是我之前在电商领域做的一次完整实践：

它完整经历了从个人工具到评价权重构的四层爬坡，而且因为行业的特殊性，每层出了问题，不是效率下降那么简单，而是安全红线、合规风险，总之代价很大的。

PS：这个业务有一定密度，所以会进行部分脱敏处理，大家看不明白的地方可以在后台问问...

这里我们会为大家完整展示一个生产级AI客服是什么样的，并且会告诉大家，技术的部分只占不到50%，要匹配这套AI系统好好的运行，需要各种机制配合：

业务背景

平台有1000个兼职客服，但近期虽然业务量暴涨，单次服务收入却持续下降，兼职客服利润被严重挤压，对应着平台这边用人成本也在增加，于是这边对效率工具提出了新的要求。

只不过传统的基于规则引擎的客服辅助插件已经到了天花板：

意图识别覆盖率只有68%，大量对话需要人工介入；
兼职客服日均处理单量长期徘徊在300-400单，成本降不下来；

于是我们成立专项组，目标当然不是做更好用的工具，而是重构整个客服工作流，让兼职客服一天的接单量翻倍，而整体平台的成本却不用增加太多：

而这里的实现路径也就是上面的四层循环：

第一层：个人工具适配

最初，我们的想法很简单，做老工具改造：给规则引擎接入AI大模型，把那些“木有”、“没啥感觉”、“咋整啊”之类的口语化表达也识别出来。

我们认为有AI的加入，理论上意图识别应该能提到90%以上。

很快做出了第一个版本，结果兼职客服却集体拒绝使用，原因有两个个：

AI太慢，响应时间5秒，慢；
意图识别时有错误，不准；

所以，结论是一个更聪明但更慢的工具，反而降低了熟练客服的效率。

这里就是很多企业在做AI引入会遭遇的实际问题了，以这里的案例来说：

很多人都会以为AI足够聪明就行了，但实际上客服要的是不打断工作流的工具，对他们来说：响应慢5秒，他一天的订单量可能要少100单！

在这一层，我想告诉大家的是：个人工具适配不是技术问题，而是体验和稳定问题，会用工具只是第一步，工具丝滑、不出错才是核心！

如果AI不能无缝融入使用者的日常操作习惯，不能稳定可靠地输出结果，那么他们就一定会吐槽。

第二层：流程适配

被客服拒绝后，我们做了大量工程优化：缓存、异步、模型迭代，把响应压到2秒内，并且准确率也想办法搞上来了。

然后，客服终于开始用了，只不过他们还是在抱怨...

我们跟踪后发现：每个会话，客服都要盯着屏幕点一下“发送”或“确认”。这个等待-确认的动作，把AI提速的红利全吃掉了。

于是我们做了一个关键的流程变更决策：AI客服从辅助工具升级为自动化流程引擎。系统自主运行标准问答流程，只在以下情况才中断流程：

AI置信度低，拿不准用户意图；
触发了业务硬性规则，如敏感词命中；
落入必须人工处理的复杂场景，如投诉升级；

这一轮流程改造，效果很好：日均单量从300跳到了1100。这就是流程适配带来的威力。

第三层：组织适配

流程变了，客服的角色和组织边界也会跟着变。

过去，客服是每个会话的必经节点；现在，系统处理了70%以上的标准会话。

这让一些客服感到不适：我的工作被AI抢了？也有些客服觉得轻松了：终于不用跟那些重复问题耗时间了。

但无论如何，结果是：已经不需要1000个兼职客服了。于是这里需要做两件事：

一是重新定义岗位职责。客服的考核指标从处理单量变成例外处理质量+系统报错贡献。系统自动处理的会话，客服不背锅；但客服发现系统错误并一键报错，计入绩效。

二是建立跨部门的协同机制。技术团队和运营团队不再各干各的，而是每周一次联合复盘：哪些报错是模型问题？哪些是规则缺失？哪些是知识库没覆盖？

这就是组织适配：重新设计责任边界和目标解释权。

第四层：评价权重构

到了这一层，问题才真正触及根本：系统自动发出的回复，质量怎么评价？谁来定义“好”？

我们这里建立了一套数据驱动的闭环评价体系：

一键报错：客服在处理人工会话时，如果发现系统之前的判断有误，可以一键报错，附带原因分类。
数据回扫：定期导出历史会话，用最新的规则引擎重新跑批，找出潜在问题。
质检闭环：运营团队对报错和回扫发现的问题进行复核，确认后纳入规则库或模型训练集。

最终，一套数据飞轮系统产生了...

这里的点是：所有的AI项目都有一套围绕着他的“Harness”，这套工程机制流程存在的价值就是保证AI项目稳定的运行，所以并不是Agent才需要Harness，所有的AI项目或者线上项目都需要！

结语

文章篇幅不小了，就不总结了，希望对大家有用吧...

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定