本文来自微信公众号: 叶小钗 ,作者:叶小钗,原文标题:《【万字】AI 原生怎么搭建?工具、流程、组织与评价权》
上周六的时候,跟训练营小伙伴进行了一场关于AI原生组织/团队搭建的高质量分享。
这次分享几乎将我三年关于AI项目的认知全部点了一次,我觉得非常有意义于是准备整理成课件,今天先去除敏感、重要的部分整理成文,让大家感受下什么是AI原生:

我认为要聊清楚这个话题,可能需要从我的三次AI原生组织搭建的经历做展开:
第一次:CEO数字分身
两年半之前,我就在回答AI应该如何与团队协作的课题。当时我的解法是:方法论+工具链。
其中的方法论如果完全打开就是一些机制、流程;工具链打开的话是两套东西:
一、AI效能助手,其本质是构建企业信息流,将AI所需上下文沉淀下来;

二、流程引擎,其本质是构建用于承载企业工作流的容器,当时我们是自己实现了一套AI表格;

大家要特别注意这个组合:机制流程+企业信息通道建设+企业工作流承载平台,事实上所有的AI原生组织或者说数字分身平台,最终就是要搭建一套这个系统:

只不过,在两年前这套系统的实践落地是很失败的,原因很简单:没有企业买单,而原因同样简单:认知差距太大,企业和我之间没有共同语言,他们觉得我是疯子...
第二次:企业全案设计
然后就是第二次AI原生实践了,这次运气较好,当时受DeepSeek发布影响,国内多数老板出于极端焦虑当中。
PS:其实这批老板不焦虑就怪了,他们平时也不认真好好学习,遇到技术大的迭代只能抓瞎,真的请我去做咨询也很难认真听,因为AI知识这东西确实不性感,或者他们感兴趣只有提效的那个数字...
因为焦虑,所以之前对CEO数字分身不屑于顾的老板,又将我“请了”过去,要做全业务的AI化处理,并且这次他们是下了很大的决心的!
于是这次与之前就有很大的不同:
之前是团队无认知+无意愿,这次是团队无认知+有意愿
于是在一号位迫切的配合下,我们很快的拿到了结果:

如果你问我做了什么,那么依旧会回归到之前的机制流程+工具链(信息流建设+工作流承载平台建设)逻辑;
而如果你问我为什么会成功,我会说:因为一号位的AI焦虑,所以团队对我们(外部AI专家)的所有要求极其配合。
最后,如果你问我他们现在怎么样,我会告诉你:他们在自运行半年后放弃了整套系统!
至于原因是以下几点:
他们对AI几无认知,完全是我们强行拔高做出来的,后续业务流程上一些小的改变,都倾向于手动解决,不会/也没能力用AI去解决;
他们一号位焦虑感过去了,觉得AI有用,但似乎没那么神奇,并且整体机制维护起来太麻烦,下面员工投诉也多,他也就算了;
所以,得之易则失之易,他们很快的成功了,但是因为本来就没有相关的认知,也就很快的“失败”了。
第三次:全链路升级
到这里意愿x认知的四象限图就出来了,不同的现象会产生不同的问题,也有对应的解决策略:

前两次实践,一次死于认知鸿沟,一次败于管理惰性。这迫使我开始反思核心问题:当代码生产速度被AI拉起来后,究竟什么才是阻碍团队级提效的真正瓶颈?
前两次实践,第一次目标团队无认知、无意愿;第二次无认知、有意愿;然后就是第三次,我们做了一次有认知+有意愿的案例,AI基于产研团队的全链路优化:

这次实践的契机出现在今年上半年,两个前置条件:
各个老板又被小龙虾OpenClaw搞得焦虑的不行;
AI Coding工具已经相对成熟,个人提效的案例层出不穷;
但是现在问题也出现了:个人提效不等于整体提效。
这里的原因是:程序员用AI写代码可能快了三倍,但他的上下游并没有变化,比如需求依旧会反复沟通,并不会加速、下游的测试依旧需要一个个点,整体依旧会卡在那里。
所以,这里的结果是:代码变快了,交付没有。或者说全链路中某个节点/某个人快了,但整体并没有什么变化...
综上,又要回归我们最初的AI原生框架了:机制流程+企业信息通道建设+企业工作流承载平台。
至此,我们几乎可以为AI原生做下一个判断:
很多同学认为AI原生是个工程技术问题,其实我几次实践下来他是个机制协作问题
比如,AI Coding解决的是代码生产效率,但他并不会解决产研协作效率,因为需求歧义、验收扯皮、规范缺失,这些才是真正的瓶颈。
如果想要团队能够整体提效,就需要全链路升级,而在这个场景下就不得不涉及四个方面:流程标准化、需求结构化、知识库建设、Skills沉淀。
因为:AI原生组织,本质上是一场组织变革。
工具链解决的可能只是10%的问题,剩下90%是管理机制的重构,需要重新定义人和AI的工作边界,让AI处理大量重复、结构化的执行,让人聚焦在判断和兜底上:

说完三个案例,接下来正文就可以展开了:
AI进入组织,要爬四层坡
所以,什么是AI原生组织?
其实就是:大模型这个跨时代的技术进入组织后引起的复杂度爬坡罢了。
一开始,AI只是进入工作任务:写文档、写代码、查资料、做方案;
上述都是技术进入的工作,并且他们还仅仅都是围绕在个人做展开,所以他首先很具体,其次很简单。
然后,AI开始进入流程:它改变输入、输出、协作、交付和验收标准;
从这里开始就不仅是工具导入的问题,影响面开始从个人到组织,这里会涉及前面说的机制流程,会引发很多人的不适感,最终体现出来的就是各种管理成本。
再往后,AI会进入组织:它会冲击角色边界、责任边界、资源调度和评价体系;
终于在不断拉扯中,新技术和组织开始真正的融合,组织效率达到了某个平衡点。
最后,AI会倒逼商业模式......

所以AI进入组织:
最初是单点效率提升;
其次是组织为匹配个人效率提升最初的机制流程改变;
最后是稳定后整个评价体系基于新技术的重塑;
这套东西在执行过程中会带来一连串连锁反应:工具使用导致系统内部发生变化,超出了组织正常的消化能力。
这也是为什么很多公司买了AI工具,做了AI培训,搞了AI试点,但最后效果很一般。
因为他们以为自己在解决怎么用AI的问题,实际上真正的问题是:
组织有没有能力消化AI带来的新复杂度
在这个基础之下,我们来讨论四层爬坡:
第一层:个人工具适配

刚开始接触AI的时候,大家都会把AI当成工具来使用,这个阶段的核心需求是:怎么把AI用起来。
实际卡点也很明显:很多人心态上抗拒,不想学也不知道怎么学,很多员工真实的想法是:
我为什么要花额外的时间,去帮公司学习AI?
这句话不好听,但很真实。因为对于团队来说,要达到理想中个人使用AI所达到的效率,很多时候唯一的办法就是:在日常工作基础上,用加班来补全效率差额。
这也解释了为什么很多人用了AI以后,反而更累了。因为AI没有自动让组织变轻,只是让个人承担了更多学习和兜底的成本。
并且这里大家很快就意识到了本质的问题:个人效率不等于团队效率。
一个人用AI写代码快了、写方案快了,生成文档快了,这些当然有价值。但如果他的上下游没有变化,团队整体效率并不会同步提升:
甚至,上游用AI加速内容生产,下游可能更难消化。
这一方面是AI制造出来的新问题;另一方面,是原本就没有处理、只是放在那里的问题,在AI引入的时候被暴露出来了。
比如需求本来就不清楚,过去只是慢慢沟通、慢慢磨;现在AI把需求文档生成得很快,看起来更完整了,但下游会发现:它只是看起来完整,实际上不能用。
于是矛盾就出现了:
上游觉得自己已经很完整了;
下游觉得你只是把消化成本转给我了;
老板觉得AI都用了,效率为什么还没提升?
最终结果是,从个人视角用AI都觉得很爽,但团队视角用AI却很虚,所以第一层的核心结论是:
AI可以提升个人效率,但个人效率提升之后,会把团队协作问题暴露出来。
这时候就进入第二层。
第二层:流程适配

团队经过新技术(AI)导入后,已经开始爆发问题了:个人效率很高,团队效率没办法。
但组织也想吃AI的红利啊,所以他们必须思考一个命题:
团队的流程和标准,能不能承接AI带来的效率变化
换句话说,我们应该如何优化流程,以便于能够更好的配合AI?
这里就会开始涉及上下游协作,涉及输入输出标准化,也涉及需求准入、质量评价和验收机制。
说白了,就是要重新定义:
什么样的需求可以进入开发?
什么样的文档算合格?
什么样的代码可以验收?
什么样的测试算完成?
这个阶段最大的卡点是:上下游没有共同的输入输出标准。
在之前,产品、开发、测试各有一套标准,并且他们的标准往往不能统一,之所以能工作,多半是下游在补位上游。
只不过,AI出现在任务链条中后,问题开始变得不可避免,也就是:之前靠扯皮、妥协可以正常工作的系统玩不了了,因为:
AI不会补位,他只认上下文...
这里有些同学可能不理解问题到底在哪,我赘述一句:AI虽然让输出变快了,但并没有让输出变得更容易被消费。
这是什么意思呢?意思是:产品花费之前1/10时间,糊弄出来的需求文档,程序员读不懂,AI也读不懂;技术快速代码生成的界面,测试已经需要每个按钮点一次才算通过...
所以这个阶段要做的事情,就是SOP优化、输入输出标准重建。在我们过往实践中,真实可操作的策略是,双方往彼此靠:
产品往下走一点,不只是写需求文档,而是直接输出更可交互的原型;
开发往上走一点,不只是等需求,而是主动补全业务理解和技术实现方案;
这里大家也要看明白,这也是为什么产品、技术、测试正在走向融合的原因
只不过,明眼人这里也看出问题了,这套策略其实对每个人的能力要求更高了,要求他们更加多面手了,但并不是所有的岗位都可以走向融合,所以他不可避免会导致下一层的问题:
流程顺了,不等于组织顺了
什么意思呢?意思是部门内部的流程通了,跨部门流程还是不通。
产研内部可以优化得很好,但一个真实项目从开始到结束,不只产研这一个环节,他会涉及销售、售前、产品、开发、测试、交付、运维、客服、财务、法务、客户成功等多个角色。
产研流程再顺,在整个业务流程里也可能只占一部分,编码速度再快,在整个交付链路里也只是一部分,甚至只是一小部分,在这里大家会更加能感受到,什么叫:
代码变快了,交付没有变快
因为每个角色在传递过程中,都要同步上下文、协调资源、解释边界、处理非标问题,而这些角色是真的不好再想产研体系那样做补位和融合了...
于是依旧会有很多一事一议,也依旧会有很多扯皮,而这些损耗的大头,已经跟AI没有太大关系了。所以第二层的核心结论是:
AI可以推动流程标准化,但流程标准化之后,会把组织协作问题暴露出来
第三层:组织适配

到了第三层,问题就不再是流程,而是组织。
因为前面说的部门墙(责任边界、资源调度、评价体系)会把效率吃掉,所以这个阶段的核心需求是:组织内部交互整体最优。
这里要特别说一嘴,很多人对部门墙的理解比较简单,以为部门墙就是大家不配合,是态度问题。
其实,部门墙不是态度问题,而是组织结构允许的结果,如图所述:

每个部门负责人都会基于自己的责任,选择对自己最有利的目标解释方式。
每个部门都会说自己是为公司好。
每个部门都会觉得自己已经很配合了。
换个说法:这东西从设计上就是个追求局部最优的系统。但因为是追求局部最优,那问题就来了:
每个部门都在优化自己的接口,希望其他部分按照我的规则来走,但显然这不一定能优化整体效率
而,这就是组织复杂度
并且,这是不可调和的,部门和部门之间,部门和老板之间,天然都有目标、资源、责任和风险上的冲突。
这种情况下,你很难单纯要求其他部门应该怎么做。所以组织适配阶段,真正要解决的不是让大家更配合,而是重新设计责任边界和目标解释权。
在过往实践中,有两个策略是比较好用的:
第一类是柔性的,靠利益交换、靠刷脸去追求局部协作。说白了,就是你不要只想着别人应该做什么,而是要让别人愿意跟你一起做。
第二类是强硬的,靠组织调整、岗位合并、部门接管,直接拿到目标解释权,打破常规协作方式。
但组织架构调整也不是万能解,它只是把成本前置了,因为公司之所以拆成不同部门,本身就是一种信息压缩方式。意思是:
业务复杂的评价成本、技术壁垒的判断成本依旧在那里,所以谁去负责或者买单呢?
举个例子:你将技术团队合并给销售团队,虽然可以解决技术不懂业务的问题,但依旧不能解决技术问题复杂的问题,甚至整体迭代速度还可能更慢!
且不论过程中还会涉及到外行指导内行、员工成长、价值观冲突等问题。
所以第三层的核心结论是:
AI可以推动组织重构,但组织重构之后,会把专业评价问题暴露出来
谁该为复杂的业态、高壁垒的专业最终负责,是这个阶段遗留的问题
第四层:评价权重构
所以,第四层关注的不是组织要不要合并,而是应该解决合并后带来的组织复杂度:谁来评价、能不能评价的问题。
举个例子,就只是说AI原生这个事情,问题都会变得很残酷了,因为就我真实的企业AI咨询实操来说:
不是所有公司都需要快速智能化。
不是所有业务都值得重构组织。
不是所有流程都值得做Agent。
不是所有AI转型都是正收益。
很多时候,过早转型其实是负优化,但是谁应该去对这些结果负责?
所以,这里的问题是:谁应该去评价这一切,谁又有能力去评价这一切,更进一步:如何将AI完整的嵌入公司的业务流程评价和管理流程评价体系之中。
要注意,这个评价问题会比之前的所有问题更加棘手,因为他之前没有出现过,也没有可以抄的答案。
并且,现阶段AI真的在补足每个员工各种能力,岗位合并、部门融合似乎已经成了一个趋势。
比如我们前面说的产品要更懂技术,技术要更懂业务,交付要更懂客户,售前要更懂方案,大家不要以为他是天方夜谭,因为这个岗位已经被挂出来了,他的名字叫FDE。
FDE表面上是一个跨域交付岗位,本质上是AI进入业务流程后,评价权前移所产生的组织接口人:

所以第四层的核心问题是:
AI原生组织必须重新定义评价权
而评价权背后的涵义很丰富,他包括质量标准、验收机制、责任边界等等,如果要进一步打开,就又有四个问题需要回答:
谁定义好坏?
谁负责验收?
谁承担风险?
谁拥有最终解释权?
这个就是AI原生的终极问题:当业务判断、专业判断、客户反馈、AI建议互相冲突的时候,谁说了算?
因为组织结构可以调整,岗位可以合并,流程可以重写,工具可以替换,但评价权不是那么容易转移的。评价权背后是专业壁垒、组织权力、责任归属和风险承担。
至于这个问题的解法,就留给大家思考吧......
四层爬坡:问题递归
总结一下,AI进入组织以后,是一个连续爬坡的过程:
第一层解决个人工具问题,会暴露团队协作问题;
第二层解决流程标准问题,会暴露组织边界问题;
第三层解决组织协作问题,会暴露专业评价问题;
第四层解决评价权专业问题,又会最终暴露商业模式问题;
其实很多人做到第四层就会开始质疑,因为他们会发现:
就算做到了组织适配这一层,就算已经利用AI将效率达到了机制,但公司业务未必会带来什么增长
这里的原因又很简单,个人能控制的是对工具的使用,组织能控制的也只有员工罢了,我们都仅仅能控制自己能控制的那一部分。
除自身以外的商业模式不是你想优化就能优化的,甚至来说:
乙方其实是甲方的补丁
如果甲方本质上就很低效,甲方也不想在这个过程中提效,他本来就是花钱让乙方去干他不想干的事情。
这个时候乙方再拼命提效,意义可能并没有想象中那么大,这里再次进入了更大的圈层循环:你解决了部门墙,但你解决不了公司墙...
这里如果要展开会很复杂,所以我们回归AI原生转型过程中的四层爬坡,大家会发现他居然是个递归问题:上一层的问题解决以后,会把下一层的问题推出来。
但你不能认为这些问题是AI带来的,事实上就我对管理及AI的认知,我会认为:AI暴露的不是AI的问题,而是组织原本就存在的问题。
只是过去这些问题可以被低效率掩盖,但AI进来以后,某些节点突然变快了,旧系统的不均衡就被放大了,所以你想推AI原生,就必须关注到每一层的问题,解决每一层的问题:

组织变革,双向依赖
这一段对于今天的内容也许不是必须,但他却是我在做企业咨询过程中关于组织一号位非常感性的体悟:AI和组织变革之间,其实是双向依赖:

AI要发挥效果,往往需要推动流程变革和组织优化
但一把手如果看清趋势,推动了部门调整、岗位合并、流程重构,又会依赖AI真的能发挥效果
这就是双向依赖
过程中,我见过的每个企业,老板一定是最受伤的那个人:
如果一把手走得太激进,下面的人会觉得老板是不是被自媒体忽悠了;
如果一把手因为一些原因(业务压力、认知限制或者现金流约束),没法调整组织,又会有人觉得公司跟不上AI时代;
总而言之,作为一号位,你只有赢才能堵住他们的嘴,但是多数公司实际去做执行落地的并不是老板,而是CTO或者CIO或者AI项目负责人。
这个时候,就要非常注意AI原生推进的节奏了,主要是要把老板和员工两个角色串起来(欺上瞒下):
一边要把老板的焦虑,转移成组织演进可以成功执行的真金白银;
一边要把一线的真实问题,翻译成老板能理解的要不要继续的判断,也就是一切尽在掌握,员工虽有问题,但最近效率提升明显,大家正在攻克难关;
说得难听点,是两边哄,说得好听点,是和团队一起慢慢把认知、方法、流程、工具、组织和结果串起来!
而这个人的角色画像,大家可以认为是我这样的人,一个带顾问属性的AI专家。
前面根据我三次实践案例,我们为AI原生做了一个定义:机制流程+企业信息通道建设+企业工作流承载平台;
而后我们提出了AI进入组织,要爬四层坡:个人工具适配→流程适配→组织适配→评价权适配。
而现在理论的部分差不多了,似乎还差一个复杂的案例将他们串起来:
第四次:复杂案例说明
下面这个案例,是我之前在电商领域做的一次完整实践:

它完整经历了从个人工具到评价权重构的四层爬坡,而且因为行业的特殊性,每层出了问题,不是效率下降那么简单,而是安全红线、合规风险,总之代价很大的。
PS:这个业务有一定密度,所以会进行部分脱敏处理,大家看不明白的地方可以在后台问问...
这里我们会为大家完整展示一个生产级AI客服是什么样的,并且会告诉大家,技术的部分只占不到50%,要匹配这套AI系统好好的运行,需要各种机制配合:

业务背景
平台有1000个兼职客服,但近期虽然业务量暴涨,单次服务收入却持续下降,兼职客服利润被严重挤压,对应着平台这边用人成本也在增加,于是这边对效率工具提出了新的要求。
只不过传统的基于规则引擎的客服辅助插件已经到了天花板:
意图识别覆盖率只有68%,大量对话需要人工介入;
兼职客服日均处理单量长期徘徊在300-400单,成本降不下来;
于是我们成立专项组,目标当然不是做更好用的工具,而是重构整个客服工作流,让兼职客服一天的接单量翻倍,而整体平台的成本却不用增加太多:

而这里的实现路径也就是上面的四层循环:
第一层:个人工具适配
最初,我们的想法很简单,做老工具改造:给规则引擎接入AI大模型,把那些“木有”、“没啥感觉”、“咋整啊”之类的口语化表达也识别出来。
我们认为有AI的加入,理论上意图识别应该能提到90%以上。
很快做出了第一个版本,结果兼职客服却集体拒绝使用,原因有两个个:
AI太慢,响应时间5秒,慢;
意图识别时有错误,不准;
所以,结论是一个更聪明但更慢的工具,反而降低了熟练客服的效率。
这里就是很多企业在做AI引入会遭遇的实际问题了,以这里的案例来说:
很多人都会以为AI足够聪明就行了,但实际上客服要的是不打断工作流的工具,对他们来说:响应慢5秒,他一天的订单量可能要少100单!
在这一层,我想告诉大家的是:个人工具适配不是技术问题,而是体验和稳定问题,会用工具只是第一步,工具丝滑、不出错才是核心!
如果AI不能无缝融入使用者的日常操作习惯,不能稳定可靠地输出结果,那么他们就一定会吐槽。
第二层:流程适配
被客服拒绝后,我们做了大量工程优化:缓存、异步、模型迭代,把响应压到2秒内,并且准确率也想办法搞上来了。
然后,客服终于开始用了,只不过他们还是在抱怨...
我们跟踪后发现:每个会话,客服都要盯着屏幕点一下“发送”或“确认”。这个等待-确认的动作,把AI提速的红利全吃掉了。
于是我们做了一个关键的流程变更决策:AI客服从辅助工具升级为自动化流程引擎。系统自主运行标准问答流程,只在以下情况才中断流程:
AI置信度低,拿不准用户意图;
触发了业务硬性规则,如敏感词命中;
落入必须人工处理的复杂场景,如投诉升级;
这一轮流程改造,效果很好:日均单量从300跳到了1100。这就是流程适配带来的威力。
第三层:组织适配
流程变了,客服的角色和组织边界也会跟着变。
过去,客服是每个会话的必经节点;现在,系统处理了70%以上的标准会话。
这让一些客服感到不适:我的工作被AI抢了?也有些客服觉得轻松了:终于不用跟那些重复问题耗时间了。
但无论如何,结果是:已经不需要1000个兼职客服了。于是这里需要做两件事:
一是重新定义岗位职责。客服的考核指标从处理单量变成例外处理质量+系统报错贡献。系统自动处理的会话,客服不背锅;但客服发现系统错误并一键报错,计入绩效。
二是建立跨部门的协同机制。技术团队和运营团队不再各干各的,而是每周一次联合复盘:哪些报错是模型问题?哪些是规则缺失?哪些是知识库没覆盖?
这就是组织适配:重新设计责任边界和目标解释权。
第四层:评价权重构
到了这一层,问题才真正触及根本:系统自动发出的回复,质量怎么评价?谁来定义“好”?
我们这里建立了一套数据驱动的闭环评价体系:
一键报错:客服在处理人工会话时,如果发现系统之前的判断有误,可以一键报错,附带原因分类。
数据回扫:定期导出历史会话,用最新的规则引擎重新跑批,找出潜在问题。
质检闭环:运营团队对报错和回扫发现的问题进行复核,确认后纳入规则库或模型训练集。
最终,一套数据飞轮系统产生了...
这里的点是:所有的AI项目都有一套围绕着他的“Harness”,这套工程机制流程存在的价值就是保证AI项目稳定的运行,所以并不是Agent才需要Harness,所有的AI项目或者线上项目都需要!
结语
文章篇幅不小了,就不总结了,希望对大家有用吧...
