AI 原生怎么搭建?工具、流程、组织与评价权
2026-06-16 09:15

AI 原生怎么搭建?工具、流程、组织与评价权

本文来自微信公众号: 叶小钗 ,作者:叶小钗,原文标题:《【万字】AI 原生怎么搭建?工具、流程、组织与评价权》


上周六的时候,跟训练营小伙伴进行了一场关于AI原生组织/团队搭建的高质量分享。


这次分享几乎将我三年关于AI项目的认知全部点了一次,我觉得非常有意义于是准备整理成课件,今天先去除敏感、重要的部分整理成文,让大家感受下什么是AI原生:



我认为要聊清楚这个话题,可能需要从我的三次AI原生组织搭建的经历做展开:


第一次:CEO数字分身


两年半之前,我就在回答AI应该如何与团队协作的课题。当时我的解法是:方法论+工具链。


其中的方法论如果完全打开就是一些机制、流程;工具链打开的话是两套东西:


一、AI效能助手,其本质是构建企业信息流,将AI所需上下文沉淀下来;



二、流程引擎,其本质是构建用于承载企业工作流的容器,当时我们是自己实现了一套AI表格;



大家要特别注意这个组合:机制流程+企业信息通道建设+企业工作流承载平台,事实上所有的AI原生组织或者说数字分身平台,最终就是要搭建一套这个系统:



只不过,在两年前这套系统的实践落地是很失败的,原因很简单:没有企业买单,而原因同样简单:认知差距太大,企业和我之间没有共同语言,他们觉得我是疯子...


第二次:企业全案设计


然后就是第二次AI原生实践了,这次运气较好,当时受DeepSeek发布影响,国内多数老板出于极端焦虑当中。


PS:其实这批老板不焦虑就怪了,他们平时也不认真好好学习,遇到技术大的迭代只能抓瞎,真的请我去做咨询也很难认真听,因为AI知识这东西确实不性感,或者他们感兴趣只有提效的那个数字...


因为焦虑,所以之前对CEO数字分身不屑于顾的老板,又将我“请了”过去,要做全业务的AI化处理,并且这次他们是下了很大的决心的!


于是这次与之前就有很大的不同:


之前是团队无认知+无意愿,这次是团队无认知+有意愿


于是在一号位迫切的配合下,我们很快的拿到了结果:



如果你问我做了什么,那么依旧会回归到之前的机制流程+工具链(信息流建设+工作流承载平台建设)逻辑;


而如果你问我为什么会成功,我会说:因为一号位的AI焦虑,所以团队对我们(外部AI专家)的所有要求极其配合。


最后,如果你问我他们现在怎么样,我会告诉你:他们在自运行半年后放弃了整套系统!


至于原因是以下几点:


  1. 他们对AI几无认知,完全是我们强行拔高做出来的,后续业务流程上一些小的改变,都倾向于手动解决,不会/也没能力用AI去解决;


  2. 他们一号位焦虑感过去了,觉得AI有用,但似乎没那么神奇,并且整体机制维护起来太麻烦,下面员工投诉也多,他也就算了;


所以,得之易则失之易,他们很快的成功了,但是因为本来就没有相关的认知,也就很快的“失败”了。


第三次:全链路升级


到这里意愿x认知的四象限图就出来了,不同的现象会产生不同的问题,也有对应的解决策略:



前两次实践,一次死于认知鸿沟,一次败于管理惰性。这迫使我开始反思核心问题:当代码生产速度被AI拉起来后,究竟什么才是阻碍团队级提效的真正瓶颈?


前两次实践,第一次目标团队无认知、无意愿;第二次无认知、有意愿;然后就是第三次,我们做了一次有认知+有意愿的案例,AI基于产研团队的全链路优化:



这次实践的契机出现在今年上半年,两个前置条件:


  1. 各个老板又被小龙虾OpenClaw搞得焦虑的不行;


  2. AI Coding工具已经相对成熟,个人提效的案例层出不穷;


但是现在问题也出现了:个人提效不等于整体提效。


这里的原因是:程序员用AI写代码可能快了三倍,但他的上下游并没有变化,比如需求依旧会反复沟通,并不会加速、下游的测试依旧需要一个个点,整体依旧会卡在那里。


所以,这里的结果是:代码变快了,交付没有。或者说全链路中某个节点/某个人快了,但整体并没有什么变化...


综上,又要回归我们最初的AI原生框架了:机制流程+企业信息通道建设+企业工作流承载平台。


至此,我们几乎可以为AI原生做下一个判断:


很多同学认为AI原生是个工程技术问题,其实我几次实践下来他是个机制协作问题


比如,AI Coding解决的是代码生产效率,但他并不会解决产研协作效率,因为需求歧义、验收扯皮、规范缺失,这些才是真正的瓶颈。


如果想要团队能够整体提效,就需要全链路升级,而在这个场景下就不得不涉及四个方面:流程标准化、需求结构化、知识库建设、Skills沉淀。


因为:AI原生组织,本质上是一场组织变革。


工具链解决的可能只是10%的问题,剩下90%是管理机制的重构,需要重新定义人和AI的工作边界,让AI处理大量重复、结构化的执行,让人聚焦在判断和兜底上:



说完三个案例,接下来正文就可以展开了:


AI进入组织,要爬四层坡


所以,什么是AI原生组织?


其实就是:大模型这个跨时代的技术进入组织后引起的复杂度爬坡罢了。


一开始,AI只是进入工作任务:写文档、写代码、查资料、做方案;


上述都是技术进入的工作,并且他们还仅仅都是围绕在个人做展开,所以他首先很具体,其次很简单。


然后,AI开始进入流程:它改变输入、输出、协作、交付和验收标准;


从这里开始就不仅是工具导入的问题,影响面开始从个人到组织,这里会涉及前面说的机制流程,会引发很多人的不适感,最终体现出来的就是各种管理成本。


再往后,AI会进入组织:它会冲击角色边界、责任边界、资源调度和评价体系;


终于在不断拉扯中,新技术和组织开始真正的融合,组织效率达到了某个平衡点。


最后,AI会倒逼商业模式......


所以AI进入组织:


  1. 最初是单点效率提升;


  2. 其次是组织为匹配个人效率提升最初的机制流程改变;


  3. 最后是稳定后整个评价体系基于新技术的重塑;


这套东西在执行过程中会带来一连串连锁反应:工具使用导致系统内部发生变化,超出了组织正常的消化能力。


这也是为什么很多公司买了AI工具,做了AI培训,搞了AI试点,但最后效果很一般。


因为他们以为自己在解决怎么用AI的问题,实际上真正的问题是:


组织有没有能力消化AI带来的新复杂度


在这个基础之下,我们来讨论四层爬坡:

第一层:个人工具适配



刚开始接触AI的时候,大家都会把AI当成工具来使用,这个阶段的核心需求是:怎么把AI用起来。


实际卡点也很明显:很多人心态上抗拒,不想学也不知道怎么学,很多员工真实的想法是:


我为什么要花额外的时间,去帮公司学习AI?


这句话不好听,但很真实。因为对于团队来说,要达到理想中个人使用AI所达到的效率,很多时候唯一的办法就是:在日常工作基础上,用加班来补全效率差额。


这也解释了为什么很多人用了AI以后,反而更累了。因为AI没有自动让组织变轻,只是让个人承担了更多学习和兜底的成本。


并且这里大家很快就意识到了本质的问题:个人效率不等于团队效率。


一个人用AI写代码快了、写方案快了,生成文档快了,这些当然有价值。但如果他的上下游没有变化,团队整体效率并不会同步提升:


甚至,上游用AI加速内容生产,下游可能更难消化。


这一方面是AI制造出来的新问题;另一方面,是原本就没有处理、只是放在那里的问题,在AI引入的时候被暴露出来了。


比如需求本来就不清楚,过去只是慢慢沟通、慢慢磨;现在AI把需求文档生成得很快,看起来更完整了,但下游会发现:它只是看起来完整,实际上不能用。


于是矛盾就出现了:


  1. 上游觉得自己已经很完整了;


  2. 下游觉得你只是把消化成本转给我了;


  3. 老板觉得AI都用了,效率为什么还没提升?


最终结果是,从个人视角用AI都觉得很爽,但团队视角用AI却很虚,所以第一层的核心结论是:


AI可以提升个人效率,但个人效率提升之后,会把团队协作问题暴露出来。


这时候就进入第二层。

第二层:流程适配



团队经过新技术(AI)导入后,已经开始爆发问题了:个人效率很高,团队效率没办法。


但组织也想吃AI的红利啊,所以他们必须思考一个命题:


团队的流程和标准,能不能承接AI带来的效率变化


换句话说,我们应该如何优化流程,以便于能够更好的配合AI?


这里就会开始涉及上下游协作,涉及输入输出标准化,也涉及需求准入、质量评价和验收机制。


说白了,就是要重新定义:


  1. 什么样的需求可以进入开发?


  2. 什么样的文档算合格?


  3. 什么样的代码可以验收?


  4. 什么样的测试算完成?


这个阶段最大的卡点是:上下游没有共同的输入输出标准。


在之前,产品、开发、测试各有一套标准,并且他们的标准往往不能统一,之所以能工作,多半是下游在补位上游。


只不过,AI出现在任务链条中后,问题开始变得不可避免,也就是:之前靠扯皮、妥协可以正常工作的系统玩不了了,因为:


AI不会补位,他只认上下文...


这里有些同学可能不理解问题到底在哪,我赘述一句:AI虽然让输出变快了,但并没有让输出变得更容易被消费。


这是什么意思呢?意思是:产品花费之前1/10时间,糊弄出来的需求文档,程序员读不懂,AI也读不懂;技术快速代码生成的界面,测试已经需要每个按钮点一次才算通过...


所以这个阶段要做的事情,就是SOP优化、输入输出标准重建。在我们过往实践中,真实可操作的策略是,双方往彼此靠:


  1. 产品往下走一点,不只是写需求文档,而是直接输出更可交互的原型;


  2. 开发往上走一点,不只是等需求,而是主动补全业务理解和技术实现方案;


这里大家也要看明白,这也是为什么产品、技术、测试正在走向融合的原因


只不过,明眼人这里也看出问题了,这套策略其实对每个人的能力要求更高了,要求他们更加多面手了,但并不是所有的岗位都可以走向融合,所以他不可避免会导致下一层的问题:


流程顺了,不等于组织顺了


什么意思呢?意思是部门内部的流程通了,跨部门流程还是不通。


产研内部可以优化得很好,但一个真实项目从开始到结束,不只产研这一个环节,他会涉及销售、售前、产品、开发、测试、交付、运维、客服、财务、法务、客户成功等多个角色。


产研流程再顺,在整个业务流程里也可能只占一部分,编码速度再快,在整个交付链路里也只是一部分,甚至只是一小部分,在这里大家会更加能感受到,什么叫:


代码变快了,交付没有变快


因为每个角色在传递过程中,都要同步上下文、协调资源、解释边界、处理非标问题,而这些角色是真的不好再想产研体系那样做补位和融合了...


于是依旧会有很多一事一议,也依旧会有很多扯皮,而这些损耗的大头,已经跟AI没有太大关系了。所以第二层的核心结论是:


AI可以推动流程标准化,但流程标准化之后,会把组织协作问题暴露出来

第三层:组织适配



到了第三层,问题就不再是流程,而是组织。


因为前面说的部门墙(责任边界、资源调度、评价体系)会把效率吃掉,所以这个阶段的核心需求是:组织内部交互整体最优。


这里要特别说一嘴,很多人对部门墙的理解比较简单,以为部门墙就是大家不配合,是态度问题。


其实,部门墙不是态度问题,而是组织结构允许的结果,如图所述:



每个部门负责人都会基于自己的责任,选择对自己最有利的目标解释方式。


每个部门都会说自己是为公司好。


每个部门都会觉得自己已经很配合了。


换个说法:这东西从设计上就是个追求局部最优的系统。但因为是追求局部最优,那问题就来了:


每个部门都在优化自己的接口,希望其他部分按照我的规则来走,但显然这不一定能优化整体效率


而,这就是组织复杂度


并且,这是不可调和的,部门和部门之间,部门和老板之间,天然都有目标、资源、责任和风险上的冲突。


这种情况下,你很难单纯要求其他部门应该怎么做。所以组织适配阶段,真正要解决的不是让大家更配合,而是重新设计责任边界和目标解释权。


在过往实践中,有两个策略是比较好用的:


第一类是柔性的,靠利益交换、靠刷脸去追求局部协作。说白了,就是你不要只想着别人应该做什么,而是要让别人愿意跟你一起做。


第二类是强硬的,靠组织调整、岗位合并、部门接管,直接拿到目标解释权,打破常规协作方式。


但组织架构调整也不是万能解,它只是把成本前置了,因为公司之所以拆成不同部门,本身就是一种信息压缩方式。意思是:


业务复杂的评价成本、技术壁垒的判断成本依旧在那里,所以谁去负责或者买单呢?


举个例子:你将技术团队合并给销售团队,虽然可以解决技术不懂业务的问题,但依旧不能解决技术问题复杂的问题,甚至整体迭代速度还可能更慢!


且不论过程中还会涉及到外行指导内行、员工成长、价值观冲突等问题。


所以第三层的核心结论是:


AI可以推动组织重构,但组织重构之后,会把专业评价问题暴露出来


谁该为复杂的业态、高壁垒的专业最终负责,是这个阶段遗留的问题


第四层:评价权重构


所以,第四层关注的不是组织要不要合并,而是应该解决合并后带来的组织复杂度:谁来评价、能不能评价的问题。


举个例子,就只是说AI原生这个事情,问题都会变得很残酷了,因为就我真实的企业AI咨询实操来说:


  1. 不是所有公司都需要快速智能化。


  2. 不是所有业务都值得重构组织。


  3. 不是所有流程都值得做Agent。


  4. 不是所有AI转型都是正收益。


很多时候,过早转型其实是负优化,但是谁应该去对这些结果负责?


所以,这里的问题是:谁应该去评价这一切,谁又有能力去评价这一切,更进一步:如何将AI完整的嵌入公司的业务流程评价和管理流程评价体系之中。


要注意,这个评价问题会比之前的所有问题更加棘手,因为他之前没有出现过,也没有可以抄的答案。


并且,现阶段AI真的在补足每个员工各种能力,岗位合并、部门融合似乎已经成了一个趋势。


比如我们前面说的产品要更懂技术,技术要更懂业务,交付要更懂客户,售前要更懂方案,大家不要以为他是天方夜谭,因为这个岗位已经被挂出来了,他的名字叫FDE。


FDE表面上是一个跨域交付岗位,本质上是AI进入业务流程后,评价权前移所产生的组织接口人:



所以第四层的核心问题是:


AI原生组织必须重新定义评价权


而评价权背后的涵义很丰富,他包括质量标准、验收机制、责任边界等等,如果要进一步打开,就又有四个问题需要回答:


  1. 谁定义好坏?


  2. 谁负责验收?


  3. 谁承担风险?


  4. 谁拥有最终解释权?


这个就是AI原生的终极问题:当业务判断、专业判断、客户反馈、AI建议互相冲突的时候,谁说了算?


因为组织结构可以调整,岗位可以合并,流程可以重写,工具可以替换,但评价权不是那么容易转移的。评价权背后是专业壁垒、组织权力、责任归属和风险承担。


至于这个问题的解法,就留给大家思考吧......


四层爬坡:问题递归


总结一下,AI进入组织以后,是一个连续爬坡的过程:


  1. 第一层解决个人工具问题,会暴露团队协作问题;


  2. 第二层解决流程标准问题,会暴露组织边界问题;


  3. 第三层解决组织协作问题,会暴露专业评价问题;


  4. 第四层解决评价权专业问题,又会最终暴露商业模式问题;


其实很多人做到第四层就会开始质疑,因为他们会发现:


就算做到了组织适配这一层,就算已经利用AI将效率达到了机制,但公司业务未必会带来什么增长


这里的原因又很简单,个人能控制的是对工具的使用,组织能控制的也只有员工罢了,我们都仅仅能控制自己能控制的那一部分。


除自身以外的商业模式不是你想优化就能优化的,甚至来说:


乙方其实是甲方的补丁


如果甲方本质上就很低效,甲方也不想在这个过程中提效,他本来就是花钱让乙方去干他不想干的事情。


这个时候乙方再拼命提效,意义可能并没有想象中那么大,这里再次进入了更大的圈层循环:你解决了部门墙,但你解决不了公司墙...


这里如果要展开会很复杂,所以我们回归AI原生转型过程中的四层爬坡,大家会发现他居然是个递归问题:上一层的问题解决以后,会把下一层的问题推出来。


但你不能认为这些问题是AI带来的,事实上就我对管理及AI的认知,我会认为:AI暴露的不是AI的问题,而是组织原本就存在的问题。


只是过去这些问题可以被低效率掩盖,但AI进来以后,某些节点突然变快了,旧系统的不均衡就被放大了,所以你想推AI原生,就必须关注到每一层的问题,解决每一层的问题:



组织变革,双向依赖


这一段对于今天的内容也许不是必须,但他却是我在做企业咨询过程中关于组织一号位非常感性的体悟:AI和组织变革之间,其实是双向依赖:


AI要发挥效果,往往需要推动流程变革和组织优化


但一把手如果看清趋势,推动了部门调整、岗位合并、流程重构,又会依赖AI真的能发挥效果


这就是双向依赖


过程中,我见过的每个企业,老板一定是最受伤的那个人:


  1. 如果一把手走得太激进,下面的人会觉得老板是不是被自媒体忽悠了;


  2. 如果一把手因为一些原因(业务压力、认知限制或者现金流约束),没法调整组织,又会有人觉得公司跟不上AI时代;


总而言之,作为一号位,你只有赢才能堵住他们的嘴,但是多数公司实际去做执行落地的并不是老板,而是CTO或者CIO或者AI项目负责人。


这个时候,就要非常注意AI原生推进的节奏了,主要是要把老板和员工两个角色串起来(欺上瞒下):


  1. 一边要把老板的焦虑,转移成组织演进可以成功执行的真金白银;


  2. 一边要把一线的真实问题,翻译成老板能理解的要不要继续的判断,也就是一切尽在掌握,员工虽有问题,但最近效率提升明显,大家正在攻克难关;


说得难听点,是两边哄,说得好听点,是和团队一起慢慢把认知、方法、流程、工具、组织和结果串起来!


而这个人的角色画像,大家可以认为是我这样的人,一个带顾问属性的AI专家。


前面根据我三次实践案例,我们为AI原生做了一个定义:机制流程+企业信息通道建设+企业工作流承载平台;


而后我们提出了AI进入组织,要爬四层坡:个人工具适配→流程适配→组织适配→评价权适配。


而现在理论的部分差不多了,似乎还差一个复杂的案例将他们串起来:


第四次:复杂案例说明


下面这个案例,是我之前在电商领域做的一次完整实践:



它完整经历了从个人工具到评价权重构的四层爬坡,而且因为行业的特殊性,每层出了问题,不是效率下降那么简单,而是安全红线、合规风险,总之代价很大的。


PS:这个业务有一定密度,所以会进行部分脱敏处理,大家看不明白的地方可以在后台问问...


这里我们会为大家完整展示一个生产级AI客服是什么样的,并且会告诉大家,技术的部分只占不到50%,要匹配这套AI系统好好的运行,需要各种机制配合:


业务背景


平台有1000个兼职客服,但近期虽然业务量暴涨,单次服务收入却持续下降,兼职客服利润被严重挤压,对应着平台这边用人成本也在增加,于是这边对效率工具提出了新的要求。


只不过传统的基于规则引擎的客服辅助插件已经到了天花板:


  1. 意图识别覆盖率只有68%,大量对话需要人工介入;


  2. 兼职客服日均处理单量长期徘徊在300-400单,成本降不下来;


于是我们成立专项组,目标当然不是做更好用的工具,而是重构整个客服工作流,让兼职客服一天的接单量翻倍,而整体平台的成本却不用增加太多:



而这里的实现路径也就是上面的四层循环:


第一层:个人工具适配


最初,我们的想法很简单,做老工具改造:给规则引擎接入AI大模型,把那些“木有”、“没啥感觉”、“咋整啊”之类的口语化表达也识别出来。


我们认为有AI的加入,理论上意图识别应该能提到90%以上。


很快做出了第一个版本,结果兼职客服却集体拒绝使用,原因有两个个:


  1. AI太慢,响应时间5秒,慢;


  2. 意图识别时有错误,不准;


所以,结论是一个更聪明但更慢的工具,反而降低了熟练客服的效率。


这里就是很多企业在做AI引入会遭遇的实际问题了,以这里的案例来说:


很多人都会以为AI足够聪明就行了,但实际上客服要的是不打断工作流的工具,对他们来说:响应慢5秒,他一天的订单量可能要少100单!


在这一层,我想告诉大家的是:个人工具适配不是技术问题,而是体验和稳定问题,会用工具只是第一步,工具丝滑、不出错才是核心!


如果AI不能无缝融入使用者的日常操作习惯,不能稳定可靠地输出结果,那么他们就一定会吐槽。


第二层:流程适配


被客服拒绝后,我们做了大量工程优化:缓存、异步、模型迭代,把响应压到2秒内,并且准确率也想办法搞上来了。


然后,客服终于开始用了,只不过他们还是在抱怨...


我们跟踪后发现:每个会话,客服都要盯着屏幕点一下“发送”或“确认”。这个等待-确认的动作,把AI提速的红利全吃掉了。


于是我们做了一个关键的流程变更决策:AI客服从辅助工具升级为自动化流程引擎。系统自主运行标准问答流程,只在以下情况才中断流程:


  1. AI置信度低,拿不准用户意图;


  2. 触发了业务硬性规则,如敏感词命中;


  3. 落入必须人工处理的复杂场景,如投诉升级;


这一轮流程改造,效果很好:日均单量从300跳到了1100。这就是流程适配带来的威力。


第三层:组织适配


流程变了,客服的角色和组织边界也会跟着变。


过去,客服是每个会话的必经节点;现在,系统处理了70%以上的标准会话。


这让一些客服感到不适:我的工作被AI抢了?也有些客服觉得轻松了:终于不用跟那些重复问题耗时间了。


但无论如何,结果是:已经不需要1000个兼职客服了。于是这里需要做两件事:


一是重新定义岗位职责。客服的考核指标从处理单量变成例外处理质量+系统报错贡献。系统自动处理的会话,客服不背锅;但客服发现系统错误并一键报错,计入绩效。


二是建立跨部门的协同机制。技术团队和运营团队不再各干各的,而是每周一次联合复盘:哪些报错是模型问题?哪些是规则缺失?哪些是知识库没覆盖?


这就是组织适配:重新设计责任边界和目标解释权。


第四层:评价权重构


到了这一层,问题才真正触及根本:系统自动发出的回复,质量怎么评价?谁来定义“好”?


我们这里建立了一套数据驱动的闭环评价体系:


  1. 一键报错:客服在处理人工会话时,如果发现系统之前的判断有误,可以一键报错,附带原因分类。


  2. 数据回扫:定期导出历史会话,用最新的规则引擎重新跑批,找出潜在问题。


  3. 质检闭环:运营团队对报错和回扫发现的问题进行复核,确认后纳入规则库或模型训练集。


最终,一套数据飞轮系统产生了...


这里的点是:所有的AI项目都有一套围绕着他的“Harness”,这套工程机制流程存在的价值就是保证AI项目稳定的运行,所以并不是Agent才需要Harness,所有的AI项目或者线上项目都需要!


结语


文章篇幅不小了,就不总结了,希望对大家有用吧...

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定