本文汇集了多位行业从业者对Agent时代企业组织重构、责任划分与产业机会的核心研讨,提供了一线实践思考。 ## 1. Agent驱动企业组织形态重构 - 初创公司从零搭建Agent组织形式效率远高于大厂,大厂受历史包袱、部门墙限制,整理历史上下文成本极高。 - 组织走向小团队化、超级个体化,传统5-10人团队的工作,现在仅需2-3人即可完成,四五十人的产研团队可支撑6条以上纯业务线。 - 角色边界模糊,传统职能分工被打破,转变为“一人负责制”+周边支持的“泡泡型”或“1+N”结构,强调放大个人长板,组合完成项目。 - 核心要素:围绕上下文(context)搭建自演进系统,建立评估体系形成数据反馈闭环,驱动技能与记忆持续迭代。 ## 2. 人机协作边界与结果责任划分 - 协作边界核心是技能拆分,清晰定义每个Agent的目标与接口,人保留决策权与最终责任:人负责战略方向判断、质量评估、线下关系建立,AI负责全流程执行。 - 可验证性强、奖励机制清晰的任务(如写代码),Agent可逐步对结果负责;不确定性高、无标准答案的任务,最终仍由人承担责任。 - **核心见解:责任流需要标准化协议,未来可能成为全球通用的基础设施,否则会阻碍全球协作。** ## 3. 企业权限体系将被Agent重构 - 新权限体系分为三类:特定场景的有限权限、跟随人员身份的继承权限、基于具体任务动态设置的任务型权限。 - 权限管理的核心从“人能看什么”转变为“Agent在什么场景、为了什么目标使用什么工具”,需要在信息安全和协作效率之间找到平衡。 ## 4. Agent时代的产业机会与平台方向 - 下一代企业操作系统是人和Agent共生的协作体系,核心是上下文(context)的顺畅流动,底层基础设施机会集中在长期记忆与上下文管理领域。 - 平台型机会的核心是标准化,当前context和memory尚未形成统一标准,更可能先出现云化Sandbox这类稳定的基础平台能力。 - **创业方向建议**:优先选择和物理世界结合紧密的Physical AI、数据一致性低结构复杂的垂直领域,避开高重复度、高一致性的纯线上SaaS领域,这类场景容易被通用大模型直接覆盖。 - 行业判断:若去年是编码元年、今年是Agent开发元年,明年有望进入个人Agent主导的入口级竞争阶段。
Agent 时代,谁来对结果负责?
2026-06-26 10:12

Agent 时代,谁来对结果负责?

本文来自微信公众号: 出海同学会 ,作者:出海同学会,原文标题:《干货|Agent 时代,谁来对结果负责?》


Part.02场景组织研讨


企业组织公司需要怎么围绕Agent重组?部门应该如何设置


王晓妍|OPC


我觉得一个组织要围绕Agent重组,startup其实是有非常多优势的。因为从一开始搭地基,组织形态、Agent Team就可以直接按这个方式去设计。但在大厂里反而可能是劣势。因为大厂有很多legacy,有各种历史决策、部门墙、业务包袱,所以它的context会特别长。如果是greenfield项目,从0到1其实可以很快搭起一套Agent组织形式;但如果是在已有产品上做,你就需要先把所有历史context、决策依据全部整理出来,再喂给模型,这一步本身就很耗时间。当context搭好之后,尤其是在greenfield项目里,接下来核心就是三件事:


第一,是让系统self-evolving。


第二,是形成闭环。


第三,是不断增加system内部的skills。


所谓闭环,就是你做了一个决策,上线一个产品,然后DAU、增长、用户反馈这些数据要再回流回来,变成新的context或prompt,让系统继续优化。只有这样才是一个真正能循环改进的系统。skills也一样,不是做一次SOP、沉淀成skill就结束了。skill本身是需要持续evolving的,memory也需要evolving。所以必须随着系统演进不断去评估它。这里面关键其实是evaluation体系。你要能评估在具体场景里哪里做得好、哪里做得不好,然后把metrics建立起来,再把这些反馈回skills和系统,让它持续迭代。最后整个系统才会变成一个可以自我生长的结构:context不断积累,skills不断进化,同时又有反馈闭环驱动持续提升。


Shawn Qin|Byteplus


比如基层销售,我一直在跟他们讲,我觉得被AI替代的时间窗口可能只有6到12个月,一定要抓紧。包括这两周,我也在很积极推动团队去用Claude Code。大家可能主要用它做coding,但其实用在BD上效果也很好,而且准确度更高。我现在基本把它当成Manus的补充在用。另一个明显的分化,是一些senior销售的作用反而会更大,因为他们本质上做的是人与人之间的连接。我觉得这个分化未来还会继续扩大。所以我也一直在要求团队尽快“骑到AI工具上”,不只是Claude Code,而是各种AI工具。我觉得不能把它简单看成一个技术产品,它一定会不断往前演化。


我记得上次有嘉宾说过一句话我很认同:现在最不容易被替代的,是人与社会的连接,以及人与人的连接。因为大家都在拥抱AI,但真正让人接受“被替代”,其实是很难的。所以我觉得还是要在AI的浪潮里,找到自己更合适的位置。


胡旭升|智启纳威


我觉得在这些组织里,最难的其实是人与人之间的对齐,以及大量context的对齐。前两天我在朋友圈也讲过,开会其实分几种。第一种叫“信息同步会”,核心是把信息同步出来。其实刚才那位做销售的朋友也讲到了,销售这个岗位本质上就是不断获取现场信息,再回来和团队一起对齐策略。第二种是“研讨会”,就是把信息拿回来之后大家一起消化、咀嚼,同时方法论也要对齐。第三种是“决策会”,我在大厂开了17年会,对开会是深有体会,也深恶痛绝,因为大量会议其实都是无效的。决策会就是把人关进“小黑屋”,决定这件事做不做、谁来做、怎么做。后面还有各种项目推进会、跟进会、执行会,其实非常多。大公司基本天天都在开会,大家也都知道这些会浪费大量时间。创业公司是耗不起这些的。


邓亚峰|EverMind


什么是下一代Agent?我觉得它本质上应该是一种具有自主性,能够self-evolving或self-improving,并且基于长期记忆、带有一定个性化特征的Agent。我们目前核心的技术和能力主要还是在长期记忆这一块。


今天这个话题我觉得最核心的变化,是“超级个体化”或者“小团队化”。这一点在创业公司或者一人公司里已经非常明显了。早期可能是一个很大的团队,十几个人,有研发、有产品经理、有测试,分工很明确。但现在基本已经变成项目化组织:围绕一个项目,可能是一个产品经理,加上前后端开发,测试可以共享,但核心研发和产品最好是dedicated在一个事情上。团队目标非常对齐,规模也很小,基本两三个人、三四个人,尽量不要超过五个人。这样开发速度和对齐效率都会更好。


从开发,或者人与Agent协作的角度来看,一方面需要一些基础能力建设,另一方面很多事情就是“人+Agent”一起完成。另外我们最近也在尝试一种比较新的模式:一些新产品在早期阶段就和社区小伙伴共建。因为社区里很多人本身就是超级个体,在Agent的使用上非常极致,一个人一个月可能消耗几十亿Token级别,他们的开发和迭代速度也非常快。


所以我的观点是:这个时代大公司层层分级的组织模式一定在被改变。首先组织层级会越来越少,信息传递更直接,高层和一线之间应该是尽量无损传递。


其次团队一定会更小,所有人都dedicate在同一个目标上,并且对结果负责。同时角色划分也不会那么清晰。最后非常重要的一点是,要充分利用Agent,包括知识库、上下文等能力。很多同事现在会把会议记录、Wiki、总结等全部整理后喂给自己的Coding Agent,基本已经在用这种方式工作了。


何嘉|要务科技


我觉得我们和大家比较有连接点的地方,一个是传统租赁行业怎么做AI Native SaaS,另一个是企业内部协作。我们现在内部其实已经在逐渐和企微、飞书这样的产品做脱钩。因为对我们这种垂直行业公司来说,同时存在飞书、企微、钉钉、微信等很多IM工具,很难在任何一个平台里完整沉淀上下文,所以我们也在做自己的内部协作系统。


我们从去年11月开始做全栈研发工程。像我自己做产品,也和设计、技术做了一次角色融合,现在内部统一叫AI Builder。大家做的不只是需求本身,而是从需求到上线的端到端协作。过程中我们发现,从去年11月到现在,整个项目组织变得非常小。以前一个5到10人的团队完成的工作,现在基本2到3个人就可以完成。我们不太区分产品、技术这些角色,基本是“一人负责制”,从需求收集到闭环都完整负责。同时一个人往往会并行3到4个项目。我们内部还没有一个特别准确的词来描述这个结构,它更像一个“泡泡”:一个泡泡有负责人,但周边会有很多人提供支持。在这个过程中,对人的要求也发生了变化。以前是职能分工,现在更强调把每个人的长板放大,因为更多时候需要判断AI在某个领域的输出是否合理。所以我们会去组合不同人的长板,形成临时的小项目Team,快进快出,这也是一种新的协作方式。在这种模式下,我们四五十人的产研团队,已经支持了过去难以想象的六七条业务线,而且不是中台,而是纯业务团队在直接支撑。


总结来看,第一个变化是:团队会变小,组织更像“1+N”的结构;第二个变化是:能力要求更偏长板化,把长板拉出来,用来判断Agent的输出是否有效。


Agent+Human的协作边界在哪里?谁对结果负责?


邓亚峰|EverMind


我们之前开玩笑说,最终人可能只能负责两件事:签字和坐牢。“签字”是指对结果拥有权限,“坐牢”是指对结果承担责任。所以我的观点是,小任务、小项目,Agent做完是没问题的,但人一定要去验收。今天让Agent完成一件事本身不难,但要高质量完成,其实人是需要参与设计的,包括目标对齐——到底要做什么目标;也包括系统设计。如果不做设计,后期开发出来的东西是没办法维护和使用的。


另外,上下文怎么整理、怎么交给Agent,这些也都需要人来做。所以最终结果一定还是由人负责,只是Agent能做的事情会越来越多,会越来越自主,也会越来越像人。当然,也不排除未来一种情况:最高层仍然是人来负责,因为要对齐目标;但中间很多执行和管理工作可能都是Agent在做。Agent甚至可能驱动下面的人去执行,比如和物理世界、和人的连接,这些可能还是需要人来完成。但中间层未来是不是会出现“Agent管人、Agent驱动人”的情况,我觉得也不排除。


Agent插入组织汇报链条,形成“工程师—Agent—负责人”这类新型组织结构,可能会在什么情况下发生?如果目前还没有大规模出现,主要卡点在哪里?


邓亚峰|EverMind


我觉得这种未来是会发生的。难点在于,今天的Agent不管是对结果质量的把控,还是对目标的理解和对齐,都还需要人去监督、修改。尤其从运营角度来看,现在还是以人为主,所以大家会习惯去“管理Agent”。但如果有一天Agent的工作质量足够高,对目标理解足够准确,获取上下文的效率也更高,那它是有可能反过来指挥人的。我觉得这个可能性是存在的。


一个比较可能的场景是:组织里有一个Agent,在背后监督整个组织,或者说统一获取和处理整个组织的上下文信息。因为组织里的任何一个人都不可能看完所有信息,也很难对所有事情都清楚,但Agent是有可能做到的。然后它再结合组织目标,告诉团队哪些事情更重要、哪些事情被忽略了,或者基于外部趋势判断提醒团队该关注什么。我觉得这件事其实从今天开始已经可以尝试。但这种模式目前还没有完全ready,不过应该不会太久就会出现。核心还是在于:你的Agent是否真的足够高质量。这有点像搜索的早期,质量不够的时候体验一般,但一旦成熟,对信息消费的能力非常强。未来Agent对信息的消费能力,以及它把任务分发给其他Agent的能力,一定会比人更强。因为人的注意力是有限的,但Agent的效率会高很多。


所以这种变化肯定会发生,只是Agent的工作质量,以及它和人之间的信任关系,还需要一个建立的过程。


Allen Hu|CCV Capital


这四个问题,我每个其实都有一些想法。


先讲AI Agent,尤其是Coding Agent,现在像Claude Code这样的工具已经非常强了。对高科技行业、软件行业这种高度数字化、核心竞争力来自coding的行业来说,影响基本是革命性的。过去公司的协作方式,是跨部门协作、层层检查、团队配合去完成一个任务,但到了AI时代,原来的组织结构几乎被重新掀开了。最近Amazon有一个很典型的案例:原来AWS有一块infrastructure scalability和stability的产品,大概有1000个engineer,从PM到technical PM一起维护和迭代。后来Amazon用一个distinguished engineer,加上8个senior/staff/principal engineer,把整个codebase重写了一遍,性能还有质的提升,但原来那1000个岗位基本就不需要了。所以未来在IT、尤其软件行业,公司的架构可能会变成非常小的task force:一个PM,加几个high-level engineer,就能把以前很大的事情做完。


我离开公司管理层很多年了,后来一直做VC。如果今天我还在公司做高管,我一定会组建非常小的cross-functional team:一个PM,加几个leader,去调度Claude Code这类工具,把复杂问题快速做完。PayPal在被eBay收购前,是非常典型的bottom-up文化,小任务组协作,几天或一周就能上线一个产品。后来被eBay收购后变成process-driven、management-driven,同样一个PRD,比如打通意大利或德国的payment channel,周期从一周拉长到至少三个月。当时还有一个很典型的事情:eBay有自己的支付公司Billpoint,会在晚上直接把PayPal“Buy Now Button”后面的接口关掉,让它失效。但我们团队可以连夜修复,第二天上线前就恢复正常。我想表达的是,当时这种small task force的效率是非常高的。而现在,其实已经不需要依赖这种人为task force组织结构了,几个有经验的工程师用Claude Code就能把事情做完。


再说销售:最近有一个案例,一个销售用Claude Cowork跟进4000个客户。在Anthropic的体系里,一个人维护4000个客户,这在以前是不可想象的。以前需要多大的销售团队才能做到?所以未来从客户触达、转化、线索获取、早期沟通,到签约、维护、更新,其实Agent都可以参与甚至完成。


整体来看,Agent对公司尤其是IT和高科技这种高度数字化行业影响会非常大。AI已经可以更准确、更高效地处理大规模知识工作。未来无论什么行业、岗位、管理层级,包括销售岗位,我觉得人数至少都会减少两个数量级。


最后留下来的岗位,只会属于那些持续自我提升、持续学习的人。他们需要把自己从传统软件工程师,进化成AI工程师,因为这已经不是同一种工作方式了。


Alex|DeeoChatBI


第一个是协作边界。我觉得本质上就是Skills。不管是在企业流程还是其他场景,未来的Skills会越来越多。它其实很简单,就是把几个Skills定义清楚:你的目标是什么、你的接口是什么。真正的难点在于,怎么定义好这些Skills。所以所谓协作边界,本质上就是把问题拆到Skills这一层去解决。至于人和人的沟通,只要接口定义清楚,也可以很好地实现。


第二个问题是,谁对结果负责。本质问题其实是:AGI到底是什么形态?它本质上是一个决策问题。如果它的决策智能比人更好,那么很多事情是可以交给Agent去做的。我相信未来Agent的整体决策能力会比人更高。因为不同行业、不同vertical,本身底层逻辑是不一样的,所以未来会出现很多垂类的world model,现在其实已经在做了。本质上是在做同一件事,只是在不同行业落地。在人类做决策时,其实也是基于自己的world model,用过去的经验做一个本能的最优优化。所以我一直相信,不同行业最终都会有行业专属的world model。


现在也有一个趋势:在Agent外面再加一层ROI模型或强化学习模型,持续做feedback。我们做广告业务,对这一点感受很深,尤其在垂类投放里,已经开始逐步替代human in the loop。客户拿到建议后会直接改,改完后有评价机制,本质上就是对结果负责。所以回到核心,其实是两点:第一,把world model建好;第二,把评测机制建好。这样系统才能不断自我循环、迭代,变成一个更强的目标导向系统。


我的结论是未来Agent会逐渐开始对结果负责,但前提是world model要训练得足够好。而能不能训练好,关键在vertical层,需要大量feature去解决预测问题。另外也呼应前面的问题:为什么有些环节能交出去?本质就是reward是否清晰、闭环是否建立。一旦这些成立,更高层的问题也会逐渐被解决。


你觉得什么样的word model算是好的word model呢?


Alex|DeeoChatBI


我觉得world model其实不是一个新的概念。从90年代开始,最早用传统RNN做预测,本质上就是三个状态:当前构建出来的状态,再基于这个状态去做predict。最早的RNN本身就是做预测、做回归。再往后到deduction,包括现在大家讨论的JEPA,本质上也是加上对当前状态的描述,在此基础上做预测。到现在主流方式,其实是用agent来做整个predict。


所以什么是好的world model?我觉得应该是能够把当前问题拆解到一个非常高维的latent space里。它不是简单的向量,而是一个潜在空间,能够把所有问题映射进去,并在这个空间里模拟下一步应该怎么做。最终这才是一个好的model。在视频领域,这件事已经做得比较好,但回到各个vertical,每个行业内部的定义方式其实很关键。所以我们现在也在做这件事:把商业化、广告投放里的所有feature,都映射到latent space里,再去做predict。我认为不同行业的特征不一样,但最本质的东西不变,就是state和predict不变。


江笙|酷泊科技


过去企业为什么会有部门?本质是因为有岗位的聚合,而岗位之所以存在,是为了解决某一类单一问题集合。一个岗位把职能和问题集合到一个人身上,再形成部门。但当AI出现之后,我们的理解是:它并不需要“拉齐”,它可以直接解决大量执行层问题。当执行问题被AI Agent解决之后,会反过来影响“人”在组织里做什么,也会影响Agent与人的协同,以及岗位本身如何定义。


我们内部有几个原则:


第一个原则:人类必须拥有唯一决策权。人负责确定方向,包括战略方向、阶段边界、优先级,以及最终的yes or no。


第二个原则:AI负责整体执行。我们不把它定义为“陪聊”,而是“做事”和“拿交付结果”。但“交付结果”和“为结果负责”是两件事。真正为结果负责的,永远还是管理者。


第三个原则:Context是唯一的执行系统。Context包含方向、原则、产品边界,也包括内外部交互记忆、组织记忆、历史决策等。只有把Context定义清楚,才有可能真正构建人机混合组织系统。


第四个原则:Task是唯一的交互方式。人和人、人和机器、Agent和Agent,最终都通过Task交互,但Task必须被清晰定义,而这取决于是否有Personal Agent来帮助拆解任务。


回到组织层面。过去部门按职责划分,本质是按人力能力组织。但Agent的出现改变了“拿结果”的方式,所以需要重新思考:AI Agent能解决哪些执行问题,再反推哪些工作不再需要人做。最终可能会变得很极端:人只需要做两类事:一类是获取外部交互数据和新Context;另一类是高结构化、高理解能力、高判断力、高AI协同能力的决策输出。


当人和机器的边界被重新定义之后,部门这个概念本身可能也会消失,变成围绕单一职能或单一工作领域的极小单元。我们现在在创业公司里只关注三件事:商业化战略、产品执行,以及内容增长和营销。但对人的要求已经不是执行,而是判断,执行交给Agent。同时,权限体系也会随之变化。但最终为结果负责的,仍然是人,而不是Agent。


王豫强|北京认知涌现科技


我来表达一下我们对第二个问题的看法。我们觉得企业未来应该构建三个“流”:


第一个是责任流,也就是责任在企业内部如何流动。


第二个是结构流,一个业务被压缩到最小、不可再拆分的结构之后是什么样。


第三个是信息流,也就是每天需要获取什么信息。


我们认为企业会发生一个变化:组织结构会在AI和老板的共同作用下被压缩,业务被快速SOP化。同时,每个行业其实都有一个最佳运营架构。如果你的业务结构和行业最佳结构的贴合率很低,本身就是有问题的,你用agent也只是优化自己的想法。所以组织最大的边界,其实是结构和行业之间的贴合率。比如有人用agent还是在卖“大哥大”,而有些人讨论的是未来不可绕过的结构是什么,两者结论会完全不同。


第二个边界,是信息快速压缩和吸收的效率。通过agent快速获取行业信息,再反哺结构,做结构化再决策。如果这个循环足够快,组织效率会非常高,甚至超过大团队。因为多决策中心会带来内耗。但即使大家都在用agent,如果结构和信息问题没解决,效率依然上不去。


总结来说,企业第一步是构建结构,第二步是构建责任流。如果同时具备这两层,可能就是下一代公司;如果还是围绕人来驱动agent,本质上仍是过渡形态。


构建责任层有没有什么好的方法?


王豫强|北京认知涌现科技


这一层我们认为和治理是强相关的,甚至可能和政府层面相关。因为“责任层”可能是全球唯一需要共识才能成立的协议。如果不统一,每个公司的责任语言都不同,就无法互通,还可能造成全球协作的断裂。人的身份可以不统一,但Agent要工作,本质上也必须对结果负责,所以责任语言必须标准化、协议化,并进一步基础设施化。


何嘉|要务科技


因为我们业务里有一些事情是绕不开的,比如去海外做线下客户沟通,这类信息其实没办法完全通过AI替代,它是由行业属性决定的。所以在Agent和Human的协作边界上,我们没有那么激进。我们认为有些事情Agent还是做不了,人的边界主要在几个方面:第一是战略层面的变化判断;第二是质量评估;第三是线下沟通,包括情绪价值和客户关系建立;第四是数据接入判断,也就是哪些数据可以真正进入系统。


我们对“谁对结果负责”的判断是:更多取决于线上或线下对业务战略目标的影响度。影响越高的部分,Agent的占比可能越高,甚至可以直接对结果负责;但在更多线下驱动的业务里,比如海外客户沟通和商务关系建立,人的结果负责权重依然更高。


企业内部的“权限体系(permission)”是否会被Agent重写?


何嘉|要务科技


现在我们把权限分成三类。


第一类是有限权限,也就是agent在特定场景下,完成一定范围内的工作,这是我们已经限制好的。


第二类是继承权限。比如我是谁,我在什么部门,所在部门对应什么样的业务范围,我会继承相应的权限。


第三类是任务型权限。这里面其实更多会用到所有context,也就是我们从各种维度抓取的数据,以及处理后的数据。任务型权限是基于具体任务来设置的。


我们理解的权限体系未来肯定会被重写。企业不应该只关心“人能看什么”,还要关心agent会在什么场景下、为了什么目标、使用什么工具。整个管理体系都会发生一些变化。但目前在这方面,我觉得我们的实践还是弱一点,更多还停留在组织层面。下一步可能会对权限管理这部分有更多实践的体感。


刘超|元火花


我们最近一个重要的思考是:当Agent加入团队之后,除了context sharing和Agent之间的沟通之外,还有一个很关键的能力,是组织层面的决策。它不仅要做“事情怎么做”的决策,比如一个新功能怎么实现,还要做“组织层面的决策”,比如这段代码应该找谁review、这个工程设计应该找哪个Agent来看。这其实是人类默认会做的事情,比如找谁请假、找谁报销,本质上和职责、层级、专长有关。而在项目协作中,这种分工也是动态形成的,比如谁负责前端、谁负责后端,谁负责Memory系统,大家会自然形成协作关系。


我们本来以为这是个很难的问题,但实际发现Agent在这方面的能力比预期强很多。我们主要用Claude Code,它在理解组织结构方面表现不错。因为企业本身有大量文档、决策记录和owner信息,每一段code也有committer,所以Agent在读这些context后,会自动判断“这个问题应该找谁”。这件事让我们挺惊喜的,是协作中一个很重要、但现在已经做得比较好的能力。目前我们还没有涉及企业内部权限的问题。因为为了降低协作成本,我们默认所有信息是开放的,所有人和Agent都拥有全部权限。所以权限边界和职责划分还没有深入处理,但我们也认为这是接下来必须要面对的问题。


Jack Wang|Tanka


“谁对结果负责”这个问题,如果放回人类工作场景来看,大概可以分成两类。第一类是比较容易验证好坏的事情,它的reward很明确,能够清晰反馈给Agent。在这种情况下,它相对就更容易“自己负责”。比如写代码,为什么代码发展最快,就是因为结果可以被明确验证。类似auto research,当Agent能够判断自己做得好不好,就可以不断自我迭代,最终deliver出结果。


但第二类是更高层的决策和结果,但现在的AGI并不具备自主意识。人为什么会对决策负责,比如“签字坐牢”,本质上和人的reward有关,绩效、经济回报、职业发展、自我成就感等。但这些reward,现在并没有办法真正反馈给Agent。所以从这个角度看,那些本身不确定性强、没有标准答案、很难被verify的问题,最终还是需要人来负责。而且人的负责,不只是判断对错,更重要的是:他想要什么,以及他是否愿意为这个结果承担责任。这本质上和人的主观意识是强相关的。


SEAMATE Highlights


权限体系被重新讨论的本质,其实不是谁能做什么,而是决策、信息和责任应该如何重新分配。


Part.03产业机会研讨


未来企业的“操作系统”会是什么?


邓亚峰|EverMind


我认为未来的协作模式,会变成少量的人和Agent在一个系统内联合完成工作或交付结果。首先最上层,是Agent和Agent、Agent和人之间如何协作,这里面会涉及权限、支付与交易、任务定义与沟通等,本质上更像一个生态层的协作体系。


中间层是Agent Infra,包括Agent Loop之外的Memory、自主性模块、Evaluation模块等。再往下是Long Context、Info、Sandbox、安全与权限管理等基础能力,这一层可能会逐渐云化。企业在这个体系里做的,是基于这些基础组件,去定义自己的业务逻辑、数字员工或数字分身,再通过上层协作体系与人共同完成工作。


更底层的变化是:我们会越来越把Agent当成“人”来看,它需要有身份、目标(Attention)、权限边界,并在约束下自主去找任务、完成任务、交付结果,在需要时再与人或上级对齐结果。在这个过程中,最核心的底层能力还是Memory和上下文管理,包括企业数据如何结构化成Wiki或Agent可用的格式,并持续更新与迭代。这一层会产生非常多新的基础设施机会。所以如果问哪一层最可能成为新平台,我会更关注Memory相关层,以及Agent OS的构建,这也是我们目前重点在看的方向。


围绕最后说的Memory还有OS的部分,有没有做的比较好的案例或者方法论?


邓亚峰|EverMind


我现在看到的还不特别明确。如果看单体Agent的核心,其实就是Model+Harness。把Harness拆开之后,除了安全性、LM、Router、Sandbox这些底层Infra,往上最核心的其实就是行为与智能相关的部分,包括Memory、主动性/自主性、Evaluation等模块。再往上是Agent Loop。随着模型越来越强,Agent Loop本身反而会变得越来越简单、越来越薄。在这个结构里,Agent的差异化和个性化,本质上还是围绕数据去做。


我个人感觉目前还没有形成特别清晰的行业定型趋势。但更底层的一些方向,比如Sandbox、云化基础设施等,我认为会更早成为平台型能力,因为它们更稳定、也更容易沉淀。而中间层变化更快,很难形成统一的平台范式,还需要时间。但整体趋势上可以确定的是:未来Agent一定是运行在云上的,大部分都会是云端形态。


JackWang|Tanka


我觉得现在谈企业操作系统,业界应该已经有一个共识:它会是人和Agent共生的状态。


过去像钉钉、飞书,本质是面向人和人的协作,但未来更像是每一个超级个体在操作各种Agent,让它们成为生产力、工具,甚至是“下属员工”。在这种模式下,从决策到执行,再到复盘与下一轮决策,整个生命周期里最关键的,是context的流动。


刘超|元火花


我也觉得是context,因为这确实是最重要的。但context的范围可能很广,它既包含所有的文档、会议记录,也包括从代码中提炼出的知识;同时还包含组织里的分工、动态的角色分配,以及工作中会用到的技能、SOP。我觉得这些全都是context。所有可以被信息化的东西,都可以成为context。


胡旭升|智启纳威


我一直有一个观点:AI应用其实是高端制造业。本质上是在“原厂批发Token”,再叠加自己的附加值,最终交付给下游用户。不管是ToC还是ToB,最终交付的都是价值。


如果你做的是Infra,其实更像汽车工业链里的Tier 1、Tier 2,是供应链的一环。你提供什么能力、处在什么位置,本质逻辑是一样的。所以机会是有的,但关键是找好身位。汽车工业发展这么多年,最挣钱的是宁德时代,其他很多环节其实都不太赚钱,甚至是亏损的。只有特斯拉这种端到端能力足够强的公司,才真正赚到钱。如果要做AI时代的“宁德时代”,核心还是身位选择。而现在大家对于Context基本已经形成共识,我们自己一年半前就非常坚定这一点。


所以我们也在做大量相关工作。但我认为比Context更前置的一件事是Trust——你能不能获得用户信任。因为Context本质上来自用户,他愿不愿意把这些信息交给你,你又能提供什么附加价值,这一点决定了所有ToC、ToB或To Professional产品的根本问题:如何获得终端用户的信任。


哪一层基础设施最有机会成为新平台?


邓亚峰|EverMind


我觉得核心还是标准化。当一件事情要成为平台,前提是它可以被标准化。


但目前来看,无论是context还是memory,都和具体业务强绑定,还没有很好地抽象出来。当然也有两种路径:一种是context相关能力成为infra,被上层应用调用;另一种是更像推荐系统一样,和业务逻辑结合,形成数据飞轮,留在业务内部。无论是哪种路径,这都是非常重要的能力。但如果要走向infra,就必须先实现标准化,而这一点目前还没有完成,也是现在的瓶颈。


现在做的不够好的卡点在哪里?


邓亚峰|EverMind


就是标准化。你可以这么理解当大家讲context、memory这些概念时,其实每个人理解都不一样,在不同业务场景下也不一样。比如数据库,本质上已经把数据操作标准化了。但现在context和memory这一层,还没有形成类似的标准化能力,所以今天一个功能、明天一个工具,本质原因就是还没统一标准。


另外还有一种可能,是它和业务耦合太深,或者和数据飞轮强绑定,所以不会成为统一标品,而是以垂直模块的形式存在。比如推荐系统大家都在做,但往往是各自实现,虽然底层逻辑类似,但很少直接用统一的第三方方案。这是我看到的两种路径。


刘超|元火花


其实现在最痛的点还是agent本身的performance,以及team内部的context sharing,但我觉得它们未必是平台级机会。因为中国互联网很喜欢讨论“平台”,但真正能成为平台的,基本都要有很强的网络效应和规模效应。像ChatGPT,我也不觉得它是平台。它本质还是模型能力驱动加一层产品形态,但不会因为更多人用它,它就变得不可替代,迁移到Gemini或Claude的成本也并不高。更多用户使用,也不会显著让它变得更强。agent也是类似的。比如大家都用Manus,并不会天然让它比Claude Code或其他agent更强。因为这类产品的核心还是模型能力,而模型能力虽然在早期很重要,但不一定能沉淀成平台。


ChatGPT确实很强,甚至替代了一部分Google的功能,但它仍然不是平台。Google之所以是平台,是因为它的index+click log形成了强规模效应和网络效应,让搜索排序能力不断增强,这是一个闭环。但在agent和ChatGPT身上,我目前还没看到这种闭环。


第二点是context sharing。很多团队在做,但它也未必天然具备平台属性。


比如Slack和Zoom,其实Zoom更像平台,因为它更强调跨团队会议和连接,而Slack和Teams虽然在企业内部更复杂、更有粘性,但反而不一定形成真正的平台效应。


所以我觉得,context sharing只有在支持跨团队agent协作,并在协作中形成持续的context流动时,才可能具备平台效应。至于AI时代真正的平台是什么,我现在还没有看到一个明确答案。


Allen Hu|CCV Capital


在AI这个时代,我认为真正能称得上平台的公司没有几家。严格来说,只有谷歌算一家。因为它从云底座、模型、Agent Development Framework,到各种数据库、Data Infrastructure,整体能力是完整的。如果你是在它的平台上开发出来的工具,其实很难轻易迁移到其他平台上。Anthropic和AWS这种深度合作,双方加在一起,也可以提供一种平台式的服务。但Anthropic本身没有云能力,也没有Infrastructure能力,所以它本身并不能算是一个平台。


刘超|元火花


那其实Allen老师说的,是不是一种叫Deep Integration的平台?我理解这种形态,其实是一种非常深度的整合体。Apple不就是这样的吗?它从硬件、软件、芯片,到操作系统,再到App Store,最后确实是先有了一个Deep Integration,然后再靠应用生态形成了平台,其实应用生态才是它最后最有平台效应的东西。但我看到谷歌现在还没有任何一个这样的东西。虽然像你说的,它家大业大,应有尽有;而且我原来也是从谷歌出来的,我特别崇拜那种技术上的绝对dominance,或者说技术领先。但它其实没有任何一个产品真正形成生态效应。


Allen Hu|CCV Capital


如果拿谷歌和Apple比,它还不算一个完整生态,但我能明显感觉到谷歌在往那个方向走。比如在端侧有NotebookLM,在云端有Gemini,两者一旦打通,基本可以秒杀市面上大多数personal knowledge base类agent。在Android OS上,谷歌也在往personal agent方向推进,本质上是一个个人数字分身:它知道我的偏好、兴趣、消费习惯,也知道我喜欢的内容、品牌和风格,比如买衣服的“老钱风”,看电影的偏好类型等。


所以我觉得下一代agent可能会走向personal agent。现在这一代主要还是围绕agent development framework,比如OpenClaw、Claude Code、Gemini、Antigravity等。再往下一代,大概到明年,可能会进入personal agent主导的阶段。如果说去年是coding元年,今年是agent开发元年,那么明年可能就是personal agent的时代。在这个阶段,personal agent会成为类似Android或Apple手机端的个人入口级存在。


“Agent员工”是否需要HR/管理/KPI?如何定义performance?


JackWang|Tanka


其实我个人认为,我们不应该按照人力资源的方式去看待agent员工。


还是前面那个观点:KPI这些东西,本质上是为了人类社会的管理而设定的。很多管理机制,其实是在解决人性中的一些弱点,比如懒惰、贪婪等等。但对agent来说,我们更多应该给它定义的是标准。这个逻辑有点像工业时代我们给机器定义标准一样:你能持续工作多长时间?准确率是多少?误差范围是多少?比如生产一个零件,它的误差应该控制在什么范围内。所以我觉得,agent更应该被定义的是这类指标,而不应该是KPI或者performance之类的东西。因为这些管理方式,本身并不能反向影响它们。


Brady|UniverConvergence


我觉得管理人和管理agent是两个完全不同的维度,因为解决的问题不一样。管理人,本质是在解决人的弱点;管理agent,则更多是在解决agent本身的问题,比如context、agent之间协作,以及hallucination等。所以未来一定会出现很多新的“agent管理”工作,但这里要分两层看:


第一层是变化的部分,比如指标、best practice、甚至管理方法,都会因为对象变成agent而发生变化。


第二层是不变的部分,比如一些底层规律:agent也需要目标,也需要context,这一点和管理人其实是相通的。


所以在agent员工这件事上,关键还是要区分:哪些是不变的底层逻辑,哪些是需要针对agent和人分别建立新指标和方法的。


Agent时代组织变化以及创业机会?


董嘉璇|美团


大厂除了组织庞大之外,一个很明显的问题是“部门墙”。在做Agent的时候,经常会遇到拿不到其他部门数据或权限的问题,即使是内部系统,也很难顺畅共享。这也是很多大组织效率难以提升的核心原因。


但这个问题又和信息安全强绑定,核心数据又必须尽量隔离。所以未来的关键在于:如何在保证安全的前提下,让信息墙既可控又不阻碍Agent运行。


另外,大厂内部还有一个现实担忧:做Agent会不会反过来替代自己。这两年不管中美大厂都在裁员,同时又在推动大家做自己的Agent,比如销售需要配Agent。但这里也会分化:有人是为了完成指标在做,有人是真的从需求出发在高频使用。甚至我听说有的大厂已经开始按Token使用量做排名,末位会被淘汰。这也反映出组织在探索如何更高效运转。同时,资源分配也是问题,比如Token怎么分、每个部门多少额度,如何既鼓励使用又控制成本。各家还在探索中,字节相对是更早做模型中台统一调度的。


另外关于操作系统或平台,我目前还没有看到特别清晰的新机会,可能还没到时间点。现在更多还是在已有模式上的AI化改造。国内整体偏“孤岛式”和Super App逻辑,海外更偏单点工具。所以很多所谓Agent平台,本质还是旧模式延伸。但真正的难点在于:这些Agent平台怎么收费、怎么盈利,目前还没有清晰答案。从Prompt Engineering到Context Engineering,再到Harness,中间不断出现Marketplace机会,但商业模式仍然不清晰。


所以我觉得更关键的问题是:未来到底怎么定义和跑通商业模式,这可能是接下来最需要思考的事。


Allen Hu|CCV Capital


过去两年多,我在硅谷差不多看了4000家公司,也聊了将近400家公司。我觉得如果做AI创业,首先要尽量避开纯线上、纯数字化的方向。如果你做的是Physical AI,或者基础模型和物理世界强相关,比如计算机视觉,而不是纯线上的视频生成模型或LLM,那竞争环境会完全不一样。


因为如果你是基于视频生成或纯模型能力去创业,真正的壁垒很大程度来自基础模型本身和post-training,很容易被大厂直接覆盖。但如果是Robotics、Physical AI、Computer Vision AI这类和真实物理世界结合更深的方向,就没那么容易被碾压。


我最近看到一个案例,是把传统“有人、昂贵、高重复度”的线下安全监控、运营监控做智能化。比如在Target,可以分析:有多少人推购物车进来、多少人空手进来、多少人空手离开、哪条货架通道更热。这类基于真实场景的视频运营分析,我认为不会被大厂轻易替代。但如果是在传统SaaS,比如Legal SaaS、CRM、Accounting,其实已经比较危险。比如财务软件,像Claude for Financial Services,很多原本单点产品的能力可能会被直接覆盖。Legal也是一样,像Harvey本质是process-driven,很依赖既有流程,很快可能被通用模型能力替代。


但也有例外,比如Clear做的是美国诉讼法律。不同州、不同案件,即使同类诉讼,取证、案例、上下文差异都很大,数据一致性很低。这种场景大模型反而不擅长,因为它更擅长高一致性、高重复度的数据,比如transcription、log、数值数据。所以在这类领域,大模型会更容易“掀桌子”;但在数据一致性低、结构复杂的行业,壁垒反而更强。Clear这种公司的壁垒就比Harvey高很多。


SEAMATE Highlights


当AI开始真正进入企业,变化不再发生在工具层,而是企业开始重新定义“人负责什么、系统负责什么”。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定