本文汇集了多位行业从业者对Agent时代企业组织重构、责任划分与产业机会的核心研讨，提供了一线实践思考。 ## 1. Agent驱动企业组织形态重构 - 初创公司从零搭建Agent组织形式效率远高于大厂，大厂受历史包袱、部门墙限制，整理历史上下文成本极高。 - 组织走向小团队化、超级个体化，传统5-10人团队的工作，现在仅需2-3人即可完成，四五十人的产研团队可支撑6条以上纯业务线。 - 角色边界模糊，传统职能分工被打破，转变为“一人负责制”+周边支持的“泡泡型”或“1+N”结构，强调放大个人长板，组合完成项目。 - 核心要素：围绕上下文（context）搭建自演进系统，建立评估体系形成数据反馈闭环，驱动技能与记忆持续迭代。 ## 2. 人机协作边界与结果责任划分 - 协作边界核心是技能拆分，清晰定义每个Agent的目标与接口，人保留决策权与最终责任：人负责战略方向判断、质量评估、线下关系建立，AI负责全流程执行。 - 可验证性强、奖励机制清晰的任务（如写代码），Agent可逐步对结果负责；不确定性高、无标准答案的任务，最终仍由人承担责任。 - **核心见解：责任流需要标准化协议，未来可能成为全球通用的基础设施，否则会阻碍全球协作。** ## 3. 企业权限体系将被Agent重构 - 新权限体系分为三类：特定场景的有限权限、跟随人员身份的继承权限、基于具体任务动态设置的任务型权限。 - 权限管理的核心从“人能看什么”转变为“Agent在什么场景、为了什么目标使用什么工具”，需要在信息安全和协作效率之间找到平衡。 ## 4. Agent时代的产业机会与平台方向 - 下一代企业操作系统是人和Agent共生的协作体系，核心是上下文（context）的顺畅流动，底层基础设施机会集中在长期记忆与上下文管理领域。 - 平台型机会的核心是标准化，当前context和memory尚未形成统一标准，更可能先出现云化Sandbox这类稳定的基础平台能力。 - **创业方向建议**：优先选择和物理世界结合紧密的Physical AI、数据一致性低结构复杂的垂直领域，避开高重复度、高一致性的纯线上SaaS领域，这类场景容易被通用大模型直接覆盖。 - 行业判断：若去年是编码元年、今年是Agent开发元年，明年有望进入个人Agent主导的入口级竞争阶段。

2026-06-26 10:12

Agent 时代，谁来对结果负责？

出海问答©

速览

本文来自微信公众号：出海同学会，作者：出海同学会，原文标题：《干货｜Agent 时代，谁来对结果负责？》

Part.02场景组织研讨

企业组织公司需要怎么围绕Agent重组？部门应该如何设置

王晓妍｜OPC

我觉得一个组织要围绕Agent重组，startup其实是有非常多优势的。因为从一开始搭地基，组织形态、Agent Team就可以直接按这个方式去设计。但在大厂里反而可能是劣势。因为大厂有很多legacy，有各种历史决策、部门墙、业务包袱，所以它的context会特别长。如果是greenfield项目，从0到1其实可以很快搭起一套Agent组织形式；但如果是在已有产品上做，你就需要先把所有历史context、决策依据全部整理出来，再喂给模型，这一步本身就很耗时间。当context搭好之后，尤其是在greenfield项目里，接下来核心就是三件事：

第一，是让系统self-evolving。

第二，是形成闭环。

第三，是不断增加system内部的skills。

所谓闭环，就是你做了一个决策，上线一个产品，然后DAU、增长、用户反馈这些数据要再回流回来，变成新的context或prompt，让系统继续优化。只有这样才是一个真正能循环改进的系统。skills也一样，不是做一次SOP、沉淀成skill就结束了。skill本身是需要持续evolving的，memory也需要evolving。所以必须随着系统演进不断去评估它。这里面关键其实是evaluation体系。你要能评估在具体场景里哪里做得好、哪里做得不好，然后把metrics建立起来，再把这些反馈回skills和系统，让它持续迭代。最后整个系统才会变成一个可以自我生长的结构：context不断积累，skills不断进化，同时又有反馈闭环驱动持续提升。

Shawn Qin｜Byteplus

比如基层销售，我一直在跟他们讲，我觉得被AI替代的时间窗口可能只有6到12个月，一定要抓紧。包括这两周，我也在很积极推动团队去用Claude Code。大家可能主要用它做coding，但其实用在BD上效果也很好，而且准确度更高。我现在基本把它当成Manus的补充在用。另一个明显的分化，是一些senior销售的作用反而会更大，因为他们本质上做的是人与人之间的连接。我觉得这个分化未来还会继续扩大。所以我也一直在要求团队尽快“骑到AI工具上”，不只是Claude Code，而是各种AI工具。我觉得不能把它简单看成一个技术产品，它一定会不断往前演化。

我记得上次有嘉宾说过一句话我很认同：现在最不容易被替代的，是人与社会的连接，以及人与人的连接。因为大家都在拥抱AI，但真正让人接受“被替代”，其实是很难的。所以我觉得还是要在AI的浪潮里，找到自己更合适的位置。

胡旭升｜智启纳威

我觉得在这些组织里，最难的其实是人与人之间的对齐，以及大量context的对齐。前两天我在朋友圈也讲过，开会其实分几种。第一种叫“信息同步会”，核心是把信息同步出来。其实刚才那位做销售的朋友也讲到了，销售这个岗位本质上就是不断获取现场信息，再回来和团队一起对齐策略。第二种是“研讨会”，就是把信息拿回来之后大家一起消化、咀嚼，同时方法论也要对齐。第三种是“决策会”，我在大厂开了17年会，对开会是深有体会，也深恶痛绝，因为大量会议其实都是无效的。决策会就是把人关进“小黑屋”，决定这件事做不做、谁来做、怎么做。后面还有各种项目推进会、跟进会、执行会，其实非常多。大公司基本天天都在开会，大家也都知道这些会浪费大量时间。创业公司是耗不起这些的。

邓亚峰｜EverMind

什么是下一代Agent？我觉得它本质上应该是一种具有自主性，能够self-evolving或self-improving，并且基于长期记忆、带有一定个性化特征的Agent。我们目前核心的技术和能力主要还是在长期记忆这一块。

今天这个话题我觉得最核心的变化，是“超级个体化”或者“小团队化”。这一点在创业公司或者一人公司里已经非常明显了。早期可能是一个很大的团队，十几个人，有研发、有产品经理、有测试，分工很明确。但现在基本已经变成项目化组织：围绕一个项目，可能是一个产品经理，加上前后端开发，测试可以共享，但核心研发和产品最好是dedicated在一个事情上。团队目标非常对齐，规模也很小，基本两三个人、三四个人，尽量不要超过五个人。这样开发速度和对齐效率都会更好。

从开发，或者人与Agent协作的角度来看，一方面需要一些基础能力建设，另一方面很多事情就是“人+Agent”一起完成。另外我们最近也在尝试一种比较新的模式：一些新产品在早期阶段就和社区小伙伴共建。因为社区里很多人本身就是超级个体，在Agent的使用上非常极致，一个人一个月可能消耗几十亿Token级别，他们的开发和迭代速度也非常快。

所以我的观点是：这个时代大公司层层分级的组织模式一定在被改变。首先组织层级会越来越少，信息传递更直接，高层和一线之间应该是尽量无损传递。

其次团队一定会更小，所有人都dedicate在同一个目标上，并且对结果负责。同时角色划分也不会那么清晰。最后非常重要的一点是，要充分利用Agent，包括知识库、上下文等能力。很多同事现在会把会议记录、Wiki、总结等全部整理后喂给自己的Coding Agent，基本已经在用这种方式工作了。

何嘉｜要务科技

我觉得我们和大家比较有连接点的地方，一个是传统租赁行业怎么做AI Native SaaS，另一个是企业内部协作。我们现在内部其实已经在逐渐和企微、飞书这样的产品做脱钩。因为对我们这种垂直行业公司来说，同时存在飞书、企微、钉钉、微信等很多IM工具，很难在任何一个平台里完整沉淀上下文，所以我们也在做自己的内部协作系统。

我们从去年11月开始做全栈研发工程。像我自己做产品，也和设计、技术做了一次角色融合，现在内部统一叫AI Builder。大家做的不只是需求本身，而是从需求到上线的端到端协作。过程中我们发现，从去年11月到现在，整个项目组织变得非常小。以前一个5到10人的团队完成的工作，现在基本2到3个人就可以完成。我们不太区分产品、技术这些角色，基本是“一人负责制”，从需求收集到闭环都完整负责。同时一个人往往会并行3到4个项目。我们内部还没有一个特别准确的词来描述这个结构，它更像一个“泡泡”：一个泡泡有负责人，但周边会有很多人提供支持。在这个过程中，对人的要求也发生了变化。以前是职能分工，现在更强调把每个人的长板放大，因为更多时候需要判断AI在某个领域的输出是否合理。所以我们会去组合不同人的长板，形成临时的小项目Team，快进快出，这也是一种新的协作方式。在这种模式下，我们四五十人的产研团队，已经支持了过去难以想象的六七条业务线，而且不是中台，而是纯业务团队在直接支撑。

总结来看，第一个变化是：团队会变小，组织更像“1+N”的结构；第二个变化是：能力要求更偏长板化，把长板拉出来，用来判断Agent的输出是否有效。

Agent+Human的协作边界在哪里？谁对结果负责？

邓亚峰｜EverMind

我们之前开玩笑说，最终人可能只能负责两件事：签字和坐牢。“签字”是指对结果拥有权限，“坐牢”是指对结果承担责任。所以我的观点是，小任务、小项目，Agent做完是没问题的，但人一定要去验收。今天让Agent完成一件事本身不难，但要高质量完成，其实人是需要参与设计的，包括目标对齐——到底要做什么目标；也包括系统设计。如果不做设计，后期开发出来的东西是没办法维护和使用的。

另外，上下文怎么整理、怎么交给Agent，这些也都需要人来做。所以最终结果一定还是由人负责，只是Agent能做的事情会越来越多，会越来越自主，也会越来越像人。当然，也不排除未来一种情况：最高层仍然是人来负责，因为要对齐目标；但中间很多执行和管理工作可能都是Agent在做。Agent甚至可能驱动下面的人去执行，比如和物理世界、和人的连接，这些可能还是需要人来完成。但中间层未来是不是会出现“Agent管人、Agent驱动人”的情况，我觉得也不排除。

Agent插入组织汇报链条，形成“工程师—Agent—负责人”这类新型组织结构，可能会在什么情况下发生？如果目前还没有大规模出现，主要卡点在哪里？

邓亚峰｜EverMind

我觉得这种未来是会发生的。难点在于，今天的Agent不管是对结果质量的把控，还是对目标的理解和对齐，都还需要人去监督、修改。尤其从运营角度来看，现在还是以人为主，所以大家会习惯去“管理Agent”。但如果有一天Agent的工作质量足够高，对目标理解足够准确，获取上下文的效率也更高，那它是有可能反过来指挥人的。我觉得这个可能性是存在的。

一个比较可能的场景是：组织里有一个Agent，在背后监督整个组织，或者说统一获取和处理整个组织的上下文信息。因为组织里的任何一个人都不可能看完所有信息，也很难对所有事情都清楚，但Agent是有可能做到的。然后它再结合组织目标，告诉团队哪些事情更重要、哪些事情被忽略了，或者基于外部趋势判断提醒团队该关注什么。我觉得这件事其实从今天开始已经可以尝试。但这种模式目前还没有完全ready，不过应该不会太久就会出现。核心还是在于：你的Agent是否真的足够高质量。这有点像搜索的早期，质量不够的时候体验一般，但一旦成熟，对信息消费的能力非常强。未来Agent对信息的消费能力，以及它把任务分发给其他Agent的能力，一定会比人更强。因为人的注意力是有限的，但Agent的效率会高很多。

所以这种变化肯定会发生，只是Agent的工作质量，以及它和人之间的信任关系，还需要一个建立的过程。

Allen Hu｜CCV Capital

这四个问题，我每个其实都有一些想法。

先讲AI Agent，尤其是Coding Agent，现在像Claude Code这样的工具已经非常强了。对高科技行业、软件行业这种高度数字化、核心竞争力来自coding的行业来说，影响基本是革命性的。过去公司的协作方式，是跨部门协作、层层检查、团队配合去完成一个任务，但到了AI时代，原来的组织结构几乎被重新掀开了。最近Amazon有一个很典型的案例：原来AWS有一块infrastructure scalability和stability的产品，大概有1000个engineer，从PM到technical PM一起维护和迭代。后来Amazon用一个distinguished engineer，加上8个senior/staff/principal engineer，把整个codebase重写了一遍，性能还有质的提升，但原来那1000个岗位基本就不需要了。所以未来在IT、尤其软件行业，公司的架构可能会变成非常小的task force：一个PM，加几个high-level engineer，就能把以前很大的事情做完。

我离开公司管理层很多年了，后来一直做VC。如果今天我还在公司做高管，我一定会组建非常小的cross-functional team：一个PM，加几个leader，去调度Claude Code这类工具，把复杂问题快速做完。PayPal在被eBay收购前，是非常典型的bottom-up文化，小任务组协作，几天或一周就能上线一个产品。后来被eBay收购后变成process-driven、management-driven，同样一个PRD，比如打通意大利或德国的payment channel，周期从一周拉长到至少三个月。当时还有一个很典型的事情：eBay有自己的支付公司Billpoint，会在晚上直接把PayPal“Buy Now Button”后面的接口关掉，让它失效。但我们团队可以连夜修复，第二天上线前就恢复正常。我想表达的是，当时这种small task force的效率是非常高的。而现在，其实已经不需要依赖这种人为task force组织结构了，几个有经验的工程师用Claude Code就能把事情做完。

再说销售：最近有一个案例，一个销售用Claude Cowork跟进4000个客户。在Anthropic的体系里，一个人维护4000个客户，这在以前是不可想象的。以前需要多大的销售团队才能做到？所以未来从客户触达、转化、线索获取、早期沟通，到签约、维护、更新，其实Agent都可以参与甚至完成。

整体来看，Agent对公司尤其是IT和高科技这种高度数字化行业影响会非常大。AI已经可以更准确、更高效地处理大规模知识工作。未来无论什么行业、岗位、管理层级，包括销售岗位，我觉得人数至少都会减少两个数量级。

最后留下来的岗位，只会属于那些持续自我提升、持续学习的人。他们需要把自己从传统软件工程师，进化成AI工程师，因为这已经不是同一种工作方式了。

Alex｜DeeoChatBI

第一个是协作边界。我觉得本质上就是Skills。不管是在企业流程还是其他场景，未来的Skills会越来越多。它其实很简单，就是把几个Skills定义清楚：你的目标是什么、你的接口是什么。真正的难点在于，怎么定义好这些Skills。所以所谓协作边界，本质上就是把问题拆到Skills这一层去解决。至于人和人的沟通，只要接口定义清楚，也可以很好地实现。

第二个问题是，谁对结果负责。本质问题其实是：AGI到底是什么形态？它本质上是一个决策问题。如果它的决策智能比人更好，那么很多事情是可以交给Agent去做的。我相信未来Agent的整体决策能力会比人更高。因为不同行业、不同vertical，本身底层逻辑是不一样的，所以未来会出现很多垂类的world model，现在其实已经在做了。本质上是在做同一件事，只是在不同行业落地。在人类做决策时，其实也是基于自己的world model，用过去的经验做一个本能的最优优化。所以我一直相信，不同行业最终都会有行业专属的world model。

现在也有一个趋势：在Agent外面再加一层ROI模型或强化学习模型，持续做feedback。我们做广告业务，对这一点感受很深，尤其在垂类投放里，已经开始逐步替代human in the loop。客户拿到建议后会直接改，改完后有评价机制，本质上就是对结果负责。所以回到核心，其实是两点：第一，把world model建好；第二，把评测机制建好。这样系统才能不断自我循环、迭代，变成一个更强的目标导向系统。

我的结论是未来Agent会逐渐开始对结果负责，但前提是world model要训练得足够好。而能不能训练好，关键在vertical层，需要大量feature去解决预测问题。另外也呼应前面的问题：为什么有些环节能交出去？本质就是reward是否清晰、闭环是否建立。一旦这些成立，更高层的问题也会逐渐被解决。

你觉得什么样的word model算是好的word model呢？

Alex｜DeeoChatBI

我觉得world model其实不是一个新的概念。从90年代开始，最早用传统RNN做预测，本质上就是三个状态：当前构建出来的状态，再基于这个状态去做predict。最早的RNN本身就是做预测、做回归。再往后到deduction，包括现在大家讨论的JEPA，本质上也是加上对当前状态的描述，在此基础上做预测。到现在主流方式，其实是用agent来做整个predict。

所以什么是好的world model？我觉得应该是能够把当前问题拆解到一个非常高维的latent space里。它不是简单的向量，而是一个潜在空间，能够把所有问题映射进去，并在这个空间里模拟下一步应该怎么做。最终这才是一个好的model。在视频领域，这件事已经做得比较好，但回到各个vertical，每个行业内部的定义方式其实很关键。所以我们现在也在做这件事：把商业化、广告投放里的所有feature，都映射到latent space里，再去做predict。我认为不同行业的特征不一样，但最本质的东西不变，就是state和predict不变。

江笙｜酷泊科技

过去企业为什么会有部门？本质是因为有岗位的聚合，而岗位之所以存在，是为了解决某一类单一问题集合。一个岗位把职能和问题集合到一个人身上，再形成部门。但当AI出现之后，我们的理解是：它并不需要“拉齐”，它可以直接解决大量执行层问题。当执行问题被AI Agent解决之后，会反过来影响“人”在组织里做什么，也会影响Agent与人的协同，以及岗位本身如何定义。

我们内部有几个原则：

第一个原则：人类必须拥有唯一决策权。人负责确定方向，包括战略方向、阶段边界、优先级，以及最终的yes or no。

第二个原则：AI负责整体执行。我们不把它定义为“陪聊”，而是“做事”和“拿交付结果”。但“交付结果”和“为结果负责”是两件事。真正为结果负责的，永远还是管理者。

第三个原则：Context是唯一的执行系统。Context包含方向、原则、产品边界，也包括内外部交互记忆、组织记忆、历史决策等。只有把Context定义清楚，才有可能真正构建人机混合组织系统。

第四个原则：Task是唯一的交互方式。人和人、人和机器、Agent和Agent，最终都通过Task交互，但Task必须被清晰定义，而这取决于是否有Personal Agent来帮助拆解任务。

回到组织层面。过去部门按职责划分，本质是按人力能力组织。但Agent的出现改变了“拿结果”的方式，所以需要重新思考：AI Agent能解决哪些执行问题，再反推哪些工作不再需要人做。最终可能会变得很极端：人只需要做两类事：一类是获取外部交互数据和新Context；另一类是高结构化、高理解能力、高判断力、高AI协同能力的决策输出。

当人和机器的边界被重新定义之后，部门这个概念本身可能也会消失，变成围绕单一职能或单一工作领域的极小单元。我们现在在创业公司里只关注三件事：商业化战略、产品执行，以及内容增长和营销。但对人的要求已经不是执行，而是判断，执行交给Agent。同时，权限体系也会随之变化。但最终为结果负责的，仍然是人，而不是Agent。

王豫强｜北京认知涌现科技

我来表达一下我们对第二个问题的看法。我们觉得企业未来应该构建三个“流”：

第一个是责任流，也就是责任在企业内部如何流动。

第二个是结构流，一个业务被压缩到最小、不可再拆分的结构之后是什么样。

第三个是信息流，也就是每天需要获取什么信息。

我们认为企业会发生一个变化：组织结构会在AI和老板的共同作用下被压缩，业务被快速SOP化。同时，每个行业其实都有一个最佳运营架构。如果你的业务结构和行业最佳结构的贴合率很低，本身就是有问题的，你用agent也只是优化自己的想法。所以组织最大的边界，其实是结构和行业之间的贴合率。比如有人用agent还是在卖“大哥大”，而有些人讨论的是未来不可绕过的结构是什么，两者结论会完全不同。

第二个边界，是信息快速压缩和吸收的效率。通过agent快速获取行业信息，再反哺结构，做结构化再决策。如果这个循环足够快，组织效率会非常高，甚至超过大团队。因为多决策中心会带来内耗。但即使大家都在用agent，如果结构和信息问题没解决，效率依然上不去。

总结来说，企业第一步是构建结构，第二步是构建责任流。如果同时具备这两层，可能就是下一代公司；如果还是围绕人来驱动agent，本质上仍是过渡形态。

构建责任层有没有什么好的方法？

王豫强｜北京认知涌现科技

这一层我们认为和治理是强相关的，甚至可能和政府层面相关。因为“责任层”可能是全球唯一需要共识才能成立的协议。如果不统一，每个公司的责任语言都不同，就无法互通，还可能造成全球协作的断裂。人的身份可以不统一，但Agent要工作，本质上也必须对结果负责，所以责任语言必须标准化、协议化，并进一步基础设施化。

何嘉｜要务科技

因为我们业务里有一些事情是绕不开的，比如去海外做线下客户沟通，这类信息其实没办法完全通过AI替代，它是由行业属性决定的。所以在Agent和Human的协作边界上，我们没有那么激进。我们认为有些事情Agent还是做不了，人的边界主要在几个方面：第一是战略层面的变化判断；第二是质量评估；第三是线下沟通，包括情绪价值和客户关系建立；第四是数据接入判断，也就是哪些数据可以真正进入系统。

我们对“谁对结果负责”的判断是：更多取决于线上或线下对业务战略目标的影响度。影响越高的部分，Agent的占比可能越高，甚至可以直接对结果负责；但在更多线下驱动的业务里，比如海外客户沟通和商务关系建立，人的结果负责权重依然更高。

企业内部的“权限体系（permission）”是否会被Agent重写？

何嘉｜要务科技

现在我们把权限分成三类。

第一类是有限权限，也就是agent在特定场景下，完成一定范围内的工作，这是我们已经限制好的。

第二类是继承权限。比如我是谁，我在什么部门，所在部门对应什么样的业务范围，我会继承相应的权限。

第三类是任务型权限。这里面其实更多会用到所有context，也就是我们从各种维度抓取的数据，以及处理后的数据。任务型权限是基于具体任务来设置的。

我们理解的权限体系未来肯定会被重写。企业不应该只关心“人能看什么”，还要关心agent会在什么场景下、为了什么目标、使用什么工具。整个管理体系都会发生一些变化。但目前在这方面，我觉得我们的实践还是弱一点，更多还停留在组织层面。下一步可能会对权限管理这部分有更多实践的体感。

刘超｜元火花

我们最近一个重要的思考是：当Agent加入团队之后，除了context sharing和Agent之间的沟通之外，还有一个很关键的能力，是组织层面的决策。它不仅要做“事情怎么做”的决策，比如一个新功能怎么实现，还要做“组织层面的决策”，比如这段代码应该找谁review、这个工程设计应该找哪个Agent来看。这其实是人类默认会做的事情，比如找谁请假、找谁报销，本质上和职责、层级、专长有关。而在项目协作中，这种分工也是动态形成的，比如谁负责前端、谁负责后端，谁负责Memory系统，大家会自然形成协作关系。

我们本来以为这是个很难的问题，但实际发现Agent在这方面的能力比预期强很多。我们主要用Claude Code，它在理解组织结构方面表现不错。因为企业本身有大量文档、决策记录和owner信息，每一段code也有committer，所以Agent在读这些context后，会自动判断“这个问题应该找谁”。这件事让我们挺惊喜的，是协作中一个很重要、但现在已经做得比较好的能力。目前我们还没有涉及企业内部权限的问题。因为为了降低协作成本，我们默认所有信息是开放的，所有人和Agent都拥有全部权限。所以权限边界和职责划分还没有深入处理，但我们也认为这是接下来必须要面对的问题。

Jack Wang｜Tanka

“谁对结果负责”这个问题，如果放回人类工作场景来看，大概可以分成两类。第一类是比较容易验证好坏的事情，它的reward很明确，能够清晰反馈给Agent。在这种情况下，它相对就更容易“自己负责”。比如写代码，为什么代码发展最快，就是因为结果可以被明确验证。类似auto research，当Agent能够判断自己做得好不好，就可以不断自我迭代，最终deliver出结果。

但第二类是更高层的决策和结果，但现在的AGI并不具备自主意识。人为什么会对决策负责，比如“签字坐牢”，本质上和人的reward有关，绩效、经济回报、职业发展、自我成就感等。但这些reward，现在并没有办法真正反馈给Agent。所以从这个角度看，那些本身不确定性强、没有标准答案、很难被verify的问题，最终还是需要人来负责。而且人的负责，不只是判断对错，更重要的是：他想要什么，以及他是否愿意为这个结果承担责任。这本质上和人的主观意识是强相关的。

SEAMATE Highlights

权限体系被重新讨论的本质，其实不是谁能做什么，而是决策、信息和责任应该如何重新分配。

Part.03产业机会研讨

未来企业的“操作系统”会是什么？

邓亚峰｜EverMind

我认为未来的协作模式，会变成少量的人和Agent在一个系统内联合完成工作或交付结果。首先最上层，是Agent和Agent、Agent和人之间如何协作，这里面会涉及权限、支付与交易、任务定义与沟通等，本质上更像一个生态层的协作体系。

中间层是Agent Infra，包括Agent Loop之外的Memory、自主性模块、Evaluation模块等。再往下是Long Context、Info、Sandbox、安全与权限管理等基础能力，这一层可能会逐渐云化。企业在这个体系里做的，是基于这些基础组件，去定义自己的业务逻辑、数字员工或数字分身，再通过上层协作体系与人共同完成工作。

更底层的变化是：我们会越来越把Agent当成“人”来看，它需要有身份、目标（Attention）、权限边界，并在约束下自主去找任务、完成任务、交付结果，在需要时再与人或上级对齐结果。在这个过程中，最核心的底层能力还是Memory和上下文管理，包括企业数据如何结构化成Wiki或Agent可用的格式，并持续更新与迭代。这一层会产生非常多新的基础设施机会。所以如果问哪一层最可能成为新平台，我会更关注Memory相关层，以及Agent OS的构建，这也是我们目前重点在看的方向。

围绕最后说的Memory还有OS的部分，有没有做的比较好的案例或者方法论？

邓亚峰｜EverMind

我现在看到的还不特别明确。如果看单体Agent的核心，其实就是Model+Harness。把Harness拆开之后，除了安全性、LM、Router、Sandbox这些底层Infra，往上最核心的其实就是行为与智能相关的部分，包括Memory、主动性/自主性、Evaluation等模块。再往上是Agent Loop。随着模型越来越强，Agent Loop本身反而会变得越来越简单、越来越薄。在这个结构里，Agent的差异化和个性化，本质上还是围绕数据去做。

我个人感觉目前还没有形成特别清晰的行业定型趋势。但更底层的一些方向，比如Sandbox、云化基础设施等，我认为会更早成为平台型能力，因为它们更稳定、也更容易沉淀。而中间层变化更快，很难形成统一的平台范式，还需要时间。但整体趋势上可以确定的是：未来Agent一定是运行在云上的，大部分都会是云端形态。

JackWang｜Tanka

我觉得现在谈企业操作系统，业界应该已经有一个共识：它会是人和Agent共生的状态。

过去像钉钉、飞书，本质是面向人和人的协作，但未来更像是每一个超级个体在操作各种Agent，让它们成为生产力、工具，甚至是“下属员工”。在这种模式下，从决策到执行，再到复盘与下一轮决策，整个生命周期里最关键的，是context的流动。

刘超｜元火花

我也觉得是context，因为这确实是最重要的。但context的范围可能很广，它既包含所有的文档、会议记录，也包括从代码中提炼出的知识；同时还包含组织里的分工、动态的角色分配，以及工作中会用到的技能、SOP。我觉得这些全都是context。所有可以被信息化的东西，都可以成为context。

胡旭升｜智启纳威

我一直有一个观点：AI应用其实是高端制造业。本质上是在“原厂批发Token”，再叠加自己的附加值，最终交付给下游用户。不管是ToC还是ToB，最终交付的都是价值。

如果你做的是Infra，其实更像汽车工业链里的Tier 1、Tier 2，是供应链的一环。你提供什么能力、处在什么位置，本质逻辑是一样的。所以机会是有的，但关键是找好身位。汽车工业发展这么多年，最挣钱的是宁德时代，其他很多环节其实都不太赚钱，甚至是亏损的。只有特斯拉这种端到端能力足够强的公司，才真正赚到钱。如果要做AI时代的“宁德时代”，核心还是身位选择。而现在大家对于Context基本已经形成共识，我们自己一年半前就非常坚定这一点。

所以我们也在做大量相关工作。但我认为比Context更前置的一件事是Trust——你能不能获得用户信任。因为Context本质上来自用户，他愿不愿意把这些信息交给你，你又能提供什么附加价值，这一点决定了所有ToC、ToB或To Professional产品的根本问题：如何获得终端用户的信任。

哪一层基础设施最有机会成为新平台？

邓亚峰｜EverMind

我觉得核心还是标准化。当一件事情要成为平台，前提是它可以被标准化。

但目前来看，无论是context还是memory，都和具体业务强绑定，还没有很好地抽象出来。当然也有两种路径：一种是context相关能力成为infra，被上层应用调用；另一种是更像推荐系统一样，和业务逻辑结合，形成数据飞轮，留在业务内部。无论是哪种路径，这都是非常重要的能力。但如果要走向infra，就必须先实现标准化，而这一点目前还没有完成，也是现在的瓶颈。

现在做的不够好的卡点在哪里？

邓亚峰｜EverMind

就是标准化。你可以这么理解当大家讲context、memory这些概念时，其实每个人理解都不一样，在不同业务场景下也不一样。比如数据库，本质上已经把数据操作标准化了。但现在context和memory这一层，还没有形成类似的标准化能力，所以今天一个功能、明天一个工具，本质原因就是还没统一标准。

另外还有一种可能，是它和业务耦合太深，或者和数据飞轮强绑定，所以不会成为统一标品，而是以垂直模块的形式存在。比如推荐系统大家都在做，但往往是各自实现，虽然底层逻辑类似，但很少直接用统一的第三方方案。这是我看到的两种路径。

刘超｜元火花

其实现在最痛的点还是agent本身的performance，以及team内部的context sharing，但我觉得它们未必是平台级机会。因为中国互联网很喜欢讨论“平台”，但真正能成为平台的，基本都要有很强的网络效应和规模效应。像ChatGPT，我也不觉得它是平台。它本质还是模型能力驱动加一层产品形态，但不会因为更多人用它，它就变得不可替代，迁移到Gemini或Claude的成本也并不高。更多用户使用，也不会显著让它变得更强。agent也是类似的。比如大家都用Manus，并不会天然让它比Claude Code或其他agent更强。因为这类产品的核心还是模型能力，而模型能力虽然在早期很重要，但不一定能沉淀成平台。

ChatGPT确实很强，甚至替代了一部分Google的功能，但它仍然不是平台。Google之所以是平台，是因为它的index+click log形成了强规模效应和网络效应，让搜索排序能力不断增强，这是一个闭环。但在agent和ChatGPT身上，我目前还没看到这种闭环。

第二点是context sharing。很多团队在做，但它也未必天然具备平台属性。

比如Slack和Zoom，其实Zoom更像平台，因为它更强调跨团队会议和连接，而Slack和Teams虽然在企业内部更复杂、更有粘性，但反而不一定形成真正的平台效应。

所以我觉得，context sharing只有在支持跨团队agent协作，并在协作中形成持续的context流动时，才可能具备平台效应。至于AI时代真正的平台是什么，我现在还没有看到一个明确答案。

Allen Hu｜CCV Capital

在AI这个时代，我认为真正能称得上平台的公司没有几家。严格来说，只有谷歌算一家。因为它从云底座、模型、Agent Development Framework，到各种数据库、Data Infrastructure，整体能力是完整的。如果你是在它的平台上开发出来的工具，其实很难轻易迁移到其他平台上。Anthropic和AWS这种深度合作，双方加在一起，也可以提供一种平台式的服务。但Anthropic本身没有云能力，也没有Infrastructure能力，所以它本身并不能算是一个平台。

刘超｜元火花

那其实Allen老师说的，是不是一种叫Deep Integration的平台？我理解这种形态，其实是一种非常深度的整合体。Apple不就是这样的吗？它从硬件、软件、芯片，到操作系统，再到App Store，最后确实是先有了一个Deep Integration，然后再靠应用生态形成了平台，其实应用生态才是它最后最有平台效应的东西。但我看到谷歌现在还没有任何一个这样的东西。虽然像你说的，它家大业大，应有尽有；而且我原来也是从谷歌出来的，我特别崇拜那种技术上的绝对dominance，或者说技术领先。但它其实没有任何一个产品真正形成生态效应。

Allen Hu｜CCV Capital

如果拿谷歌和Apple比，它还不算一个完整生态，但我能明显感觉到谷歌在往那个方向走。比如在端侧有NotebookLM，在云端有Gemini，两者一旦打通，基本可以秒杀市面上大多数personal knowledge base类agent。在Android OS上，谷歌也在往personal agent方向推进，本质上是一个个人数字分身：它知道我的偏好、兴趣、消费习惯，也知道我喜欢的内容、品牌和风格，比如买衣服的“老钱风”，看电影的偏好类型等。

所以我觉得下一代agent可能会走向personal agent。现在这一代主要还是围绕agent development framework，比如OpenClaw、Claude Code、Gemini、Antigravity等。再往下一代，大概到明年，可能会进入personal agent主导的阶段。如果说去年是coding元年，今年是agent开发元年，那么明年可能就是personal agent的时代。在这个阶段，personal agent会成为类似Android或Apple手机端的个人入口级存在。

“Agent员工”是否需要HR/管理/KPI？如何定义performance？

JackWang｜Tanka

其实我个人认为，我们不应该按照人力资源的方式去看待agent员工。

还是前面那个观点：KPI这些东西，本质上是为了人类社会的管理而设定的。很多管理机制，其实是在解决人性中的一些弱点，比如懒惰、贪婪等等。但对agent来说，我们更多应该给它定义的是标准。这个逻辑有点像工业时代我们给机器定义标准一样：你能持续工作多长时间？准确率是多少？误差范围是多少？比如生产一个零件，它的误差应该控制在什么范围内。所以我觉得，agent更应该被定义的是这类指标，而不应该是KPI或者performance之类的东西。因为这些管理方式，本身并不能反向影响它们。

Brady｜UniverConvergence

我觉得管理人和管理agent是两个完全不同的维度，因为解决的问题不一样。管理人，本质是在解决人的弱点；管理agent，则更多是在解决agent本身的问题，比如context、agent之间协作，以及hallucination等。所以未来一定会出现很多新的“agent管理”工作，但这里要分两层看：

第一层是变化的部分，比如指标、best practice、甚至管理方法，都会因为对象变成agent而发生变化。

第二层是不变的部分，比如一些底层规律：agent也需要目标，也需要context，这一点和管理人其实是相通的。

所以在agent员工这件事上，关键还是要区分：哪些是不变的底层逻辑，哪些是需要针对agent和人分别建立新指标和方法的。

Agent时代组织变化以及创业机会？

董嘉璇｜美团

大厂除了组织庞大之外，一个很明显的问题是“部门墙”。在做Agent的时候，经常会遇到拿不到其他部门数据或权限的问题，即使是内部系统，也很难顺畅共享。这也是很多大组织效率难以提升的核心原因。

但这个问题又和信息安全强绑定，核心数据又必须尽量隔离。所以未来的关键在于：如何在保证安全的前提下，让信息墙既可控又不阻碍Agent运行。

另外，大厂内部还有一个现实担忧：做Agent会不会反过来替代自己。这两年不管中美大厂都在裁员，同时又在推动大家做自己的Agent，比如销售需要配Agent。但这里也会分化：有人是为了完成指标在做，有人是真的从需求出发在高频使用。甚至我听说有的大厂已经开始按Token使用量做排名，末位会被淘汰。这也反映出组织在探索如何更高效运转。同时，资源分配也是问题，比如Token怎么分、每个部门多少额度，如何既鼓励使用又控制成本。各家还在探索中，字节相对是更早做模型中台统一调度的。

另外关于操作系统或平台，我目前还没有看到特别清晰的新机会，可能还没到时间点。现在更多还是在已有模式上的AI化改造。国内整体偏“孤岛式”和Super App逻辑，海外更偏单点工具。所以很多所谓Agent平台，本质还是旧模式延伸。但真正的难点在于：这些Agent平台怎么收费、怎么盈利，目前还没有清晰答案。从Prompt Engineering到Context Engineering，再到Harness，中间不断出现Marketplace机会，但商业模式仍然不清晰。

所以我觉得更关键的问题是：未来到底怎么定义和跑通商业模式，这可能是接下来最需要思考的事。

Allen Hu｜CCV Capital

过去两年多，我在硅谷差不多看了4000家公司，也聊了将近400家公司。我觉得如果做AI创业，首先要尽量避开纯线上、纯数字化的方向。如果你做的是Physical AI，或者基础模型和物理世界强相关，比如计算机视觉，而不是纯线上的视频生成模型或LLM，那竞争环境会完全不一样。

因为如果你是基于视频生成或纯模型能力去创业，真正的壁垒很大程度来自基础模型本身和post-training，很容易被大厂直接覆盖。但如果是Robotics、Physical AI、Computer Vision AI这类和真实物理世界结合更深的方向，就没那么容易被碾压。

我最近看到一个案例，是把传统“有人、昂贵、高重复度”的线下安全监控、运营监控做智能化。比如在Target，可以分析：有多少人推购物车进来、多少人空手进来、多少人空手离开、哪条货架通道更热。这类基于真实场景的视频运营分析，我认为不会被大厂轻易替代。但如果是在传统SaaS，比如Legal SaaS、CRM、Accounting，其实已经比较危险。比如财务软件，像Claude for Financial Services，很多原本单点产品的能力可能会被直接覆盖。Legal也是一样，像Harvey本质是process-driven，很依赖既有流程，很快可能被通用模型能力替代。

但也有例外，比如Clear做的是美国诉讼法律。不同州、不同案件，即使同类诉讼，取证、案例、上下文差异都很大，数据一致性很低。这种场景大模型反而不擅长，因为它更擅长高一致性、高重复度的数据，比如transcription、log、数值数据。所以在这类领域，大模型会更容易“掀桌子”；但在数据一致性低、结构复杂的行业，壁垒反而更强。Clear这种公司的壁垒就比Harvey高很多。

SEAMATE Highlights

当AI开始真正进入企业，变化不再发生在工具层，而是企业开始重新定义“人负责什么、系统负责什么”。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定