本文来自微信公众号: 极客公园 ,作者:汤一涛,编辑:郑玄,原文标题:《AWS 的老身份和新角色:做 Agentic AI 时代的基础设施》
过去三年,AI行业的绝大部分注意力都在一件事上:把模型做得更强。到2026年,这件事的边际收益正在迅速变小。
一个行业共识正在形成:模型正在商品化。一方面,前沿模型之间的差距正在收窄。Claude、ChatGPT这些闭源模型在多数通用任务上已经能达到「足够好」的水平。与此同时,开源模型(DeepSeek R1、Llama系列)从下方不断压缩差距。传递到消费端,大模型的「性价比」越来越高。当模型的技术壁垒逐渐被稀释,就很容易转化为标准化的算力服务。
另一方面,模型并未直接转化为生产力。麦肯锡2025年全球AI调研显示,62%的企业仍停留在Agent试点阶段,仅有23%完成规模化落地。Gartner预测,到2027年底,超过40%的AI Agent项目会被取消。大多数企业没拿到业务结果。
Agent要在企业里跑得好,往往还需要解决大量的工程问题,比如数据的管道问题,比如任务路径的监管问题。这部分价值不比训练一个模型小,但在过去明显被低估了。
今年早些时候,IBM首席AI架构师Gabe Goodhart就指出「模型本身不会成为主要的差异化因素」。他认为,企业长期竞争优势将来源于私有行业数据、业务工作流编排与垂直行业解决方案。换句话说,决定胜负的不是模型本身,而是围绕模型的数据和工程。
2026年AWS上海峰会的整个议程,正是建立在这个判断上:当前竞争的胜负手,正在从比拼模型的强度,转向更切实的价值创造,也就是帮助企业把Agent跑进生产。

01
Agent跑进生产之后
何锐邦是小鹏集团数据与AI平台负责人,管理几百人的研发团队。他在AWS上海峰会主论坛上讲了自己团队正在经历的事:2024年团队已经在普遍使用AI开发工具,个别员工效率提升了,整个部门没有提升。
卡点有三个。首先AI工具只能帮写单个环节的代码,但是整个链路并没有得到明显的提效;小鹏在做物理AI,软硬件协同开发的全自动化在行业里还是禁区。第三个卡点则更加根本:AI代码生成速度太快,人类治理已经跟不上。
MIT今年6月的研究支持了这一观察:AI使代码编写量提升了180%,但实际交付量只提升了约30%。因为写代码只是软件交付的一个环节,后面还有测试、审查、部署等一整套的生产流程,这些都无法只靠一个「更强的模型」解决。
亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松在主论坛上提了一个AI进化的时间线:2023年你问它答(Chatbot),2024年你指挥它协作(Agent),2025年底开始它能独立交付业务结果(agentic AI)。
当前AI的能力到了第三阶段,但大多数企业的管理方式还在第一阶段。差距出在两个地方。
第一个瓶颈是数据。储瑞松整场讲得最多的一个词是数据。模型是公共品,所有企业都能买到同一水平的基础大模型。真正拉开差距的是Agent拿到的上下文,业务知识、客户记录、流程规范这些花了很多年才攒下来的数据,短期内无法复制。
现实是大量企业的数据散在几十个系统里,没有经过治理。Agent需要跨系统调取信息,但缺少统一数据接入标准。如果上下文是碎片化的,模型推理能力再强也出不了好结果。
第二个瓶颈是规模化管理。储瑞松在台上打了个比方:创业公司三五个人的时候,不需要系统,不需要HR,干就是了。等公司到了几十人上百人,就需要相应的系统和政策。
Agent也一样。当企业有成百上千个Agent在生产环境里运行,很多实际的问题就会随之而来:怎么知道每个Agent做了什么决策、走了什么路径?一项业务任务到底花了多少钱?Agent有没有越权访问不该碰的数据?「如果你说不清楚一个Agent完成一项业务任务到底花了多少钱,那你做的可能不是部署而是实验。」储瑞松说。
评估同样不好办。Agent和传统软件不一样,同一个任务每次可能走不同的路径,没有系统化的评估机制就无从判断它到底靠不靠谱。
安克创新的经历印证了这个递进关系。安克CIO龚银在峰会上回顾了Agent落地过程:他们在深度应用期碰到的卡点是数据质量和已有系统的AI「不友好」,等600多个流程智能体上线后,Token日均消耗从不到100亿暴增至2000亿,此时成本管控变成了比技术选型更紧迫的问题。

数据、规模化管理、行业know-how——把Agent跑进生产,考验的早已不是模型本身。而换个角度看,这种模型商品化的趋势,重塑的不仅是企业用户的选择,也在重塑模型厂自身的活法。
02
到全世界去
模型厂商之所以愿意选择这样的一个平台,背后的逻辑其实和出海企业一样——模型商品化改变的不只是技术格局,对于一家正在出海的中国企业来说,选AI基础设施就不只是模型,他们更关心的问题是合规部署、低延迟、数据主权。
安克创新就是出海场景下最直观的样本。旗下Anker、soundcore、eufy、SOLIX等品牌的产品卖到全球超过180个国家和地区,AI已经嵌进了全线产品。但这等于把同一套AI能力落在完全不同的监管环境里,尤其eufy这类安防产品,摄像头数据在欧盟、北美、中东各有各的隐私和数据本地化要求。
自己去啃每个国家的法规并不现实,这正是出海企业需要一个覆盖全球各市场合规底座的原因。
从数据治理到规模化管理,再到全球合规部署,Agent落地要解决的问题远不止选哪个模型。
外部世界一直在变化,今天的第一名可能就是明天的垫底。过去几年行业把大部分注意力都给了模型。但是归根结底,所有的要素都是要导向「价值创造」的。谁离这个目标更近,就更有可能承接这条链路上的价值转移。
储瑞松在台上给了一条具体的建议:选一个有价值的业务场景,端到端跑通一个Agent,产生真实的ROI。「就像给新员工写一个岗位描述一样来定义你的Agent:它负责什么事情,交付标准是什么,出错了怎么办。把它做的事情和你业务的KPI直接关联,从第一天开始就能衡量价值。」
