本文指出当前多数AI项目难获正向ROI,核心问题是数据未适配AI需求,提出需搭建面向Agent的新一代数据体系。 ## 1. AI落地的核心矛盾:模型强但数据拖后腿 Gartner预测,2026年将有60%的AI项目被放弃,目前仅5%的AI项目能跑出持续ROI。矛盾根源不是模型能力不足,而是企业沿用过去为人设计的数据平台,无法适配新需求。过去20年的离线数仓、湖仓一体两代数据平台,核心都是解决人高效用数据的问题,无法满足Agent对数据时效性、准确性、语义一致性的高要求,还放大了数据孤岛、治理缺失等旧问题。 ## 2. AI时代数据体系的四大范式变革 AI时代交互、研发、运行时、治理四大范式同时发生改变,数据工作模式从「人使用工具」转向「Agent完成工作」。变革具体为:交互以自然语言为核心,研发转为Spec驱动AI生成产物、人工评审,运行时将Agent作为核心运行单元,治理将元数据变为Agent可调用的语义API。新模式需要实现单条数据需求的端到端交付,解决传统多角色多系统分工响应慢、易出错、成本高的痛点。 ## 3. 统一语义是解决Data Agent幻觉问题的核心 目前75%的企业已试点、部署或使用AI Agent,但仅15%考虑或部署具备自主能力的Agent,企业最关注Agent运行的可控性。数据平台直接决定Agent是否产生幻觉,缺少统一语义会让NL2SQL掉入指标歧义、JOIN错乱、查询条件匹配错误三大陷阱,这是多数Data Agent项目止步于幻觉的根本原因,统一语义是AI时代新的数据护城河。 ## 4. 面向Agent的新数据平台的业务价值 新零售这类行业存在数据分散、响应慢、模型上线周期长、非结构化数据无法打通的痛点,新数据平台可解决这些问题,完成适配RAG的数据准备。本次数据平台升级本质是人机分工的重新划定,Agent正在成为数据平台的合法「一等用户」,这场变革才刚刚开启。
大模型已经够聪明了,为什么95% 的AI 项目还是跑不出ROI?
2026-06-17 15:15

大模型已经够聪明了,为什么95% 的AI 项目还是跑不出ROI?

本文来自微信公众号: InfoQ ,作者:凌敏,原文标题:《大模型已经够聪明了,为什么 95% 的 AI 项目还是跑不出 ROI?》


2026年,AI落地的故事正在上演一个奇特的悖论:模型能力突飞猛进,企业AI投入成本与日俱增,但然后呢?越来越多的案例和数据显示,真正进入生产并产生持续ROI的项目仍然是少数。Gartner甚至预测,2026年60%的AI项目将被放弃。


背后的原因不是模型不够好,而是数据没有准备好被AI消费。


当AI进入真实业务流程后,现实的卡点是能不能拿到正确的数据、理解正确的业务语义,并基于可信的数据完成任务。在Agentic AI时代,这种矛盾被进一步放大。过去,数据的消费者是人,如今,越来越多Agent开始参与分析、开发、治理等数据工作,人和Agent需要基于同一套数据体系协同工作。如果企业还在沿用上个时代专为人而设计的数据平台,很难支撑Agent在生产环境中稳定、准确、可信地运行。


AI落地是一个数据问题


当行业关注点从模型能力转向AI落地,数据成了越来越绕不开的话题。因为在真实的业务流程中,不管AI是做经营分析、生成报表还是最终执行,都需要完整跑通从数据接入到数据分析、数据治理,再到最终的业务输出,这样一整条链路。这中间,任何一个环节的不确定,都会放大结果的不可靠。


然而,企业现有的数据平台,大多并不是为这条链路设计的。


回顾大数据平台的发展历程就会发现,过去20年,大数据平台经历过两次完整的代际演进:在大数据时代(2006-2014),重点关注的是离线数仓、ETL、报表决策,把分布式存算和开发任务工具化;在湖仓一体时代(2014-2023),重点关注的是湖仓存算、数据治理,以及资产化。


本质上,这两个时代解决的,都是人如何更高效地使用数据这个问题。业务方提一个数据需求,分析师先理解业务口径,再写SQL取数、对齐指标,最后做出一份报表。如果底层数仓不能满足,还需要数仓工程师对数仓分层做调整。这些需求从提出到交付,少则两三天,多则一两周。


这件事过去20年都没怎么变。整流程虽然效率不高,但基本能够运转。


但当Agent开始开始批量上岗后,数据平台终于迎来了新的使用者:Agent。Agent对数据的时效性、准确性和语义一致性提出了更高的要求,原本可以依靠人工经验弥补的断层,在Agent面前变成了硬伤。


AI时代带来了新的问题,同时,很多旧时代的问题,如数据孤岛、治理缺失等也被再次放大。新旧问题交织在一起,老办法已经不够用了。


  • 交互范式:在AI时代,自然语言成为新的交互方式,真正的产物是AI生成的,UI是AI产物的投影;


  • 研发范式:从人写代码转向Spec-Driven,从数据需求的Spec来驱动AI去理解主动生成产物,人来做评审;


  • 运行时范式:Agent是一等运行时公民,与任务共生命周期;


  • 治理范式:元数据将成为Agent可调用的语义API。


当交互、研发、运行时和治理四个范式同时发生改变时,最直观的变化,将从“人使用工具”,变成“Agent完成工作”。过去大家关注数据平台有多少功能,现在关注的,是一项数据工作能否真正交付。


对比过去和现在的数据团队工作模式,会发现一个非常典型的问题。


过去的数据工作从需求拆解到结果分析,几乎每一步都需要不同的角色在不同的系统中完成,响应慢、易出错、成本高。在人机协作的Agentic AI时代,能不能把一条数据需求,变成一次端到端的交付?


(案例1:0到1新数仓构建)

(案例2-1:数仓诊断与治理)

(案例2-2:数仓诊断与治理)

(案例3-1:游戏用户充值与行为分析)

(案例3-2:游戏用户充值与行为分析)


但当Agent开始分析数据、调用工具甚至参与业务决策时,企业最担心的往往不再是能力,而是边界。


根据Gartner调研,75%的企业已经在组织内部试点、部署或使用某种形式的AI Agent,但只有15%正在考虑或部署真正具备自主能力的Agent。


相比模型能力本身,企业更关心的是另一个问题:Agent能否在可控范围内运行?


为什么多数Data Agent项目


都止步于幻觉?


2026年,幻觉仍是AI最大的顽疾。


正如前文所说,数据平台的消费者已经从人变成了Agent。数据平台承担的也不再只是传统的元数据管理,而是直接决定Agent会不会产生幻觉。


腾讯云认为,统一语义正在成为AI时代新的数据护城河。


没有统一语义,NL2SQL会反复掉进三个陷阱:指标歧义,系统里一个“收入”有八种口径,Agent随机选一个;JOIN错乱,关联键靠猜,SQL跑得通但数据全错;查询条件随意匹配,比如过滤条件是“上季度”或者“华东区”,大模型很难理解“华东区”到底指什么。这也是多数Data Agent项目止步于幻觉的根因。



把这套架构放到真实的业务场景中,价值体现得会更加清晰。


以新零售行业为例,这个行业的瓶颈从来不是数据太少,而是数据太散、报表太慢。线上线下、ERP、CRM的数据分散在不同系统中,BI的时效性跟不上大促节奏。此外,AI模型上线慢,推荐系统和用户分群模型从开发到投产动辄需要1-2个月。非结构化数据也用不起来,商品图、客服对话、用户评价沉淀在对象存储,或者其他系统里面,无法跟大数据系统打通,缺少数据准备的链路,没法喂给RAG。



如果把这次升级放在更长的时间轴上看,它代表的,或许是一次人机分工的重新划线。过去,数据平台是为人设计的操作台;现在,Agent正在成为合法的“一等用户”。而这场变化,才刚刚开始。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定