本文指出当前多数AI项目难获正向ROI，核心问题是数据未适配AI需求，提出需搭建面向Agent的新一代数据体系。 ## 1. AI落地的核心矛盾：模型强但数据拖后腿 Gartner预测，2026年将有60%的AI项目被放弃，目前仅5%的AI项目能跑出持续ROI。矛盾根源不是模型能力不足，而是企业沿用过去为人设计的数据平台，无法适配新需求。过去20年的离线数仓、湖仓一体两代数据平台，核心都是解决人高效用数据的问题，无法满足Agent对数据时效性、准确性、语义一致性的高要求，还放大了数据孤岛、治理缺失等旧问题。 ## 2. AI时代数据体系的四大范式变革 AI时代交互、研发、运行时、治理四大范式同时发生改变，数据工作模式从「人使用工具」转向「Agent完成工作」。变革具体为：交互以自然语言为核心，研发转为Spec驱动AI生成产物、人工评审，运行时将Agent作为核心运行单元，治理将元数据变为Agent可调用的语义API。新模式需要实现单条数据需求的端到端交付，解决传统多角色多系统分工响应慢、易出错、成本高的痛点。 ## 3. 统一语义是解决Data Agent幻觉问题的核心目前75%的企业已试点、部署或使用AI Agent，但仅15%考虑或部署具备自主能力的Agent，企业最关注Agent运行的可控性。数据平台直接决定Agent是否产生幻觉，缺少统一语义会让NL2SQL掉入指标歧义、JOIN错乱、查询条件匹配错误三大陷阱，这是多数Data Agent项目止步于幻觉的根本原因，统一语义是AI时代新的数据护城河。 ## 4. 面向Agent的新数据平台的业务价值新零售这类行业存在数据分散、响应慢、模型上线周期长、非结构化数据无法打通的痛点，新数据平台可解决这些问题，完成适配RAG的数据准备。本次数据平台升级本质是人机分工的重新划定，Agent正在成为数据平台的合法「一等用户」，这场变革才刚刚开启。

2026-06-17 15:15

大模型已经够聪明了，为什么95% 的AI 项目还是跑不出ROI？

极客邦科技InfoQ

本文来自微信公众号： InfoQ ，作者：凌敏，原文标题：《大模型已经够聪明了，为什么 95% 的 AI 项目还是跑不出 ROI？》

2026年，AI落地的故事正在上演一个奇特的悖论：模型能力突飞猛进，企业AI投入成本与日俱增，但然后呢？越来越多的案例和数据显示，真正进入生产并产生持续ROI的项目仍然是少数。Gartner甚至预测，2026年60%的AI项目将被放弃。

背后的原因不是模型不够好，而是数据没有准备好被AI消费。

当AI进入真实业务流程后，现实的卡点是能不能拿到正确的数据、理解正确的业务语义，并基于可信的数据完成任务。在Agentic AI时代，这种矛盾被进一步放大。过去，数据的消费者是人，如今，越来越多Agent开始参与分析、开发、治理等数据工作，人和Agent需要基于同一套数据体系协同工作。如果企业还在沿用上个时代专为人而设计的数据平台，很难支撑Agent在生产环境中稳定、准确、可信地运行。

AI落地是一个数据问题

当行业关注点从模型能力转向AI落地，数据成了越来越绕不开的话题。因为在真实的业务流程中，不管AI是做经营分析、生成报表还是最终执行，都需要完整跑通从数据接入到数据分析、数据治理，再到最终的业务输出，这样一整条链路。这中间，任何一个环节的不确定，都会放大结果的不可靠。

然而，企业现有的数据平台，大多并不是为这条链路设计的。

回顾大数据平台的发展历程就会发现，过去20年，大数据平台经历过两次完整的代际演进：在大数据时代（2006-2014），重点关注的是离线数仓、ETL、报表决策，把分布式存算和开发任务工具化；在湖仓一体时代（2014-2023），重点关注的是湖仓存算、数据治理，以及资产化。

本质上，这两个时代解决的，都是人如何更高效地使用数据这个问题。业务方提一个数据需求，分析师先理解业务口径，再写SQL取数、对齐指标，最后做出一份报表。如果底层数仓不能满足，还需要数仓工程师对数仓分层做调整。这些需求从提出到交付，少则两三天，多则一两周。

这件事过去20年都没怎么变。整流程虽然效率不高，但基本能够运转。

但当Agent开始开始批量上岗后，数据平台终于迎来了新的使用者：Agent。Agent对数据的时效性、准确性和语义一致性提出了更高的要求，原本可以依靠人工经验弥补的断层，在Agent面前变成了硬伤。

AI时代带来了新的问题，同时，很多旧时代的问题，如数据孤岛、治理缺失等也被再次放大。新旧问题交织在一起，老办法已经不够用了。

交互范式：在AI时代，自然语言成为新的交互方式，真正的产物是AI生成的，UI是AI产物的投影；
研发范式：从人写代码转向Spec-Driven，从数据需求的Spec来驱动AI去理解主动生成产物，人来做评审；
运行时范式：Agent是一等运行时公民，与任务共生命周期；
治理范式：元数据将成为Agent可调用的语义API。

当交互、研发、运行时和治理四个范式同时发生改变时，最直观的变化，将从“人使用工具”，变成“Agent完成工作”。过去大家关注数据平台有多少功能，现在关注的，是一项数据工作能否真正交付。

对比过去和现在的数据团队工作模式，会发现一个非常典型的问题。

过去的数据工作从需求拆解到结果分析，几乎每一步都需要不同的角色在不同的系统中完成，响应慢、易出错、成本高。在人机协作的Agentic AI时代，能不能把一条数据需求，变成一次端到端的交付？

（案例1：0到1新数仓构建）

（案例2-1：数仓诊断与治理）

（案例2-2：数仓诊断与治理）

（案例3-1：游戏用户充值与行为分析）

（案例3-2：游戏用户充值与行为分析）

但当Agent开始分析数据、调用工具甚至参与业务决策时，企业最担心的往往不再是能力，而是边界。

根据Gartner调研，75%的企业已经在组织内部试点、部署或使用某种形式的AI Agent，但只有15%正在考虑或部署真正具备自主能力的Agent。

相比模型能力本身，企业更关心的是另一个问题：Agent能否在可控范围内运行？

为什么多数Data Agent项目

都止步于幻觉？

2026年，幻觉仍是AI最大的顽疾。

正如前文所说，数据平台的消费者已经从人变成了Agent。数据平台承担的也不再只是传统的元数据管理，而是直接决定Agent会不会产生幻觉。

腾讯云认为，统一语义正在成为AI时代新的数据护城河。

没有统一语义，NL2SQL会反复掉进三个陷阱：指标歧义，系统里一个“收入”有八种口径，Agent随机选一个；JOIN错乱，关联键靠猜，SQL跑得通但数据全错；查询条件随意匹配，比如过滤条件是“上季度”或者“华东区”，大模型很难理解“华东区”到底指什么。这也是多数Data Agent项目止步于幻觉的根因。

把这套架构放到真实的业务场景中，价值体现得会更加清晰。

以新零售行业为例，这个行业的瓶颈从来不是数据太少，而是数据太散、报表太慢。线上线下、ERP、CRM的数据分散在不同系统中，BI的时效性跟不上大促节奏。此外，AI模型上线慢，推荐系统和用户分群模型从开发到投产动辄需要1-2个月。非结构化数据也用不起来，商品图、客服对话、用户评价沉淀在对象存储，或者其他系统里面，无法跟大数据系统打通，缺少数据准备的链路，没法喂给RAG。

如果把这次升级放在更长的时间轴上看，它代表的，或许是一次人机分工的重新划线。过去，数据平台是为人设计的操作台；现在，Agent正在成为合法的“一等用户”。而这场变化，才刚刚开始。

AI原生产品日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定