麦肯锡关于新兴AI云服务商的报告因数据硬伤和行业认知偏差遭遇硬科技从业者强烈质疑，凸显传统咨询模式在快速迭代的硬科技时代面临信任危机，垂直领域专家凭借实时、深入的行业洞察正重塑商业分析话语权。 ## 1. 数据硬伤暴露咨询行业认知断层 - **关键误差**：麦肯锡报告假设AI服务器成本69.3万美元，而实际硬件成本仅30-40万美元，误差达100%，源于依赖公开列表价而非真实物料清单。 - **商业模式误判**：将Neoclouds利润率估算为8%，但实际头部玩家毛利率可达45-55%，忽视其优化的算力交付效率（如千卡集群性能超越AWS/Azure）。 ## 2. 咨询节奏与AI迭代速度严重脱节 - **时间尺度冲突**：传统咨询3-6个月的生产周期无法匹配AI领域"周"单位的迭代速度，导致报告发布时市场已进入下一代架构（如Hopper→Rubin）。 - **情报模式对比**：垂直机构（如SemiAnalysis）通过实时追踪GitHub提交、供应链动态提供"活"数据，而咨询公司依赖静态框架。 ## 3. 电力与互联瓶颈重构行业终局预测 - **三大硬约束**： 1. 电力墙：变电站建设周期5-7年远慢于芯片生产，Neoclouds的电力合约价值超过GPU； 2. 推理需求爆发：计算量将增长10-100倍； 3. 集群效率竞争：专精厂商互联优化能力优于通用云服务商。 - **分层生态**：未来市场将分化为Tier1挑战者（如CoreWeave）、Tier2利基玩家（主权云/能源套利者）和Tier3算力批发商，而非麦肯锡预测的全面溃败。 ## 4. 利益绑定机制决定分析质量 - **客户需求差异**：麦肯锡服务企业高管需要"政治正确"的保守结论，而垂直分析师（如Dylan Patel）直接对投资结果负责，倒逼数据准确性。 - **话语权转移**：硬科技时代认知壁垒使GitHub记录、Discord讨论等非传统信息源比"精美PPT"更具决策参考价值。

2025-12-03 14:54

硬科技时代，我们到底需要怎么样的咨询？

TOP创新区研究院©

本文来自微信公众号：TOP创新区研究院，作者：TOP创新区研究院、FTA Group，原文标题：《当麦肯锡遭到质疑：硬科技时代，我们到底需要怎么样的咨询？》，题图来自：AI生成

前不久，麦肯锡McKinsey发布了的一份关于“Neoclouds（新兴AI云服务商）”的报告，喏，就是下面这一篇。

但随后，在X（原Twitter）和硅谷硬核的Discord群组里，工程师、创始人以及像Dylan Patel这样的垂直领域分析师，对麦肯锡这份报告发出了前所未有的质疑。

知名半导体分析机构SemiAnalysis甚至还对报告进行了近乎残酷的拆解，注意看highlight的部分，咱们就不翻译了。

批评声音非常尖锐：

“一群从未焊过电路板、从未在机房通过宵的MBA，凭什么用精美的PPT来指导这场人类历史上最复杂的算力基建革命？”

这场争论的背后，其实是一个深刻的行业变局：

在极度垂直、极度复杂、极度快速的硬科技时代，传统的“通用型智库”正在遭遇前所未有的信任危机。

我们也开始思考：

在AI深水区，我们究竟需要什么样的行业洞察？

一、你没有build过，你就没有资格

回到上面我们说到的那份关于CoreWeave、Lambda Labs等“Neoclouds”的行业报告。

麦肯锡的结论是：

这些新兴云厂商只是“昙花一现的套利者”，终将被Hyperscalers（超大规模云厂商）吞噬。

每家机构的看法观点都不一样，这无可厚非，但问题是，其推导过程中的数据硬伤，却让一线从业者大跌眼镜。

比如，有一个细节就极具杀伤力：

麦肯锡在报告中为了论证Neoclouds资本支出过高、商业模式不可持续，隐含的假设是，每台AI服务器的成本约为69.3万美元。

然而，一线的从业者（Builders）立刻指出，基于2025年Q4的市场行情，即便是配置了8张B200/GB200的高端服务器，其真实的硬件BOM（物料清单）成本加上网络互联，大约在30万~40万美元之间。

看到了么？

这是一个高达100%的误差。

那为什么会发生这种错误？

因为咨询顾问习惯于看“公开列表价”（List Price），或者是包含了几年的服务溢价后的“打包价”，他们试图通过财务报表倒推物理成本。

而真正的行家看的是什么？

看GPU与服务器硬件：22万~28万美元。

看InfiniBand/Ethernet网络设施：4万~7万美元。

也要看电力与机柜建设（CapEx）：这一部分虽然昂贵，但分摊到单台服务器的建设成本并非天文数字。

在硬科技领域，魔鬼不在细节里，魔鬼就是细节本身。

如果你的输入端数据（Input）有100%的偏差，那么你复杂的财务模型输出（Output）——关于EBITDA、关于ROI的结论——就毫无价值。

这种粒度的缺失，也导致了对商业模式的误判。

麦肯锡将Neoclouds定义为“裸金属租赁商”（Bare-metal landlords），认为它们只是在利用英伟达显卡的短缺赚取差价，技术含量极低，利润微薄（估算约8%的息税前利润）。

但垂直领域的专家看到的是完全不同的图景：

SemiAnalysis的最新数据显示，CoreWeave等头部玩家的毛利率在签署长期保留合约（Reserved Contracts）时可达45%~55%。

更重要的是，这些厂商早就不是简单的“二房东”了。

比如，在2025年11月的测试中，顶级Neoclouds在千卡集群任务的完成时间、有效带宽利用率上，甚至超过了AWS和Azure。

而且他们部署了高度定制的Slurm和Kubernetes集群管理，专门针对大模型训练的Check-pointing（断点续传）和故障自动修复进行了优化。

传统视角看到的是“租赁”，但专业硬核视角看到的是“算力交付的极致效率”。

这种认知偏差的本质是：

你如果没有亲手Build（建造）过，你就无法理解Building的价值。

你出局了，你没有资格做咨询。

二、以“季度”为单位的咨询，以“周”为单位的AI迭代

在传统商业世界，战略规划通常以3~5年为周期，咨询报告的生产周期通常是3~6个月。

但在AI领域，“长期”的定义是6个月，“中期”是3个月，“短期”是下周。

所以，如果我们回顾麦肯锡的报告，它很大程度上是基于2024年/2025年上半年的市场的情况与数据：

那时候的Neoclouds确实以裸金属租赁为主，那时候确实是单纯的卖方市场。

但在报告撰写、审核、排版到发布的这几个月里，世界发生了什么？

答案是，发生了很多。

首先，英伟达/AMD的角色转变了，这位芯片巨头不再只是卖铲子，它们开始通过债务/股权融资直接扶持CoreWeave、Nebius等厂商，通过“算力换股权”来锁定未来的分销渠道。

再者，头部Neoclouds迅速补齐了推理服务（Inference Serving）、模型市场（Model Marketplaces）和私有光纤环网。

当这一份报告发布时，它所描述的那个世界已经不存在了。

SemiAnalysis指出的“滞后6~12个月”并非夸张。在AI领域，滞后6个月意味着你的建议是针对上一代架构（Hopper架构），而客户已经开始部署下一代（Rubin架构）了。

而与麦肯锡这样的“静态流”咨询不一样的是，像SemiAnalysis、Asianometry这样的独立机构，他们提供的是一种“动态流”（Stream）的情报服务。

他们活在Github的commit记录里，活在供应链的微信群里，活在追踪电力变电站审批记录的Excel表格里。

这种情报是碎片化的、实时的、甚至是有噪音的，但它是“活”的。

传统管理咨询的核心护城河，在于“方法论”和“框架”。其底层逻辑是：商业规律是通用的，只要掌握了思维模型，即便不懂行业细节，也能通过高层访谈得出战略结论。

但这套逻辑在半导体与AI领域彻底失效了。

如果为了追求“权威感”和“完美框架，往往导致结论的刻舟求剑。

三、NeoCloud的终局推演

既然麦肯锡的“看空”逻辑存在漏洞，那么基于2025年底的真实数据，Neoclouds的终局究竟是什么？

如果我们基于供需模型和技术演进进行推演，我们会看到一个分层（Tiered）的未来，而非二元对立的“被吞并”。

麦肯锡的核心做空逻辑是“短缺不可持续”。

一旦Blackwell/Rubin芯片海量出货，算力价格崩盘，Neoclouds将失去护城河。

但这个假设忽略了三个硬约束：

1. 电力墙（The Power Wall）

全球AI算力需求正从50~70 GW向2030年的150~250 GW迈进。但在美国，一个新的变电站审批和建设周期通常是5~7年。芯片可以造得快，但变压器和输电线不行。

Neoclouds手里锁定的电力合约（PPA），目前看起来比GPU本身更有价值。

2. 推理的大爆发

随着“思维链（Chain of Thought）”能力模型的普及，推理侧的计算量将呈10~100倍增长。这不仅消化了存量算力，还创造了巨大的增量需求。

3. 互联瓶颈

单卡性能的提升正在放缓，未来的竞争在于集群效率。

这正是CoreWeave等专精厂商优于通用云厂商（需要兼顾传统IT负载）的地方。

基于此，垂直专家们预判Neoclouds市场不会发生“大清洗”，而是会演化为三个阶层：

Tier 1：新时代的“超大规模”挑战者（2~4家）

以CoreWeave、Nebius为代表。它们将不仅仅是云厂商，而是成为类似Oracle或SAP的AI原生平台。它们拥有全栈软件能力，与微软等巨头签订了数十亿美元的“反向租赁”协议（微软租用CoreWeave算力再转卖给Azure客户）。

它们将在2026~2027年冲击IPO，市值站稳500亿美元以上。

可能最终名单就会在第二栏的公司中诞生

Tier 2：垂直领域的“利基霸主”（5~8家）

主要有主权云（Sovereign AI），比如欧洲的Nscale、中东的Tonomus，依靠数据主权法规和本地能源优势生存。

还有就是能源套利者，比如Crusoe这样利用油田伴生气或搁浅能源的厂商，其核心竞争力是极低的电力成本（0.03/kWhvs电网的0.03/kWh vs 电网的0.03/kWhvs电网的0.08/kWh）。

Tier 3：算力批发商（基础设施耗材）

也就是其余的大多数，它们将成为“基础设施耗材”，因为缺乏软件能力，最终沦为Tier 1或Hyperscalers的硬件蓄水池。

这部分确实符合麦肯锡的“低利润”预测，但它们只是生态的一部分，而非全部。

四、Skin in the Game

那为什么麦肯锡会产出这样一份与现实脱节的报告？

这还要看，谁在为这种报告买单。

长期以来，麦肯锡/Gartner的客户是财富500强的CIO、CFO。这些高管需要的是一份长达80页的、图表精美的PPT，用来在董事会上论证预算，或者作为“掩护屁股”（Cover Your Ass）的工具——“看，这是麦肯锡说的，所以我投了这个项目/砍了这个项目”。因此，报告必须显得“稳重”、“保守”，必须使用通用的商业术语，必须符合大企业的政治正确。

但类似于SemiAnalysis/垂直媒体的客户是对冲基金经理、VC合伙人、硬科技创业者。这些人是拿真金白银在下注。他们不需要漂亮的排版，他们需要的是Alpha（超额收益）。如果Dylan Patel说错了，基金经理会亏钱，他的订阅费会归零。这种“Skin in the Game（利益攸关）”的机制，逼迫垂直分析师必须追求极致的准确和前瞻。

而且，传统咨询往往倾向于将问题“框架化”，制造焦虑，然后贩卖一个有故事吸引力的解决方案。

但硬科技领域的真相往往是反直觉的、具体的、甚至枯燥的（比如讨论液冷板的流阻率），这中间没有故事，只有数据。

在AI时代，我们需要“Skin in the Game（利益攸关）”的咨询机制。

在这场关于Neoclouds的争论中，我们TOP创新区研究院看到的是——科技商业分析话语权的转移。

在Web 2.0时代或消费互联网时代，通用的商业逻辑或许足以解释世界。但在AI与半导体主导的Hard Tech时代，壁垒不仅在于资金，更在于认知颗粒度。

对于我们聪明的读者，这也是一个提醒：

不要迷信那些印着著名Logo的“宏大叙事”，因为真相往往隐藏在那些虽然排版粗糙、但数据详实的GitHub Readme里，隐藏在Discord的深夜讨论中，隐藏在像SemiAnalysis这样敢于对权威说“Bullshit”的垂直研究里。

您觉得呢？

本文来自微信公众号：TOP创新区研究院，作者：TOP创新区研究院、FTA Group

频道: 观点

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP