本文来自微信公众号: 歪睿老哥 ,作者:歪睿老哥
故事是这样的。
2026年4月24日,Meta和AWS一起发了个公告。
内容很平淡,核心意思就是Meta要用数以千万计的AWS Graviton核心。
如果你随手划过,可能错过了一个非常重要的信号。
Meta花了好几十亿美元,买了AWS的芯片,买的是CPU,不是GPU,买的不是NVIDIA的东西,是Amazon自己的东西。
而Amazon把这个协议写进了公告,Meta也跟着一起发新闻稿站台。
这一下给我整不会了。
你想想,Meta是全世界最大的AI公司之一,手上有自己的芯片设计团队,手里握着海量的用户数据,手里攥着全球第四大的超算集群。按常理,它应该自建数据中心,自己设计芯片,自己采购一切。
但它没有。它跑去跟Amazon买。
买的是ARM架构的CPU。
先说具体数字。
Meta将部署数千万个Graviton5处理器核心,对应的是数十万颗物理芯片,每颗芯片192个核心。协议持续时间至少三年。
Meta由此成为全世界最大的Graviton客户之一。
这是什么概念?
Graviton是AWS自己设计的ARM架构处理器,从第一代到第五代,性能不断提升。Graviton5每颗芯片有192个核心,缓存是上一代的五倍,核心间通信延迟最多降低了33%,整体性能比前代提升了25%。
这些芯片不会放到Meta的数据中心。它们跑在AWS的数据中心里,用AWS的电力、网络和管理工具。Meta只是租用这些计算能力,用来支撑自己的AI工作负载。
这已经不是一个简单的采购合同了。
这代表了一个计算范式转移。
过去两年,全世界的目光都在GPU上。
NVIDIA的H100、B200、Rubin,一张卡卖到三四万美元,整个AI基础设施的叙事是谁有GPU谁就有未来。
AMD和Intel也没有闲着。AMD的MI系列GPU在努力追赶,Intel的Gaudi系列也在往外推。
大家都想在这个GPU主导的格局里切一块蛋糕。
但Meta这一单,绕开了整个GPU叙事。
不是不买GPU,GPU对大模型训练仍然不可替代。
Meta的几十亿美元AI基础设施投资里,绝大部分还是花在了GPU上。
但这一次,Meta押的是AI推理和Agentic AI的CPU侧。
什么是Agentic AI?
简单说就是AI智能体。
不是让你问一个问题它答一个问题的聊天机器人,而是能自己搜索、自己推理、自己写代码、自己执行多步骤任务的AI。
它要同时跑搜索、跑代码生成、跑任务编排,这些都是CPU密集型的工作。
GPU擅长并行矩阵运算,适合训练和批量推理。
但Agentic AI需要的是灵活的逻辑调度、大量的条件分支、实时的上下文切换。这些恰恰是CPU的强项。
所以Meta的推理架构正在变成一个混合体。
GPU负责模型训练和模型推理的矩阵计算层,CPU负责调度、编排、逻辑推理和实时响应。
Graviton5在这个混合架构里扮演的是CPU那一层。
AWS的定位也很明确。
他们不再只是一个GPU的合租室友,而是把Graviton做成了AI基础设施的CPU底座。
推理、调度、内存管理、Agent执行,全是CPU在扛。
说句实在话,我有点意外。
不是
