本文来自微信公众号: APPSO ,作者:APPSO,题图来自:AI生成
过去三年,GPU 几乎承包了所有关于 AI 基础设施的想象。
英伟达的市值、云厂商的资本开支、模型公司的训练节奏,最后都被折算成同一个问题:谁能拿到更多 GPU,谁就更接近下一轮 AI 竞赛的入场券。
但在刚过去不久的 2026 年 COMPUTEX 主题演讲的舞台上,英伟达创始人黄仁勋讲出的新故事,已经不只围绕 GPU 展开。

他一边推出面向个人 Agent 的 RTX Spark 处理器,把 PC 从“打开应用”重新定义成“提出需求、电脑执行”的新设备;另一边,又把英伟达第一颗自研数据中心 CPU Vera 推到台前,称它将成为新的主要增长动力,并指向一个 2000 亿美元规模的 CPU 市场。
究其原因,伴随着 Agent 浪潮的到来,只堆 GPU,已经不够了。GPU 仍然负责最核心的模型推理,但每一次推理前后,都需要 CPU 处理编排、调度、工具调用和数据流动。
CPU,正在变成 AI 基础设施的新焦点。
CPU,正杀回 AI 算力的牌桌
CPU 需求回升,首先来自 AI 应用形态的变化。
生成式 AI 爆发早期,行业重心几乎都在模型训练上。训练要处理海量并行矩阵计算,这是 GPU 的强项。CPU 主要负责系统初始化、数据搬运、任务管理等辅助工作。
于是过去几年,“重 GPU、轻 CPU”几乎成了行业共识。但随着 AI 从大模型训练走向大规模推理,再进一步进入智能体时代,工作负载的性质开始变了。
智能体不是“问一句、答一句”的线性系统。它会把一个复杂任务分成多个步骤,调用外部工具,读写数据库,执行搜索,运行代码,处理权限验证,管理上下文缓存,再判断当前结果是否有效,并决定后续动作。

图片由 AI 生成,仅供参考
一个用户请求,可能同时触发几十个甚至上百个子智能体并行工作。这些编排、工具调用、内存管理,以及子智能体之间的协调,主要不在 GPU 上完成。
GPU 仍然可以负责模型推理,也就是最接近“思考”的那一步。但在两次推理之间,CPU 要解析模型输出,判断接下来该调用哪个工具,管理执行计划,处理文件读写,发起网络请求,再把结果重新交给 GPU。
英特尔一位副总裁曾用一个比喻解释:智能体工作流本质上是一组独立智能体的协作。几十上百个智能体要互相通信,就需要不同的“位置”来运行,而这些位置指的就是 CPU。

研究数据也支持这一判断。佐治亚理工与英特尔在 2025 年 11 月的一篇论文中指出,在智能体工作负载中,CPU 上的工具处理环节占总延迟的 50% 到 90%。
也就是说,很多时候真正让用户等待的不是 GPU 本身,而是 GPU 在等待 CPU 完成工具调用、数据处理和任务安排,再把下一批输入送过来。
汇丰证券研究报告则给出另一个角度:在现代智能体工作流中,约 44% 的底层计算任务高度依赖 CPU,是传统文本生成模型的三到四倍。
过去,AI 服务器通常采用“一两颗 CPU 搭配八颗顶级 GPU”的配置,但随着 AI 工作负载从训练转向推理,再进一步走向智能体,CPU 与 GPU 配比正从 1:8 变为 1:4,未来可能 1:1 甚至更高。
AI 抢完 GPU,还要抢 CPU
AMD 董事长兼 CEO 苏姿丰在多个场合强调,业界此前低估了 CPU 在 AI 时代的价值。
在她看来,仅数据中心市场,未来三到四年规模就可能超过 1 万亿美元,而这个市场需要 CPU、GPU、ASIC 等多种技术并存。
然而,六到十二个月前,市场还很少讨论 CPU,也没人认为 CPU 会紧张。但随着推理需求上升,CPU 重新回到舞台中央。在她看来,未来五年,数据中心 CPU 市场的年复合增长率将超过 35%,远高于过去几年个位数的增速。
产品上,AMD 把重点放在代号 Venice 的第六代 EPYC 处理器上。
这款产品是行业首个在台积电 2 纳米工艺节点上进入量产爬坡阶段的高性能计算芯片。后续衍生型号 Verano 还将引入 LPDDR 内存集成技术,专门应对智能体带来的大容量内存需求。
在第六代 EPYC 全面铺开前,AMD 第五代 EPYC 已经凭借高核心密度和能效比站稳市场。财报数据显示,2025 年第四季度,AMD 数据中心业务营收达到创纪录的 54 亿美元,同比增长 39%。
英伟达的逻辑则稍稍不同。
英伟达想的则是让自家最好的 GPU 不被外部组件拖慢。比起与英特尔、AMD 打价格战,真正的算盘是消除外部 CPU、PCIe 总线和低速网络对 GPU 效率的拖累,把 CPU 内化成自家专有 AI 平台的一块拼图。
顺着这个思路,英伟达拿出了首款定制 CPU Vera,专为 agentic AI 的编排、工具调用和长上下文管理设计,黄仁勋还把它定位成公司下一个数十亿美元级的业务,并预测 Vera 将让英伟达进入一个 2000 亿美元的 CPU 市场。
最近,英伟达超大规模与高性能计算副总裁 Ian Buck 也将首批英伟达 Vera CPU 系统交付至 Anthropic、OpenAI、Oracle Cloud Infrastructure 以及 SpaceXAI。
参数显示,Vera 搭载 88 个英伟达自研 Olympus 核心,兼容 Armv9.2 指令集,并在 CPU 层面原生支持 FP8 精度运算。
为了解决传统超线程可能带来的性能波动,Vera 采用空间多线程技术,在物理层面对核心资源做硬分区,提供 176 个硬件线程,让每个线程在处理复杂逻辑分支时获得更稳定的尾部延迟表现。

而吃到这波 CPU 红利的,还有昔日霸主英特尔。财报显示,英特尔一季度 (Q1 2026)营收为 136 亿美元,同比增长 7%,净利润同比暴增 156%。
英特尔 CEO 陈立武表示,基于 Intel 3 的至强 6 产品和基于 Intel 18A 的酷睿系列 3 产品已全面进入量产爬坡阶段,但他也表示,英特尔尚未能完全满足市场需求,增长势头预计将持续到明年。
面对 CPU 市场需求的暴涨,整个 AI 产业链正在进入一场围绕先进制程产能的争夺。
亚马逊、微软等超大规模云厂商,以及苹果、英伟达、AMD 等芯片设计巨头,都在争夺有限的代工窗口。不过,在这场竞争中,利润率更高、芯片面积更大的数据中心 GPU 订单,依旧在挤压通用 CPU 的生产配额。
在本就吃紧的 CPU 产能里,芯片厂会优先满足利润更高的服务器订单,紧张也最先在服务器 CPU 这一端显现,并传导到价格和交期上。
英特尔已向中国客户预警,部分服务器 CPU 的交付周期长达六个月;AMD 部分产品的交期也延长到八到十周。英特尔在中国市场的服务器芯片价格上涨超过一成,而中国市场占其总营收两成以上。
与此同时,全球内存严重短缺又带来提前囤货效应。客户为了锁定整机系统价格,纷纷提前采购 CPU,使原本紧张的供给更加吃紧。
服务器这边吃掉了大部分产能,代价就传递到了消费端。面向个人和普通企业市场的 CPU 生产线被排到后面,大众市场供应随之趋紧、价格上行,出价更高的大客户优先拿货,普通采购方只能排队。换句话说,AI 越火,你的下一部电脑很可能就越贵。
简言之,AI 算力扩张带来的压力,正在沿着服务器产业链向外扩散:GPU 、CPU、内存、DPU、高带宽网络交换机、先进封装、液冷散热、整机柜供电,任何一个环节跟不上,都会影响最终的算力交付。
AGI 无法逃离基础设施的地心引力,它只是绕了一大圈,又回到了最朴素、却最有杀伤力的现实中:先有庞大的能源,再有精密的机器系统,最后,才有可能诞生真正的智能。
