OpenAI推出自研推理芯片Jalapeño，暴露其掌控全链条智能生产的野心，核心是靠AI造AI基础设施，拉开AI行业底层算力竞争。 ## 1. 大模型行业竞争重心转向底层算力目前大模型能力差距不断缩小，模型领先窗口越来越短，很难构成长期壁垒。真正拉开差距的是算力供应、推理成本、数据中心建设、能源获取等底层基础设施，决定企业能否长期跑通。 AI时代新账本以Token为核心单位，OpenAI作为头部产品方，推理成本（算力税）被英伟达卡在手中，必须自建底层能力破局。 ## 2. GPT参与设计GPT，形成正向迭代飞轮 OpenAI联合博通将这款定制AI芯片的流片周期压缩到9个月，远短于传统高性能ASIC项目的18-36个月，核心优势是OpenAI掌握真实模型负载数据。 OpenAI已经用自身大模型参与芯片的部分设计优化，形成了「更好的模型设计更好的芯片→更好的芯片降低模型运行成本→更多用户反哺更多负载数据→再定义下一代芯片」的闭环飞轮。 ## 3. 瞄准推理场景，削减日常推理成本 Jalapeño面向大语言模型推理而非训练，当前训练市场仍高度依赖英伟达整套生态，推理则是持续消耗现金流的日常场景，Agent等新应用还会进一步放大Token消耗。 Jalapeño类似OpenAI自用的TPU，不需要对外出售，只要能降低推理成本、提升API毛利、优化系统利用率，就能证明价值。 ## 4. OpenAI正在复刻苹果的全闭环模式 OpenAI并不想成为下一个英伟达，而是对标苹果搭建「芯片-系统-应用-模型」的全闭环优化体系。 Altman此前布局芯片、能源、数据中心不是追概念，OpenAI已经不再以AI创业公司的逻辑规划自身，目标是从卖模型转向掌控完整的智能生产全链条。 ## 5. AI时代核心资产正在重构过去互联网时代核心资产是流量，AI时代新规律正在形成：模型越来越像流量，计算基础设施越来越像核心资产土地。 OpenAI自研芯片不止是一次流片，它正式宣告OpenAI不满足于做最顶尖的模型公司，目标是成为掌控智能生产全过程的玩家。

2026-06-25 21:54

GPT设计GPT

版面之外

速览

本文来自微信公众号：版面之外，作者：画画，题图来自：AI生成

OpenAI终于做芯片了。

很多人看到这条新闻，第一反应是：英伟达麻烦了。

但我看到的恰恰相反。

首款芯片Jalapeño最重要的意义，并非直奔着英伟达而来。

这是OpenAI第一次公开承认，自己不满足于做一家模型公司了。

它想控制的，是生产智能的整个过程。

从模型，到芯片。从数据中心，到能源。从训练，到推理。从生产Token，到销售Token。

Jalapeño表面是一颗芯片，实际上更像一张路线图。

OpenAI终于把自己的野心摆到了桌面上。

一、模型差距在缩小，计算差距在扩大

自从大模型爆发以来，AI行业几乎所有注意力都在模型。

GPT-4出来行业被震一次，Claude追上来，Gemini追上来，DeepSeek把性价比打出来，Meta推开源。每次发布大家盯着同一组东西：参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现，模型领先的窗口正在变短。今天一个模型刚发布，几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在，但越来越难独立构成长期壁垒。

真正拉开差距的东西，开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看，也不会立刻刷屏。但它们决定一家AI公司能不能长期跑下去。

黄仁勋最近说了一句话：英伟达系统也许不是采购价格最低的，但能生成成本最低的Token、最高的Token吞吐量，最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵，黄仁勋没在采购价上辩解，而是把问题换到另一个维度：别看买机器花多少钱，要看每个Token的生产成本。

这就是AI时代新的账本。服务器和GPU不是最终单位，Token才是。

OpenAI恰好站在这个问题最中心。

ChatGPT每天处理海量请求，Codex要消耗更多推理步骤，未来还有Agent、视频生成、机器人、长推理链。模型越有用，Token消耗越大。产品越成功，推理账单越厚。

残酷的地方在这里，OpenAI用户越多，英伟达越赚钱。OpenAI产品越强，底层算力税越重。

如果每一个Token都要经过外部硬件平台收一道税，OpenAI就很难拥有完整的护城河。它可以有最强模型，有超级入口，有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño的本质就在这里。OpenAI开始自己造Token工厂。

二、GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节，是九个月流片。

传统高性能ASIC项目，周期通常18个月到36个月。先进工艺更麻烦，架构、验证、物理实现、封装、软件栈、调试，任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚，Celestica负责板卡、机架和系统工程。

OpenAI真正贡献的是更稀缺的东西，它知道未来模型要怎么跑。

很多芯片公司做AI加速器，难点在于猜负载。模型结构会变，推理方式会变，服务模式会变。芯片一旦流片，物理世界没有软件世界那么好回滚。

OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API，知道哪些内核最常用，哪些内存搬运最浪费，哪些网络瓶颈最影响集群效率，哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。

这些经验以前只是后台工程知识，现在被写进芯片架构。

在OpenAI的官方新闻稿里有一句话很关键：OpenAI使用自己的模型加速了部分设计和优化流程。还说，提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT开始参与设计下一代GPT的机器。

过去几十年芯片的链条是，先设计芯片，芯片运行软件，软件运行AI。现在链条开始回头，AI帮助人类设计芯片，芯片再运行下一代AI。

一旦这个闭环成立，九个月可能只是开始。未来可能是六个月、三个月，甚至更密集的迭代。

芯片行业过去有自己的节奏，模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。

这一步如果走通，OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片，更好的芯片降低下一代模型运行成本，更低成本支撑更多用户和产品，更多用户和产品带来更多真实负载数据，这些数据再反过来定义下一代芯片。

这才是OpenAI真正想要的循环。

三、削减推理税，控制现金流

Jalapeño不是训练芯片，它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大，需要极强的通用能力，需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达，不只是GPU，而是CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑，每小时跑，每分钟跑。用户每提一个问题，API每响应一次，Agent每推进一步，都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱，推理烧日常现金流。

这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵，但推理每天都在发生。Agent时代会继续放大这个问题，一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行，都在继续推高Token消耗。

Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线，只要负载足够大，自研ASIC就有高性价比的经济意义。

OpenAI现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴，还有巨大的成本压力。

Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高，它就有意义。

OpenAI还提到，Jalapeño会减少数据传输，平衡计算、内存和网络资源，让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来，GPU等待网络，内存搬运拖慢计算，调度不佳造成空转，所有浪费最后都变成电费和资本开支。

采购价只是第一层，系统效率才是最后的账。

四、OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达，但我觉得OpenAI并不想成为下一家英伟达，更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone强，iOS强，A系列和M系列芯片强，App Store强。但苹果真正难打的地方，是这些东西被放在同一个闭环里。

芯片为系统优化，系统为应用优化，应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下，做出别人很难复制的体验。

OpenAI正在搭类似的东西。模型是智能内核，ChatGPT是超级入口，Codex是开发工具，API是生态分发层，Jalapeño是自研芯片，数据中心是AI工厂。

OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心，现在看可能压根不是在追概念，他已经不再用AI创业公司的方式规划OpenAI了。

如果说英伟达卖铲子，那么OpenAI想拥有矿山。

英伟达要做所有AI公司的工厂设备供应商，卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案，理想客户是每一个需要生产Token的公司。

OpenAI想给自己建一套工厂，卖的不是设备，是最终生成出来的智能。

短期看，OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台，Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。

长期看，裂缝已经出现。当模型公司开始拥有自己的芯片路线图，英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

版面之外的话

过去二十年，互联网最重要的资产是流量。谁掌握用户，谁掌握价值。

今天，AI时代正在出现新的规律。

模型越来越像流量，而计算越来越像土地。

模型会迭代，产品会变化，排行榜会不断刷新。但那些生产智能的工厂，芯片、网络、数据中心、能源，会越来越集中在少数玩家手里。

GPT开始设计GPT，看起来只是一次流片。

但它真正宣告的事情是：

OpenAI已经不满足于成为最聪明的公司，它想成为控制智能生产的公司。

本文来自微信公众号：版面之外，作者：画画

AI原生产品日报频道: 前沿科技

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定