2026-06-25 23:00

Jalapeño流片，OpenAI全栈战略关键拼图

本文来自微信公众号：未尽研究，作者：未尽研究

OpenAI终于拿到了与博通合作开发的首款定制AI芯片Jalapeño。这是一款面向推理场景设计的专用集成电路（ASIC），也标志着OpenAI正式向AI基础设施层迈出关键一步。

自ChatGPT发布以来，奥特曼便不断向产业链上下游延伸，将OpenAI的控制范围从模型扩展至芯片、网络、数据中心乃至能源供应。从2023年底开始，他持续从谷歌TPU团队招募关键人才。操刀该AI芯片的Richard Ho，正在这一时期加入OpenAI，并牵头组建芯片团队。

Jalapeño自然是这一布局中最关键的一环，也是最早落地的一环。

也许，这也是为什么OpenAI这次定调“9个月”，并强调这是从架构设计到制造流片（tape-out）的“史上最快”的开发纪录。像英伟达这样的巨头，也刚加速到一年一迭代。按照谷歌杰出工程师David Patterson的回顾，TPUv1从项目启动到部署进入数据中心，共耗时约15个月。

与此同时，OpenAI也正在谋划抢在Anthropic之前完成上市。如果能够持续推进模型与芯片的协同迭代，并将其转化为更低的推理成本和更高的资源利用率，那么长期来看，token经济学将更有可能向OpenAI倾斜。

OpenAI总裁Greg Brockman还称，这多亏了公司AI模型的帮忙。这种“AI设计AI芯片”的叙事，也让OpenAI的芯片迭代的未来，更具想象空间。

不过，也别太轻易相信这一口径。互联网上至今仍能找到大量2025年10月OpenAI与博通宣布正式合作时的报道，早有铺天盖地的“18个月秘密研发”、“GPT亲自参与设计”等叙事。或许，就像大模型训练中的“Final Run”一样，“9个月”并非整个项目真正的起点。

尽管如此，这一速度仍然相当惊人。作为对比，今年初微软发布第二代定制AI芯片Maia 200，距离上一代产品已经过去两年多时间。

相比开发周期，更值得关注的仍然是芯片本身的性能表现。这是影响到OpenAI算力基础设施总拥有成本（TCO）的关键，也是决定token经济学的关键。

不过，到目前为止，市场上关于Jalapeño的讨论，仍然缺乏确切的细节。OpenAI的官方博客介绍了一些，OpenAI与博通相关人士在媒体采访中透露了些边角料，但更翔实的技术报告，还要再等一段时间。

现在已知的是，除了OpenAI自己设计加速器，它的供应链还包括提供芯片制造、网络和连接相关技术的博通，以及负责电路板、机柜和系统搭建的天弘科技（Celestica）。它的部署节奏不会太快，计划2026年底首次投入使用，2027年开始显著加速，2028年上半年全面发力，最终实现GW级算力集群。

这款芯片已经在GPT-5.3-Codex-Spark上跑通了，频率和功耗符合设计目标。这是一款专门设计的轻量版模型，也是OpenAI首个运行在英伟达GPU竞争对手Cerebras芯片上的模型，现在用来跑OpenAI自己的首款AI芯片。

根据OpenAI披露的初步测试结果，这款芯片在目标工作负载上的资源利用率接近理论峰值，并实现了较高的能效表现。这得益于芯片架构针对OpenAI推理场景进行的深度优化，减少了数据传输开销，还平衡了计算、内存和网络三类资源。

此前，就有媒体推测，这款芯片预计采用台积电3nm工艺制造，引入了systolic array（脉动阵列）架构，搭配HBM与ARM架构CPU。

按照OpenAI的逻辑，基础设施效率越高，算力就越强；算力越强，模型能力越强；模型能力越强，产品体验越好，用户和收入也越多；而这些收入又将继续投入下一代模型、芯片和基础设施建设，形成一个不断加速的正向循环。

从某种意义上说，谷歌TPU的十年发展，已经验证了这一路径的可行性：通过面向特定工作负载的软硬件协同设计，不仅可以提升性能，还能持续降低规模化部署成本。随着训练、推理（预填充与解码）、智能体执行与检索增强等工作负载不断分化，专用ASIC的优化空间正在进一步扩大。

对于OpenAI而言，Jalapeño的价值并不仅仅在于降低推理成本。更重要的是，它让OpenAI第一次拥有了从模型到底层基础设施协同优化的能力，而不再完全依赖微软、亚马逊或谷歌等外部平台的硬件工程体系。

Jalapeño也只是OpenAI试图取得全栈优势的第一步。官方博客还透露，OpenAI正在自主设计支撑模型运行的完整基础设施体系，包括芯片架构、内核软件、内存系统、网络架构、调度系统、部署平台以及最终产品体验。

上个月，OpenAI还与诸芯片巨头推出了MRC网络协议，让超大规模算力集群更稳定可靠。此前，分析师郭明錤透露，OpenAI正与高通和联发科共同开发一款智能手机芯片。

OpenAI正在逐步兑现它的战略布局。尽管Anthropic凭借Claude Code和智能体产品赢得了阶段性优势，但奥特曼押注的并不是下一代模型，而是支撑未来数年发展的基础设施体系，影响更为深远。

与此同时，OpenAI也始终在尝试降低对英伟达供应链的依赖。对于OpenAI而言，仅依赖单一供应商已经越来越难以满足未来需求。它未必能够掌控整个AI产业链，却希望在关键基础设施环节拥有更多自主权。

去年9月，英伟达曾计划向OpenAI投资高达1000亿美元，但到今年1月，这一数字被大幅缩减至200亿美元。当时，《华尔街日报》报道称，部分反对声音来自英伟达内部，黄仁勋私下里对OpenAI商业模式缺乏纪律性表示不满。

但路透社在2月的报道，援引多位知情人士的说法指出，另一部分原因在于OpenAI对于部分特定推理场景下的英伟达GPU效率并不满意，同时其快速变化的产品路线图也正在改变对于计算资源的需求结构。

按照路透社当时的说法，OpenAI希望未来至少10%的算力来自英伟达生态之外。随后，市场陆续传出其测试亚马逊Trainium芯片、与Cerebras建立合作关系等消息。

反观Anthropic，直到今年4月，市场才传出该公司正在探索自研芯片的消息；但公司尚未确定具体的芯片设计方案，也未组建专门团队来推进该项目。

两年多前，当奥特曼提出7万亿美元基础设施投资计划时，包括黄仁勋在内的许多人，都将其视为不切实际的设想。但如今Jalapeño提醒所有竞争同行，这从来都不是一个融资叙事，而是一条正在逐步工程化的路线。从模型到芯片，从网络到数据中心，再到能源体系，OpenAI正在试图重构token经济的每一层蛋糕。

Jalapeño只是这条路线中，第一个真正进入物理世界的坐标。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定