Jalapeño流片,OpenAI全栈战略关键拼图
2026-06-25 23:00

Jalapeño流片,OpenAI全栈战略关键拼图

本文来自微信公众号: 未尽研究 ,作者:未尽研究


OpenAI终于拿到了与博通合作开发的首款定制AI芯片Jalapeño。这是一款面向推理场景设计的专用集成电路(ASIC),也标志着OpenAI正式向AI基础设施层迈出关键一步。


自ChatGPT发布以来,奥特曼便不断向产业链上下游延伸,将OpenAI的控制范围从模型扩展至芯片、网络、数据中心乃至能源供应。从2023年底开始,他持续从谷歌TPU团队招募关键人才。操刀该AI芯片的Richard Ho,正在这一时期加入OpenAI,并牵头组建芯片团队。


Jalapeño自然是这一布局中最关键的一环,也是最早落地的一环。


也许,这也是为什么OpenAI这次定调“9个月”,并强调这是从架构设计到制造流片(tape-out)的“史上最快”的开发纪录。像英伟达这样的巨头,也刚加速到一年一迭代。按照谷歌杰出工程师David Patterson的回顾,TPUv1从项目启动到部署进入数据中心,共耗时约15个月。


与此同时,OpenAI也正在谋划抢在Anthropic之前完成上市。如果能够持续推进模型与芯片的协同迭代,并将其转化为更低的推理成本和更高的资源利用率,那么长期来看,token经济学将更有可能向OpenAI倾斜。


OpenAI总裁Greg Brockman还称,这多亏了公司AI模型的帮忙。这种“AI设计AI芯片”的叙事,也让OpenAI的芯片迭代的未来,更具想象空间。


不过,也别太轻易相信这一口径。互联网上至今仍能找到大量2025年10月OpenAI与博通宣布正式合作时的报道,早有铺天盖地的“18个月秘密研发”、“GPT亲自参与设计”等叙事。或许,就像大模型训练中的“Final Run”一样,“9个月”并非整个项目真正的起点。


尽管如此,这一速度仍然相当惊人。作为对比,今年初微软发布第二代定制AI芯片Maia 200,距离上一代产品已经过去两年多时间。


相比开发周期,更值得关注的仍然是芯片本身的性能表现。这是影响到OpenAI算力基础设施总拥有成本(TCO)的关键,也是决定token经济学的关键。


不过,到目前为止,市场上关于Jalapeño的讨论,仍然缺乏确切的细节。OpenAI的官方博客介绍了一些,OpenAI与博通相关人士在媒体采访中透露了些边角料,但更翔实的技术报告,还要再等一段时间。


现在已知的是,除了OpenAI自己设计加速器,它的供应链还包括提供芯片制造、网络和连接相关技术的博通,以及负责电路板、机柜和系统搭建的天弘科技(Celestica)。它的部署节奏不会太快,计划2026年底首次投入使用,2027年开始显著加速,2028年上半年全面发力,最终实现GW级算力集群。


这款芯片已经在GPT-5.3-Codex-Spark上跑通了,频率和功耗符合设计目标。这是一款专门设计的轻量版模型,也是OpenAI首个运行在英伟达GPU竞争对手Cerebras芯片上的模型,现在用来跑OpenAI自己的首款AI芯片。


根据OpenAI披露的初步测试结果,这款芯片在目标工作负载上的资源利用率接近理论峰值,并实现了较高的能效表现。这得益于芯片架构针对OpenAI推理场景进行的深度优化,减少了数据传输开销,还平衡了计算、内存和网络三类资源。


此前,就有媒体推测,这款芯片预计采用台积电3nm工艺制造,引入了systolic array(脉动阵列)架构,搭配HBM与ARM架构CPU。


按照OpenAI的逻辑,基础设施效率越高,算力就越强;算力越强,模型能力越强;模型能力越强,产品体验越好,用户和收入也越多;而这些收入又将继续投入下一代模型、芯片和基础设施建设,形成一个不断加速的正向循环。


从某种意义上说,谷歌TPU的十年发展,已经验证了这一路径的可行性:通过面向特定工作负载的软硬件协同设计,不仅可以提升性能,还能持续降低规模化部署成本。随着训练、推理(预填充与解码)、智能体执行与检索增强等工作负载不断分化,专用ASIC的优化空间正在进一步扩大。


对于OpenAI而言,Jalapeño的价值并不仅仅在于降低推理成本。更重要的是,它让OpenAI第一次拥有了从模型到底层基础设施协同优化的能力,而不再完全依赖微软、亚马逊或谷歌等外部平台的硬件工程体系。


Jalapeño也只是OpenAI试图取得全栈优势的第一步。官方博客还透露,OpenAI正在自主设计支撑模型运行的完整基础设施体系,包括芯片架构、内核软件、内存系统、网络架构、调度系统、部署平台以及最终产品体验。


上个月,OpenAI还与诸芯片巨头推出了MRC网络协议,让超大规模算力集群更稳定可靠。此前,分析师郭明錤透露,OpenAI正与高通和联发科共同开发一款智能手机芯片。


OpenAI正在逐步兑现它的战略布局。尽管Anthropic凭借Claude Code和智能体产品赢得了阶段性优势,但奥特曼押注的并不是下一代模型,而是支撑未来数年发展的基础设施体系,影响更为深远。


与此同时,OpenAI也始终在尝试降低对英伟达供应链的依赖。对于OpenAI而言,仅依赖单一供应商已经越来越难以满足未来需求。它未必能够掌控整个AI产业链,却希望在关键基础设施环节拥有更多自主权。


去年9月,英伟达曾计划向OpenAI投资高达1000亿美元,但到今年1月,这一数字被大幅缩减至200亿美元。当时,《华尔街日报》报道称,部分反对声音来自英伟达内部,黄仁勋私下里对OpenAI商业模式缺乏纪律性表示不满。


但路透社在2月的报道,援引多位知情人士的说法指出,另一部分原因在于OpenAI对于部分特定推理场景下的英伟达GPU效率并不满意,同时其快速变化的产品路线图也正在改变对于计算资源的需求结构。


按照路透社当时的说法,OpenAI希望未来至少10%的算力来自英伟达生态之外。随后,市场陆续传出其测试亚马逊Trainium芯片、与Cerebras建立合作关系等消息。


反观Anthropic,直到今年4月,市场才传出该公司正在探索自研芯片的消息;但公司尚未确定具体的芯片设计方案,也未组建专门团队来推进该项目。


两年多前,当奥特曼提出7万亿美元基础设施投资计划时,包括黄仁勋在内的许多人,都将其视为不切实际的设想。但如今Jalapeño提醒所有竞争同行,这从来都不是一个融资叙事,而是一条正在逐步工程化的路线。从模型到芯片,从网络到数据中心,再到能源体系,OpenAI正在试图重构token经济的每一层蛋糕。


Jalapeño只是这条路线中,第一个真正进入物理世界的坐标。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定