OpenAI造出了自己的芯片——9个月流片，成本砍半，英伟达的饭碗还稳吗？

2026/6/26 9:18:28

博通CEO亲自递过来一颗辣椒，奥特曼接住了

2026年6月24日晚上9点10分，北京时间。

我刷着手机，看到一张照片：博通CEO陈福阳，那个在半导体行业里以"并购狂人"闻名的马来西亚华裔老头，正笑眯眯地把什么东西递到山姆·奥特曼手上。

不是合同，不是支票。

是一颗芯片。

名字叫Jalapeño——哈拉贝诺辣椒。

对，就是墨西哥菜里那种能辣到你怀疑人生的辣椒。

OpenAI给自家第一款自研AI推理芯片起了这么个名字，我第一反应是：这帮人是真不怕烫手。

但仔细想想，还真是贴切。又辣又快，又热又猛——这颗辣椒，可能真的要烧到英伟达的锅了。

9个月，从零到流片

先说一个数字：9个月。

这是什么概念？在半导体行业，一颗芯片从设计到流片（tape-out，就是送去工厂生产第一版实物芯片），通常需要2到3年。英伟达的H100，从设计到量产，花了将近两年半。谷歌的TPU迭代一代，也是按年算的。

OpenAI用了9个月。

陈福阳的原话是：“这是高性能先进半导体领域有史以来最快的ASIC开发周期。”

注意，不是"之一"，是"最快"。

那问题来了：凭什么？

答案说出来你可能不信——因为ChatGPT自己参与了芯片设计。

你没看错。OpenAI在研发Jalapeño的过程中，用自己的AI模型来加速工程迭代和验证。芯片设计里那些最耗时的环节——架构模拟、参数调优、布线验证——大量交给了AI来完成。

这就有意思了。

AI帮人类设计芯片，芯片造出来又用来跑AI，AI变得更强，又帮人类设计更好的芯片。

一个闭环，转起来了。

而且转得飞快。

OpenAI总裁格雷格·布罗克曼说了一句话，我觉得是这个故事里最被低估的一句：“我们的AI模型大幅压缩了芯片研发周期，这样的效率提升超出了所有人的预期。”

翻译成人话就是：连我们自己都没想到能这么快。

这也解释了为什么OpenAI要自己造芯片——不是为了跟英伟达抢生意，而是因为当你比任何人都了解自己的工作负载时，通用芯片永远不是最优解。

训练是一次性投入，推理是每天的天文数字

接下来要说一个很多人没意识到的商业逻辑。

AI芯片分两种用途：训练和推理。

训练，就是模型"学习"的过程——消化海量数据，形成能力。这是一次性的。GPT-5训练完了就完了，不会再回头重新学一遍（至少短期内不会）。

推理，是模型"用"的过程——每一次你打开ChatGPT问个问题，模型都要实时计算，生成回答。

训练是建工厂，推理是每天开工生产。

训练是一次性的资本投入，推理是每天数亿用户持续产生的运营成本。

对于OpenAI来说，ChatGPT的月活用户已经是个天文数字。每一次对话、每一次代码生成、每一次图片理解，背后都是算力在烧钱。而这些算力，绝大部分跑在英伟达的GPU上。

英伟达的GPU是通用芯片，什么都能干，训练能干，推理也能干，图形渲染也能干。但"什么都能干"的代价是：它在任何一件事上都不是最优的。

Jalapeño不一样。它是ASIC——专用集成电路。从出生就被设计成只干一件事：跑大模型推理。

打个比方，英伟达的GPU像是一把瑞士军刀，功能多，但你拿它切菜肯定不如专用菜刀快。Jalapeño就是那把菜刀。

OpenAI的判断很简单：推理成本占我们日常支出的绝对大头。如果能用专用芯片把推理成本砍掉一半，那就是省下了一个天文数字。

没错，根据早期测试数据，Jalapeño的推理成本预计比英伟达GPU低50%。

三到五成。

你想想，OpenAI一年在算力上花多少钱？如果砍掉一半，省下来的都是利润。

这就是为什么OpenAI要造芯片。不是为了酷，是为了省钱——省着省着，就变成了赚钱。

Jalapeño芯片核心数据信息图——展示9个月流片周期、50%成本降幅、ASIC推理定位、每瓦能效超越等关键数据

性能到底行不行？博通CEO敢说"媲美英伟达"

说到这里，你肯定有一个问题：快是快，便宜是便宜，但性能到底行不行？

毕竟芯片这东西，不是PPT上画个数字就能跑的。

目前公开的信息是：博通CEO陈福阳直接表示，Jalapeño的性能可与英伟达Blackwell系列及谷歌TPU相媲美。

这句话的分量很重。陈福阳不是OpenAI的人，他是博通的CEO，是合作伙伴里最懂芯片的人之一。他敢公开说"媲美"，说明实验室数据确实拿得出手。

而且早期测试还显示了一个关键指标：每瓦能效大幅超越当前市面顶尖算力产品。

"每瓦能效"是什么意思？就是每消耗一度电，能产出多少算力。这个指标比单纯的"峰值算力"重要得多——因为AI推理最大的瓶颈不是算力不够，而是电费太贵、散热跟不上。

Jalapeño围绕大模型的算力、内存、网络调度做了架构级的优化，大幅减少了数据搬运过程中的损耗，硬件利用率贴近理论峰值。简单说就是：同样的电，干更多的活。

目前，实验室的工程样片已经稳定运行GPT-5.3-Codex-Spark等前沿模型。这不是跑个benchmark刷分，是真的在跑自家的生产级模型。

当然，我也得说一句公道话：实验室数据和大规模量产数据之间，还有很长的路。很多芯片倒在了从实验室到数据中心的路上。Jalapeño计划2026年底完成首批小规模部署，2027年产能爬坡，2028年上半年全面规模化量产。

也就是说，真正的大考，还没开始。

全栈掌控：奥特曼的棋盘比你想象的大

如果你觉得OpenAI造芯片只是为了省钱，那你低估奥特曼了。

让我把时间线拉长一点。

OpenAI和博通的合作，早在18个月前就启动了。2025年10月对外官宣。在那之前，OpenAI还跟AI芯片公司Cerebras有过接触，积累定制芯片的认知。

这不是一时兴起，是蓄谋已久。

布罗克曼的原话透露了更多：“我们不仅在开发前沿模型，也在构建其上的产品；更重要的是，我们正在设计它们之下的基础设施——包括芯片架构、内核、内存系统、网络、调度、部署系统乃至产品体验。”

你把这句话拆开看：

模型——OpenAI在做（GPT系列）。产品——OpenAI在做（ChatGPT、Sora、API）。芯片架构——OpenAI在做（Jalapeño）。内核——OpenAI在做。内存系统——OpenAI在做。网络——OpenAI在做。调度系统——OpenAI在做。部署系统——OpenAI在做。产品体验——OpenAI在做。

从最底层的硅片，到最顶层的用户体验，OpenAI要把每一层都攥在自己手里。

这不是一家AI公司的做法，这是一家"全栈计算公司"的做法。

而且别忘了，搭载Jalapeño芯片的计算机系统，大部分硬件架构也是OpenAI自主设计的。他们不光造芯片，连服务器整机都自己搞。

布罗克曼还有一句话说得很透彻：“通过自主研发更多底层技术环节，我们可以用更高效率提供智能服务。”

翻译一下：我们的模型我们自己最懂，我们的负载我们自己最清楚，那为什么不连跑模型的硬件也自己做？

这是一个正向循环：模型越强，对推理负载的理解越深，芯片设计越精准，推理成本越低，能服务更多用户，积累更多数据，模型更强。

转起来了，而且是加速转。

OpenAI全栈技术栈示意图——从芯片架构、内核、内存系统到模型、产品、用户体验的垂直整合图谱

“去英伟达化”：所有人都想自己造芯片

OpenAI不是第一个造自研AI芯片的，但可能是最受关注的一个。

我们来盘点一下。

谷歌——TPU系列，从2016年就开始搞了，现在是第六代还是第七代我都有点数不清了。TPU支撑了谷歌从搜索到Gemini的全部AI推理。

亚马逊——Trainium系列，2023年开始推，去年底已经大规模部署在AWS上。亚马逊的逻辑跟OpenAI一样：我自己的云上跑着无数AI推理请求，凭什么给英伟达交税？

微软——去年发布了自己的AI加速芯片Maia，专门给Azure上的AI服务用。

Meta——也有自己的AI芯片，MTIA系列，主打推荐系统的推理。

现在OpenAI也加入了。

你看明白了吗？所有AI巨头，都在做同一件事：去英伟达化。

不是因为他们讨厌黄仁勋，而是因为英伟达的GPU太贵了，而且供不应求——你想买还不一定买得到。

陈福阳说了一句话，我觉得是整个行业现状最好的注脚：“现有产能完全无法满足市场需求，算力紧缺不止会持续2026、2027年，预计2028年行业算力需求还会继续攀升。”

2028年还在涨。这意味着谁手里有自研芯片，谁就掌握了算力自主权。

英伟达的饭碗还稳吗？

短期看，当然稳。英伟达的CUDA生态、通用GPU的灵活性、以及训练市场的统治力，不是一朝一夕能撼动的。博通股价从2022年末至今涨了近7倍，2026年以来累计上涨10%，但英伟达同期涨得更多。

但长期看，趋势很明确：推理市场正在被各家自研芯片蚕食。而推理，恰恰是AI计算市场中增长最快、体量最大的那块蛋糕。

有意思的是，OpenAI也不是把鸡蛋全放在一个篮子里。他们跟亚马逊云达成了合作，可以用Trainium芯片；也跟AMD、思博睿签了算力合作协议。自研加外采，双保险。

毕竟，谁也不想被一家供应商卡脖子。

全球巨头"去英伟达化"芯片自研版图——谷歌TPU、亚马逊Trainium、微软Maia、Meta MTIA、OpenAI Jalapeño的布局对比

对普通人来说，这意味着什么？

说了这么多行业格局，回到最开始的问题：这跟你我有什么关系？

关系大了。

还记得那个50%的推理成本降幅吗？

推理成本降低，意味着AI服务可以更便宜。更便宜意味着更多人用得起AI。

用OpenAI自己的话说：“如果AI能帮工程师更快设计出更好的芯片，就可以降低整个行业的计算成本，帮助普及先进AI的使用权限。”

这句话不是场面话。它指向一个真实的趋势：AI算力的成本曲线，正在往下走。

你想想，今天ChatGPT Plus一个月20美元，如果推理成本砍一半，是不是可以降到10美元？或者保持20美元但给两倍的用量？或者免费用户也能享受到更多功能？

再往远想：当AI推理便宜到几乎不花钱的时候，会发生什么？

每一个App都可以内置AI，每一个网站都可以有智能助手，每一个中小企业都能用上大模型。AI不再是巨头的特权，而是像水电一样的基础设施。

而这一切的起点，可能就是那颗叫Jalapeño的辣椒。

还有一层更深远的影响：AI造芯片这个闭环。

如果ChatGPT能帮OpenAI在9个月内造出芯片，那同样的方法论能不能复制到其他领域？AI帮设计新药、AI帮设计新材料、AI帮优化城市规划。

当AI开始加速AI自身的迭代，我们可能正在进入一个加速循环的时代。

这个时代会多快？我不知道。但Jalapeño给出的信号是：比我们以为的要快。

又辣又快

文章写到最后，我刷了一下评论区。

有人调侃：“又辣又快，犹如我的焦虑。”

有人说：“Chip so hot it ghosts users。”——芯片太烫了，都开始已读不回了。

还有人已经给OpenAI设计了芯片周边，T恤上印着一颗辣椒，下面写着"Silicon Verde"。

你看，每次科技圈搞出大动静，网友们的反应永远是最真实的温度计。他们用幽默消化焦虑，用段子表达期待。

但笑归笑，焦虑是真的。

9个月造芯片。AI自己参与芯片设计。推理成本砍半。全栈掌控。"去英伟达化"大潮。

每一条单拎出来都是大新闻，加在一起就是一场正在加速的变革。

Jalapeño，哈拉贝诺辣椒。

又辣又快。

而我们所有人，都在这口锅里。

OpenAI造出了自己的芯片——9个月流片，成本砍半，英伟达的饭碗还稳吗？

博通CEO亲自递过来一颗辣椒，奥特曼接住了

9个月，从零到流片

训练是一次性投入，推理是每天的天文数字

性能到底行不行？博通CEO敢说"媲美英伟达"

全栈掌控：奥特曼的棋盘比你想象的大

“去英伟达化”：所有人都想自己造芯片

对普通人来说，这意味着什么？

又辣又快

最新新闻

日新闻

周新闻

月新闻

博通CEO亲自递过来一颗辣椒，奥特曼接住了

9个月，从零到流片

训练是一次性投入，推理是每天的天文数字

性能到底行不行？博通CEO敢说"媲美英伟达"

全栈掌控：奥特曼的棋盘比你想象的大

“去英伟达化”：所有人都想自己造芯片

对普通人来说，这意味着什么？

又辣又快

相关新闻

从CTF到实战：构建网络安全全栈攻防训练体系

3分钟打造你的英雄联盟智能助手：Seraphine全方位游戏体验升级指南

分离图C*-代数与类型半群：组合数学与算子代数的双向桥梁

最新新闻

日新闻

周新闻

月新闻