OpenAI造出了自己的芯片——9个月流片,成本砍半,英伟达的饭碗还稳吗?
博通CEO亲自递过来一颗辣椒,奥特曼接住了
2026年6月24日晚上9点10分,北京时间。
我刷着手机,看到一张照片:博通CEO陈福阳,那个在半导体行业里以"并购狂人"闻名的马来西亚华裔老头,正笑眯眯地把什么东西递到山姆·奥特曼手上。
不是合同,不是支票。
是一颗芯片。
名字叫Jalapeño——哈拉贝诺辣椒。
对,就是墨西哥菜里那种能辣到你怀疑人生的辣椒。
OpenAI给自家第一款自研AI推理芯片起了这么个名字,我第一反应是:这帮人是真不怕烫手。
但仔细想想,还真是贴切。又辣又快,又热又猛——这颗辣椒,可能真的要烧到英伟达的锅了。
9个月,从零到流片
先说一个数字:9个月。
这是什么概念?在半导体行业,一颗芯片从设计到流片(tape-out,就是送去工厂生产第一版实物芯片),通常需要2到3年。英伟达的H100,从设计到量产,花了将近两年半。谷歌的TPU迭代一代,也是按年算的。
OpenAI用了9个月。
陈福阳的原话是:“这是高性能先进半导体领域有史以来最快的ASIC开发周期。”
注意,不是"之一",是"最快"。
那问题来了:凭什么?
答案说出来你可能不信——因为ChatGPT自己参与了芯片设计。
你没看错。OpenAI在研发Jalapeño的过程中,用自己的AI模型来加速工程迭代和验证。芯片设计里那些最耗时的环节——架构模拟、参数调优、布线验证——大量交给了AI来完成。
这就有意思了。
AI帮人类设计芯片,芯片造出来又用来跑AI,AI变得更强,又帮人类设计更好的芯片。
一个闭环,转起来了。
而且转得飞快。
OpenAI总裁格雷格·布罗克曼说了一句话,我觉得是这个故事里最被低估的一句:“我们的AI模型大幅压缩了芯片研发周期,这样的效率提升超出了所有人的预期。”
翻译成人话就是:连我们自己都没想到能这么快。
这也解释了为什么OpenAI要自己造芯片——不是为了跟英伟达抢生意,而是因为当你比任何人都了解自己的工作负载时,通用芯片永远不是最优解。
训练是一次性投入,推理是每天的天文数字
接下来要说一个很多人没意识到的商业逻辑。
AI芯片分两种用途:训练和推理。
训练,就是模型"学习"的过程——消化海量数据,形成能力。这是一次性的。GPT-5训练完了就完了,不会再回头重新学一遍(至少短期内不会)。
推理,是模型"用"的过程——每一次你打开ChatGPT问个问题,模型都要实时计算,生成回答。
训练是建工厂,推理是每天开工生产。
训练是一次性的资本投入,推理是每天数亿用户持续产生的运营成本。
对于OpenAI来说,ChatGPT的月活用户已经是个天文数字。每一次对话、每一次代码生成、每一次图片理解,背后都是算力在烧钱。而这些算力,绝大部分跑在英伟达的GPU上。
英伟达的GPU是通用芯片,什么都能干,训练能干,推理也能干,图形渲染也能干。但"什么都能干"的代价是:它在任何一件事上都不是最优的。
Jalapeño不一样。它是ASIC——专用集成电路。从出生就被设计成只干一件事:跑大模型推理。
打个比方,英伟达的GPU像是一把瑞士军刀,功能多,但你拿它切菜肯定不如专用菜刀快。Jalapeño就是那把菜刀。
OpenAI的判断很简单:推理成本占我们日常支出的绝对大头。如果能用专用芯片把推理成本砍掉一半,那就是省下了一个天文数字。
没错,根据早期测试数据,Jalapeño的推理成本预计比英伟达GPU低50%。
三到五成。
你想想,OpenAI一年在算力上花多少钱?如果砍掉一半,省下来的都是利润。
这就是为什么OpenAI要造芯片。不是为了酷,是为了省钱——省着省着,就变成了赚钱。
Jalapeño芯片核心数据信息图——展示9个月流片周期、50%成本降幅、ASIC推理定位、每瓦能效超越等关键数据
性能到底行不行?博通CEO敢说"媲美英伟达"
说到这里,你肯定有一个问题:快是快,便宜是便宜,但性能到底行不行?
毕竟芯片这东西,不是PPT上画个数字就能跑的。
目前公开的信息是:博通CEO陈福阳直接表示,Jalapeño的性能可与英伟达Blackwell系列及谷歌TPU相媲美。
这句话的分量很重。陈福阳不是OpenAI的人,他是博通的CEO,是合作伙伴里最懂芯片的人之一。他敢公开说"媲美",说明实验室数据确实拿得出手。
而且早期测试还显示了一个关键指标:每瓦能效大幅超越当前市面顶尖算力产品。
"每瓦能效"是什么意思?就是每消耗一度电,能产出多少算力。这个指标比单纯的"峰值算力"重要得多——因为AI推理最大的瓶颈不是算力不够,而是电费太贵、散热跟不上。
Jalapeño围绕大模型的算力、内存、网络调度做了架构级的优化,大幅减少了数据搬运过程中的损耗,硬件利用率贴近理论峰值。简单说就是:同样的电,干更多的活。
目前,实验室的工程样片已经稳定运行GPT-5.3-Codex-Spark等前沿模型。这不是跑个benchmark刷分,是真的在跑自家的生产级模型。
当然,我也得说一句公道话:实验室数据和大规模量产数据之间,还有很长的路。很多芯片倒在了从实验室到数据中心的路上。Jalapeño计划2026年底完成首批小规模部署,2027年产能爬坡,2028年上半年全面规模化量产。
也就是说,真正的大考,还没开始。
全栈掌控:奥特曼的棋盘比你想象的大
如果你觉得OpenAI造芯片只是为了省钱,那你低估奥特曼了。
让我把时间线拉长一点。
OpenAI和博通的合作,早在18个月前就启动了。2025年10月对外官宣。在那之前,OpenAI还跟AI芯片公司Cerebras有过接触,积累定制芯片的认知。
这不是一时兴起,是蓄谋已久。
布罗克曼的原话透露了更多:“我们不仅在开发前沿模型,也在构建其上的产品;更重要的是,我们正在设计它们之下的基础设施——包括芯片架构、内核、内存系统、网络、调度、部署系统乃至产品体验。”
你把这句话拆开看:
模型——OpenAI在做(GPT系列)。产品——OpenAI在做(ChatGPT、Sora、API)。芯片架构——OpenAI在做(Jalapeño)。内核——OpenAI在做。内存系统——OpenAI在做。网络——OpenAI在做。调度系统——OpenAI在做。部署系统——OpenAI在做。产品体验——OpenAI在做。
从最底层的硅片,到最顶层的用户体验,OpenAI要把每一层都攥在自己手里。
这不是一家AI公司的做法,这是一家"全栈计算公司"的做法。
而且别忘了,搭载Jalapeño芯片的计算机系统,大部分硬件架构也是OpenAI自主设计的。他们不光造芯片,连服务器整机都自己搞。
布罗克曼还有一句话说得很透彻:“通过自主研发更多底层技术环节,我们可以用更高效率提供智能服务。”
翻译一下:我们的模型我们自己最懂,我们的负载我们自己最清楚,那为什么不连跑模型的硬件也自己做?
这是一个正向循环:模型越强,对推理负载的理解越深,芯片设计越精准,推理成本越低,能服务更多用户,积累更多数据,模型更强。
转起来了,而且是加速转。
OpenAI全栈技术栈示意图——从芯片架构、内核、内存系统到模型、产品、用户体验的垂直整合图谱
“去英伟达化”:所有人都想自己造芯片
OpenAI不是第一个造自研AI芯片的,但可能是最受关注的一个。
我们来盘点一下。
谷歌——TPU系列,从2016年就开始搞了,现在是第六代还是第七代我都有点数不清了。TPU支撑了谷歌从搜索到Gemini的全部AI推理。
亚马逊——Trainium系列,2023年开始推,去年底已经大规模部署在AWS上。亚马逊的逻辑跟OpenAI一样:我自己的云上跑着无数AI推理请求,凭什么给英伟达交税?
微软——去年发布了自己的AI加速芯片Maia,专门给Azure上的AI服务用。
Meta——也有自己的AI芯片,MTIA系列,主打推荐系统的推理。
现在OpenAI也加入了。
你看明白了吗?所有AI巨头,都在做同一件事:去英伟达化。
不是因为他们讨厌黄仁勋,而是因为英伟达的GPU太贵了,而且供不应求——你想买还不一定买得到。
陈福阳说了一句话,我觉得是整个行业现状最好的注脚:“现有产能完全无法满足市场需求,算力紧缺不止会持续2026、2027年,预计2028年行业算力需求还会继续攀升。”
2028年还在涨。这意味着谁手里有自研芯片,谁就掌握了算力自主权。
英伟达的饭碗还稳吗?
短期看,当然稳。英伟达的CUDA生态、通用GPU的灵活性、以及训练市场的统治力,不是一朝一夕能撼动的。博通股价从2022年末至今涨了近7倍,2026年以来累计上涨10%,但英伟达同期涨得更多。
但长期看,趋势很明确:推理市场正在被各家自研芯片蚕食。而推理,恰恰是AI计算市场中增长最快、体量最大的那块蛋糕。
有意思的是,OpenAI也不是把鸡蛋全放在一个篮子里。他们跟亚马逊云达成了合作,可以用Trainium芯片;也跟AMD、思博睿签了算力合作协议。自研加外采,双保险。
毕竟,谁也不想被一家供应商卡脖子。
全球巨头"去英伟达化"芯片自研版图——谷歌TPU、亚马逊Trainium、微软Maia、Meta MTIA、OpenAI Jalapeño的布局对比
对普通人来说,这意味着什么?
说了这么多行业格局,回到最开始的问题:这跟你我有什么关系?
关系大了。
还记得那个50%的推理成本降幅吗?
推理成本降低,意味着AI服务可以更便宜。更便宜意味着更多人用得起AI。
用OpenAI自己的话说:“如果AI能帮工程师更快设计出更好的芯片,就可以降低整个行业的计算成本,帮助普及先进AI的使用权限。”
这句话不是场面话。它指向一个真实的趋势:AI算力的成本曲线,正在往下走。
你想想,今天ChatGPT Plus一个月20美元,如果推理成本砍一半,是不是可以降到10美元?或者保持20美元但给两倍的用量?或者免费用户也能享受到更多功能?
再往远想:当AI推理便宜到几乎不花钱的时候,会发生什么?
每一个App都可以内置AI,每一个网站都可以有智能助手,每一个中小企业都能用上大模型。AI不再是巨头的特权,而是像水电一样的基础设施。
而这一切的起点,可能就是那颗叫Jalapeño的辣椒。
还有一层更深远的影响:AI造芯片这个闭环。
如果ChatGPT能帮OpenAI在9个月内造出芯片,那同样的方法论能不能复制到其他领域?AI帮设计新药、AI帮设计新材料、AI帮优化城市规划。
当AI开始加速AI自身的迭代,我们可能正在进入一个加速循环的时代。
这个时代会多快?我不知道。但Jalapeño给出的信号是:比我们以为的要快。
又辣又快
文章写到最后,我刷了一下评论区。
有人调侃:“又辣又快,犹如我的焦虑。”
有人说:“Chip so hot it ghosts users。”——芯片太烫了,都开始已读不回了。
还有人已经给OpenAI设计了芯片周边,T恤上印着一颗辣椒,下面写着"Silicon Verde"。
你看,每次科技圈搞出大动静,网友们的反应永远是最真实的温度计。他们用幽默消化焦虑,用段子表达期待。
但笑归笑,焦虑是真的。
9个月造芯片。AI自己参与芯片设计。推理成本砍半。全栈掌控。"去英伟达化"大潮。
每一条单拎出来都是大新闻,加在一起就是一场正在加速的变革。
Jalapeño,哈拉贝诺辣椒。
又辣又快。
而我们所有人,都在这口锅里。