
昨天OpenAI办了个小仪式,Broadcom的CEO Hock Tan亲自把第一块Jalapeño芯片交到了Sam Altman和Greg Brockman手里。这块芯片的全名很长——OpenAI Intelligence Processor,代号Jalapeño——是OpenAI第一次真正拥有自己名字的定制AI推理处理器。
这件事的意义不只是”OpenAI做了块芯片”这么简单。它意味着这家公司正在把掌控权从Nvidia手里往自己这边挪一步。
为什么是现在
OpenAI和Broadcom的合作关系去年10月就公布了,但芯片真正亮相还是这两天的事。根据OpenAI官方的说法,从设计到送厂制造(tape-out),整个过程只用了9个月。他们说自己用AI模型辅助了芯片设计,所以才能跑这么快。
如果这个数字属实,这确实是高性能半导体行业里最快的ASIC开发周期之一。通常这种级别的芯片从设计到出炉要走两三年,OpenAI说自己9个月搞定了,里面有它自己模型的功劳——用AI设计AI芯片,这个逻辑闭环很有意思。
Jalapeño不是一块通用加速卡,它是从零开始为大型语言模型推理设计的。用OpenAI硬件项目负责人Richard Ho的话说:”我们围绕对前沿AI模型推理需求的理解,从头优化了架构。”
它到底强在哪里
OpenAI目前给出的最核心数据是:性能功耗比(performance per watt)大幅优于当前业界最先进水平。具体好多少,他们说要等几个月后的技术报告才会披露。
目前Jalapeño的工程样品已经在实验室里跑起来了,生产目标频率和功耗都达标,跑的负载包括GPT-5.3-Codex-Spark。这块芯片的设计思路是减少数据搬运(data movement),同时把计算、内存和网络资源平衡好,让实际利用率尽量接近理论峰值。
专门做推理,不是训练。这个定位很清晰——预训练这种最吃算力的任务短期内还是会跑在Nvidia的GPU上,但推理侧的成本优化空间巨大,哪怕只省个10-20%,对OpenAI这种规模的运营来说都是真金白银。
全栈叙事
OpenAI在这波宣传里反复强调的一个词是”full stack”——全栈。他们的逻辑是:不光做模型,不光做产品,现在连芯片架构、内核、内存系统、网络、调度、部署系统全部自己设计,每一层都围绕同一个目标优化:让模型更快、更可靠、更便宜。
这个叙事其实和Google的TPU、Amazon的Trainium是一个路子。这些公司都发现,与其完全依赖Nvidia,不如自己掌握一部分算力供应链。区别在于,OpenAI是纯软件公司起家,现在往硬件走,这个跨越比Google和Amazon都要大。
接下来怎么铺
Jalapeño只是第一代。OpenAI和Broadcom签的是multi-generation路线图,计划从2026年底开始部署到吉瓦级(gigawatt scale)的数据中心,合作方包括Microsoft和其他伙伴。
Broadcom的CEO Hock Tan在声明里说:”这只是多代路线图的第一步。通过和OpenAI直接联合开发我们的领先硅片,我们能让吉瓦级数据中心从2026年开始部署。”
吉瓦级是个什么概念?大概是一个中等城市的总用电功率。把AI数据中心做到这个规模,算力供给确实是个核心瓶颈,这也是为什么OpenAI要自己下场做芯片。
这块芯片目前还在测试阶段,离大规模部署还有段时间。但它传递的信号很明确:OpenAI不想在算力这件事上完全被人卡脖子,哪怕这个”人”是Nvidia。
