周三,OpenAI终于把自己的第一款定制芯片拿了出来给人看。这款叫Jalapeño的推理处理器,是OpenAI跟Broadcom一块设计、一块造出来的。公司说,这颗芯片是专门针对OpenAI推理系统的需求定制的,而且开发过程中,OpenAI自己的AI模型也参与了芯片的设计工作。
目前Jalapeño还在测试阶段,但OpenAI透露说,早期测试结果显示,它的性能功耗比要比目前业界最先进的方案强不少。这话听着有点虚,但考虑到OpenAI的体量,他们确实有底气这么说。

为什么要自己造芯片?
这件事其实传了很久。OpenAI跟Broadcom的合作关系去年10月就正式公布了,但OpenAI要自研芯片的传闻,早在2025年初就开始到处飞。最核心的动机很简单:他们不想被英伟达牵着鼻子走。
现在训练大模型、跑大模型,全得用英伟达的GPU。算力需求越大,OpenAI交给英伟达的钱就越多。自己造芯片,哪怕只能替代一部分英伟达的GPU,长期来看也能省下不少钱,更重要的是,不用再看英伟达的脸色。
OpenAI总裁Greg Brockman在去年10月的一期官方播客里说过一段话,大意是:”我们对自己要跑的工作负载有很深的理解。我们一直在找那些现有方案服务不够好的特定场景,然后想办法造出能加速这些场景的东西。”
Jalapeño能干嘛?不能干嘛?
先说清楚,Jalapeño不是用来训练大模型的。它的定位很明确:专门做推理(inference)。也就是用户发一条指令,模型给出回答这个过程。OpenAI在公告里特别强调了这颗芯片在跑实时编程模型时的低成本表现。
像预训练这种特别吃算力的活,短期内估计还是得靠英伟达的硬件。但推理成本的优化,对OpenAI的财务来说可能是个大事情。每次用户问ChatGPT一个问题,OpenAI都要付一次推理成本。如果能把这部分成本降下来,哪怕只降一点点,积少成多,对公司的盈亏平衡会有不小的影响。
不是只有OpenAI在这么干
自研AI芯片这件事,OpenAI不是第一个,也不会是最后一个。Google有自己的TPU(张量处理单元),亚马逊有Trainium,这些都是为了同一个目的:加速机器学习工作负载,减少对英伟达的依赖。
但OpenAI这次做的,跟Google和亚马逊还不太一样。Google和亚马逊主要是给自己云服务里的客户用,OpenAI造这颗芯片,首要任务是服务自己的产品和模型。Codex、GPT系列,这些产品的推理需求,OpenAI比任何人都清楚。自己造芯片,等于把优化的主动权拿在了自己手里。
OpenAI在公告里说了一段挺有意思的话:
“OpenAI不仅在开发前沿模型或在模型之上构建产品,我们还在设计支撑这些模型的基础设施:芯片架构、内核、内存系统、网络、调度、部署系统,以及产品体验。因为OpenAI在整个技术栈上都有布局,每一层都可以围绕同一个目标进行优化:让模型更快、更可靠、对用户更便宜。”
这段话翻译过来就是:我们不想只做软件,硬件我们也要自己搞。从最底层的芯片,到最上层的产品体验,全都要打通。
Jalapeño这个名字…
最后说个题外话,这颗芯片的名字Jalapeño(哈雷佩尼奥),是一种墨西哥辣椒。OpenAI给项目起名字一直挺随意的,之前GPT系列的内部代号也全是这种风格。至少比叫”OpenAI Chip 1.0″有意思多了。
这颗芯片目前还在测试,什么时候能大规模用上,OpenAI没说。但方向已经很明确了:以后的OpenAI,不仅卖模型、卖订阅,还要卖自己造的芯片跑出来的推理能力。英伟达估计不太乐意看到这个局面。
发表回复