OpenAI首款自研芯片Jalapeño曝光：不再完全依赖英伟达

作者：

在

周三，OpenAI终于把自己的第一款定制芯片拿了出来给人看。这款叫Jalapeño的推理处理器，是OpenAI跟Broadcom一块设计、一块造出来的。公司说，这颗芯片是专门针对OpenAI推理系统的需求定制的，而且开发过程中，OpenAI自己的AI模型也参与了芯片的设计工作。

目前Jalapeño还在测试阶段，但OpenAI透露说，早期测试结果显示，它的性能功耗比要比目前业界最先进的方案强不少。这话听着有点虚，但考虑到OpenAI的体量，他们确实有底气这么说。

这件事其实传了很久。OpenAI跟Broadcom的合作关系去年10月就正式公布了，但OpenAI要自研芯片的传闻，早在2025年初就开始到处飞。最核心的动机很简单：他们不想被英伟达牵着鼻子走。

现在训练大模型、跑大模型，全得用英伟达的GPU。算力需求越大，OpenAI交给英伟达的钱就越多。自己造芯片，哪怕只能替代一部分英伟达的GPU，长期来看也能省下不少钱，更重要的是，不用再看英伟达的脸色。

OpenAI总裁Greg Brockman在去年10月的一期官方播客里说过一段话，大意是：”我们对自己要跑的工作负载有很深的理解。我们一直在找那些现有方案服务不够好的特定场景，然后想办法造出能加速这些场景的东西。”

先说清楚，Jalapeño不是用来训练大模型的。它的定位很明确：专门做推理（inference）。也就是用户发一条指令，模型给出回答这个过程。OpenAI在公告里特别强调了这颗芯片在跑实时编程模型时的低成本表现。

像预训练这种特别吃算力的活，短期内估计还是得靠英伟达的硬件。但推理成本的优化，对OpenAI的财务来说可能是个大事情。每次用户问ChatGPT一个问题，OpenAI都要付一次推理成本。如果能把这部分成本降下来，哪怕只降一点点，积少成多，对公司的盈亏平衡会有不小的影响。

自研AI芯片这件事，OpenAI不是第一个，也不会是最后一个。Google有自己的TPU（张量处理单元），亚马逊有Trainium，这些都是为了同一个目的：加速机器学习工作负载，减少对英伟达的依赖。

但OpenAI这次做的，跟Google和亚马逊还不太一样。Google和亚马逊主要是给自己云服务里的客户用，OpenAI造这颗芯片，首要任务是服务自己的产品和模型。Codex、GPT系列，这些产品的推理需求，OpenAI比任何人都清楚。自己造芯片，等于把优化的主动权拿在了自己手里。

OpenAI在公告里说了一段挺有意思的话：

“OpenAI不仅在开发前沿模型或在模型之上构建产品，我们还在设计支撑这些模型的基础设施：芯片架构、内核、内存系统、网络、调度、部署系统，以及产品体验。因为OpenAI在整个技术栈上都有布局，每一层都可以围绕同一个目标进行优化：让模型更快、更可靠、对用户更便宜。”

这段话翻译过来就是：我们不想只做软件，硬件我们也要自己搞。从最底层的芯片，到最上层的产品体验，全都要打通。

最后说个题外话，这颗芯片的名字Jalapeño（哈雷佩尼奥），是一种墨西哥辣椒。OpenAI给项目起名字一直挺随意的，之前GPT系列的内部代号也全是这种风格。至少比叫”OpenAI Chip 1.0″有意思多了。

这颗芯片目前还在测试，什么时候能大规模用上，OpenAI没说。但方向已经很明确了：以后的OpenAI，不仅卖模型、卖订阅，还要卖自己造的芯片跑出来的推理能力。英伟达估计不太乐意看到这个局面。

评论