上周,OpenAI和博通站到一起,揭开了代号「Jalapeño」的AI推理芯片。这块芯片从设计到流片只用了9个月,而行业常规节奏是18到24个月。OpenAI用自己的模型辅助架构探索、功耗仿真和布局优化,等于「AI设计AI芯片」从概念走成了实物。

为什么是推理芯片,不是训练芯片
Jalapeño定位很清晰——它专门跑推理,也就是用户发请求、模型输出回答这个环节。训练那边暂时还是英伟达GPU的天下,但推理成本占了OpenAI运营开支的大头,每天数亿次API调用和ChatGPT请求,每省一分钱都是真金白银。
据彭博社援引内部测试数据,Jalapeño相比当前主流AI GPU,推理成本能降约50%。这个数字如果属实,对OpenAI的盈利模型意味着什么,不难想象。
「我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。」——OpenAI总裁Greg Brockman
全栈竞赛,不只是模型能力的比拼
这件事更大的信号在于,AI公司的竞争维度正在切换。谷歌有TPU,亚马逊有Trainium,微软有Maia,现在OpenAI也正式入局自研芯片。大家都在做同一件事:把「模型+芯片+系统+网络」打包成自己的全栈能力,而不是只租英伟达的卡。
但OpenAI并没有打算彻底甩开英伟达。Brockman自己说得很直白:「我们根本无法足够快地获得算力。」Jalapeño是对爆炸式算力需求的结构性补充,不是替代。OpenAI同时在向英伟达、AMD、Cerebras多方采购,Jalapeño只是其中一块拼图。
千兆瓦部署,多代路线图
博通CEO陈福阳透露,Jalapeño将于今年开始在千兆瓦级数据中心部署,合作伙伴包括微软。他强调这只是「多代路线图的起点」,OpenAI和博通的目标是共建吉瓦级算力集群。
芯片细节方面,Jalapeño被归类为ASIC(专用集成电路),架构围绕大语言模型推理负载从零设计,核心思路是降低数据移动开销、平衡计算-内存-网络的资源分配。OpenAI表示,工程样品已以目标频率成功运行GPT-5.3-Codex-Spark等复杂强化学习任务,早期测试显示每瓦性能「显著优于当前最先进的AI加速器」。
详细的性能技术白皮书将在未来数月内发布。对于盯着AI基础设施赛道的人来说,Jalapeño的实测数据值得等。
发表回复