
美东时间2026年6月24日,OpenAI和博通站在一起,揭开了业界等待已久的第一款自研AI推理芯片——Jalapeño(哈拉贝诺辣椒)。这块芯片不只是OpenAI从”纯模型公司”向”全栈AI基础设施提供商”转型的里程碑,更意味着AI芯片市场的格局要被重写一次。
9个月流片,AI公司造芯片的新速度
设计一块ASIC芯片,行业常规操作是花1.5到2年。Jalapeño从初始设计到制造流片,只用了9个月。OpenAI硬件主管Richard Ho说,关键是深度软硬件协同开发——OpenAI拿自己的前沿模型去辅助架构探索、功耗仿真和强化学习优化,博通则提供了硅实现的能力。
OpenAI总裁Greg Brockman的说法更直白:”我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。”在实验室里,Jalapeño的工程样品已经以目标频率和功耗成功跑起了GPT-5.3-Codex-Spark这类复杂的强化学习任务。早期测试下来,每瓦性能”明显好于当前最先进的AI加速器”。
Jalapeño不是通用GPU,它是一块ASIC——围绕OpenAI对大语言模型推理工作负载的深度理解,从零开始架构建出来的。架构的核心思路是减少数据移动,平衡计算、内存和网络的资源分配,让实际利用率尽量接近理论峰值。
推理成本砍半,千兆瓦部署计划
OpenAI官方的新闻稿在成本这件事上措辞谨慎,只说了”每瓦性能大幅优于当前最先进水平”,没给具体数字。但彭博社引述博通CEO陈福阳的说法是:相较当前主流AI GPU,Jalapeño能省大约50%的推理成本。
每天处理数亿次API调用和ChatGPT请求,推理成本每降一点,对OpenAI的盈利模型都是实打实的影响。按这个逻辑,50%的降幅不是小事。
陈福阳还透露,Jalapeño今年就开始跟微软和其他合作伙伴一起,部署到千兆瓦级的数据中心。他特别提到,这只是”多代路线图的起点”,OpenAI和博通的目标是一起建设吉瓦(gigawatt)级的算力集群。换句话说,如果供货跟得上,OpenAI有可能把这套硬件卖给第三方。
“去英伟达化”加速,全栈竞争白热化
这件事最直观的信号是:科技巨头集体挑战英伟达的步伐又加快了。谷歌的TPU已经商用多代,微软的Maia在推进,亚马逊的Trainium在迭代,现在OpenAI正式入局——定制AI加速器的阵营前所未有地壮大。
但OpenAI并不是要彻底甩掉英伟达。Brockman自己说过,”我们根本无法足够快地获得算力”。现在OpenAI同时在向英伟达、AWS、AMD和Cerebras多方采购芯片,Jalapeño是对爆炸性算力需求的结构性补充,不是替代方案。
- Jalapeño是一个多代计算平台的第一步,初始部署计划在2026年底前完成
- 平台将OpenAI设计的加速器、博通的芯片实现和网络技术、Celestream的电路板/机架技术整合在一起
- AI辅助设计AI芯片,从概念走向量产,这个循环一旦跑通,芯片研发的速度基准会被重新定义
Jalapeño的亮相,标志着AI产业的竞争维度发生了根本性跃迁——从单一的模型能力比拼,升级为”模型+芯片+系统+网络”的全栈基础设施竞赛。当OpenAI从GPT的开发者变成Jalapeño的设计者,这场芯片战争才刚刚拉开序幕。
发表回复