标签: Broadcom

  • OpenAI拿出第一块自己的AI芯片,代工的是Broadcom

    OpenAI Jalapeño AI芯片
    OpenAI首款定制AI推理芯片Jalapeño(概念图)

    昨天OpenAI办了个小仪式,Broadcom的CEO Hock Tan亲自把第一块Jalapeño芯片交到了Sam Altman和Greg Brockman手里。这块芯片的全名很长——OpenAI Intelligence Processor,代号Jalapeño——是OpenAI第一次真正拥有自己名字的定制AI推理处理器。

    这件事的意义不只是”OpenAI做了块芯片”这么简单。它意味着这家公司正在把掌控权从Nvidia手里往自己这边挪一步。

    为什么是现在

    OpenAI和Broadcom的合作关系去年10月就公布了,但芯片真正亮相还是这两天的事。根据OpenAI官方的说法,从设计到送厂制造(tape-out),整个过程只用了9个月。他们说自己用AI模型辅助了芯片设计,所以才能跑这么快。

    如果这个数字属实,这确实是高性能半导体行业里最快的ASIC开发周期之一。通常这种级别的芯片从设计到出炉要走两三年,OpenAI说自己9个月搞定了,里面有它自己模型的功劳——用AI设计AI芯片,这个逻辑闭环很有意思。

    Jalapeño不是一块通用加速卡,它是从零开始为大型语言模型推理设计的。用OpenAI硬件项目负责人Richard Ho的话说:”我们围绕对前沿AI模型推理需求的理解,从头优化了架构。”

    它到底强在哪里

    OpenAI目前给出的最核心数据是:性能功耗比(performance per watt)大幅优于当前业界最先进水平。具体好多少,他们说要等几个月后的技术报告才会披露。

    目前Jalapeño的工程样品已经在实验室里跑起来了,生产目标频率和功耗都达标,跑的负载包括GPT-5.3-Codex-Spark。这块芯片的设计思路是减少数据搬运(data movement),同时把计算、内存和网络资源平衡好,让实际利用率尽量接近理论峰值。

    专门做推理,不是训练。这个定位很清晰——预训练这种最吃算力的任务短期内还是会跑在Nvidia的GPU上,但推理侧的成本优化空间巨大,哪怕只省个10-20%,对OpenAI这种规模的运营来说都是真金白银。

    全栈叙事

    OpenAI在这波宣传里反复强调的一个词是”full stack”——全栈。他们的逻辑是:不光做模型,不光做产品,现在连芯片架构、内核、内存系统、网络、调度、部署系统全部自己设计,每一层都围绕同一个目标优化:让模型更快、更可靠、更便宜。

    这个叙事其实和Google的TPU、Amazon的Trainium是一个路子。这些公司都发现,与其完全依赖Nvidia,不如自己掌握一部分算力供应链。区别在于,OpenAI是纯软件公司起家,现在往硬件走,这个跨越比Google和Amazon都要大。


    接下来怎么铺

    Jalapeño只是第一代。OpenAI和Broadcom签的是multi-generation路线图,计划从2026年底开始部署到吉瓦级(gigawatt scale)的数据中心,合作方包括Microsoft和其他伙伴。

    Broadcom的CEO Hock Tan在声明里说:”这只是多代路线图的第一步。通过和OpenAI直接联合开发我们的领先硅片,我们能让吉瓦级数据中心从2026年开始部署。”

    吉瓦级是个什么概念?大概是一个中等城市的总用电功率。把AI数据中心做到这个规模,算力供给确实是个核心瓶颈,这也是为什么OpenAI要自己下场做芯片。

    这块芯片目前还在测试阶段,离大规模部署还有段时间。但它传递的信号很明确:OpenAI不想在算力这件事上完全被人卡脖子,哪怕这个”人”是Nvidia。

  • OpenAI拿出第一块芯片,起名Jalapeño





    OpenAI拿出第一块芯片,起名Jalapeño


    OpenAI拿出第一块芯片,起名Jalapeño

    ChatGPT背后的公司不再满足于只做模型和应用,它们要自己做芯片了。OpenAI今天跟Broadcom一起发布了第一块专属AI推理芯片,名字叫Jalapeño(jalapeño,墨西哥辣椒)。从宣布合作到芯片出炉,只用了9个月。


    9个月干完别人几年的活

    OpenAI在今天(6月24日)的官方公告里说,Jalapeño是专门给大型语言模型推理设计的加速器芯片。推理(inference)指的是模型已经训练好之后,拿来响应真实用户请求的过程——你在ChatGPT里打字,后端模型跑起来给你答案,这一步就是推理。

    这块芯片是ASIC,全称Application-Specific Integrated Circuit,说白了就是为特定任务定制的电路,不像通用CPU那样什么都能跑但什么都不精。Jalapeño从零开始就是为LLM推理优化的,内存搬运、计算单元、网络连接,全部围绕同一个目标:让ChatGPT的回答更快、更便宜、更稳。

    OpenAI总裁Greg Brockman说:”世界正在走向算力驱动的经济。Jalapeño是我们长期全栈基础设施战略的一部分,目标是让算力变得更充裕,AI更快、更可靠、更便宜。”

    最让人意外的是速度。从初始设计到制造tape-out(芯片设计定稿、送厂生产),Jalapeño只用了9个月。OpenAI说这是高性能半导体行业有史以来最快的ASIC开发周期。他们用了自己的AI模型来加速设计和优化流程——换句话说,AI帮人类把造AI芯片的速度提上去了。

    性能能对标英伟达吗

    Broadcom CEO Hock Tan在接受路透社采访时直接放话:Jalapeño的性能跟英伟达Blackwell芯片和谷歌TPU(张量处理单元)在一个水平上。当然,”在水平上”这个说法留了余地,毕竟Blackwell是目前市面上最强的AI训练/推理芯片之一。

    OpenAI自己在公告里措辞更谨慎一些:早期测试显示Jalapeño的每瓦性能会大幅优于当前最先进的水平,但具体数据要等几个月后的技术报告。眼下工程样品已经在实验室里跑起了生产目标频率下的ML工作负载,包括GPT-5.3-Codex-Spark。

    OpenAI Jalapeño AI推理芯片
    OpenAI首款AI推理芯片Jalapeño(图源:OpenAI官方)

    这块芯片的设计思路值得说一下。它不是把现有AI加速器修修改改拿来用,而是从空白画布开始,完全围绕LLM推理的需求重新设计。具体来说,它减少了数据在芯片内部搬来搬去的开销(数据搬运是AI芯片最大的功耗和延迟来源之一),并且在计算、内存、网络之间做了精细的平衡,让实际利用率更接近理论峰值。

    为什么要自己造芯片

    答案很简单:英伟达的GPU不够用,而且贵。OpenAI每年在算力上的开支是笔天文数字,随着用户量增长和模型变大,这笔账单只会越来越厚。自己造芯片,长期来看能把成本压下来,也能按照自己的节奏和需求迭代,不用完全看英伟达的脸色。

    这条路上OpenAI不是独一家。微软、Meta、亚马逊都已经在自研AI芯片了,谷歌的TPU更是跑了快十年。差别在于,OpenAI的芯片从第一天就是围绕着它自己对未来模型路线图的理解来设计的——它知道自己下一步要做什么模型,知道这些模型在推理的时候会怎么跑,所以可以直接在芯片架构层面做优化。

    这就是OpenAI说的”全栈优势”:不只是做模型,不只是做产品,而是把芯片架构、内核、内存系统、网络、调度、部署和产品体验全部捏在自己手里。每一层都可以为同一个目标优化:让模型更快、更可靠、更便宜。

    今年年底开始部署

    OpenAI说Jalapeño是”多代计算平台的第一步”,计划2026年底之前开始部署,和微软等数据中心合作伙伴一起,在千兆瓦级别的数据中心里跑起来。Broadcom负责芯片实现和网络技术,Celestica负责主板、机架和系统整合。

    对于普通用户来说,这块芯片的影响不会直接看到——你不会在笔记本电脑里装上Jalapeño。但它会让ChatGPT的响应更快,让Codex能跑更长的任务而不超时,让API的价格继续往下走。OpenAI的算盘是:更好的基础设施→更高的效率→更好的模型→更好的产品→更多用户→更多收入→再投到下一代基础设施里。这个飞轮转起来,智能就会变得越来越便宜,越来越普及。

    Jalapeño只是开始。OpenAI和Broadcom已经在一起规划下一代、下下一代的芯片了。AI算力这场军备竞赛,现在从模型层打到了芯片层,而OpenAI刚刚亲手把棋子放上了棋盘。