分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • Google的AI大牛们正在集体出走,Anthropic和OpenAI疯狂捡人

    Google的AI研究部门正在经历一轮令人不安的人才流失。根据彭博社的报道,顶级AI研究人员Jonas Adler和Alexander Pritzel已经决定离开Google,加盟Anthropic。这两个名字你可能不太熟悉,但他们都是Google Gemini模型开发过程中的核心人物。

    一周之内,连续出走

    这已经不是偶然事件了。就在上周,传奇AI研究员Noam Shazeer刚刚宣布离开Google、加入OpenAI。Shazeer在Google的资历极深——2000年就加入了,中间出去创立了Character.AI(那个做AI聊天伴侣的创业公司),后来Google花了27亿美元把Character.AI的人才和技术基本整个买了回来,目的就是把Shazeer弄回来主导Gemini项目。

    AI研究人员从Google流向Anthropic和OpenAI
    顶级AI研究人员正从Google流向Anthropic和OpenAI | 来源:TechCrunch

    结果人刚回来没多久,又要走。而且这次不是一个人——就在Shazeer官宣之后几天,DeepMind的总监John Jumper也宣布离职去Anthropic。Jumper可不是普通研究员,他和DeepMind CEO Demis Hassabis一起拿了2024年的诺贝尔化学奖,获奖理由是用AlphaFold预测蛋白质三维结构,这项技术对整个生物界都有颠覆性意义。

    一个诺贝尔化学奖得主、一个Gemini核心架构师、一个Character.AI创始人——这些人短时间内接连离开,对任何一家公司来说都是值得警惕的信号。

    为什么是现在

    时机很微妙。OpenAI和Anthropic都在准备IPO,这对于顶尖AI人才来说是一个极具吸引力的时刻——用股权来抢人,这种手段在硅谷从来都好使。相比之下,Google的薪资福利虽然依然顶级,但股票增值的想象空间跟一家即将上市的公司能给出的期权比起来,确实没那么性感了。

    还有一个更深层的问题:Google内部对AI研究方向的控制和优先级排序,可能让一些研究员感到受限。Anthropic主打AI安全研究,OpenAI虽然争议不断但至少在推进AGI路线上目标明确。如果研究员觉得自己在Google做不了最想做的东西,出走只是时间问题。

    这对Google意味着什么

    短期来看,Gemini项目不会因为几个人离开就垮掉——Google的资源和人才储备依然深厚。但长期来看,如果这种顶级人才持续外流的趋势不能遏止,Google在大模型竞赛中的技术领先地位就会被一点点蚕食。

    更关键的是,Anthropic和OpenAI正在形成某种人才”黑洞效应”——越多顶级研究员过去,对那些还在犹豫的人吸引力就越强。Google现在需要认真想想,除了钱之外,还能给这些最顶尖的脑子提供什么他们真正想要的东西。


  • Google DeepMind砸7500万美元押注A24,AI开始认真搞定莱坞

    硅谷和好莱坞的边界又模糊了一层。Google DeepMind本周一宣布向独立电影公司A24投资7500万美元,双方要一起给电影人做AI工具。A24这个名字你可能不陌生——《瞬息全宇宙》《波拉特2》《Backrooms》都是他们的作品,走的是那种不太商业但很能打的路子。

    Demis Hassabis亲自出面

    DeepMind的CEO兼联合创始人Demis Hassabis在新闻稿里说了一句话,大意是:要做出真正能帮到创作者的工具,最好的办法就是跟创作者直接合作。这次合作被双方称为”首创性”的联盟,Google DeepMind会从中获得一线艺术家的反馈和指导,反过来为电影制作流程开发AI功能。

    Google DeepMind与A24达成AI影视合作
    Google DeepMind投资A24,AI正式进军好莱坞影视制作 | 来源:TechCrunch

    Hassabis这句话其实挺值得玩味的。过去两年,好莱坞对AI的态度可以用”又爱又恨”来形容——爱的是它确实能省成本、提效率,恨的是大家搞不清楚这东西到底会不会抢走自己的饭碗,再加上去年编剧工会大罢工,AI成了绕不开的敏感词。

    A24不是第一个吃螃蟹的

    但A24远非第一个在AI影视工具上押注的玩家。今年早些时候,Netflix宣布收购了本·阿弗莱克创办的AI工具公司InterPositive,这家公司专门给电影人做AI辅助制作工具。去年,亚马逊的MGM工作室也组了一个AI单元,目标同样是给电影和电视制作开发工具。

    好莱坞的AI军备竞赛已经开始了,只是这次的战场不在特效,而在创作工具链。

    A24最近跟Timothée Chalamet和Anne Hathaway等一线明星都有合作项目,这次拿到Google DeepMind的投资,显然是想在AI辅助创作这条路上走得更前面。对于一家以”独立””作者性”闻名的制片公司来说,主动拥抱AI工具这个决定本身就需要一点勇气。

    7500万美元能买到什么

    目前双方公开的细节并不多,只知道会共同开发面向电影制作的AI工具,具体是剧本分析、预可视化、后期制作还是发行营销,暂时还不清楚。但DeepMind在生成式AI和多模态模型上积累的技术,如果真的能无缝接入电影制作流程,想象空间确实不小。

    对Google来说,这笔投资的意义可能不止于”做工具卖钱”。A24在年轻创作者和影迷群体里的影响力不小,如果DeepMind的技术能在一部叫好又叫座的作品里刷个脸,对Google AI在整个创意产业的品牌认知会是很强势的背书。


  • 近400家地方报纸联名起诉OpenAI和微软:AI版权大战烧到地方媒体

    OpenAI和微软又被告了。这一次站出来的是将近400家地方报纸,他们6月24日在纽约南区联邦法院提交了诉状,指控这两家公司在未经许可、未支付任何报酬的情况下,爬取并复制了他们的新闻报道,用来训练ChatGPT和微软Copilot。

    地方报纸起诉AI公司
    地方报纸正在发起迄今规模最大的AI版权诉讼

    “连一分钱都没给过我们”

    诉状里的话说得很重。这些生成式AI产品”靠出版商的内容成为可能”,给被告带来了数十亿美元的市场价值,但”没有一分钱流向出版商”。原告方包括Richner Communications等多家报业集团,旗下总共运营着近400家地方和区域报纸。

    具体的指控包括:被告”系统性地、秘密地”爬取了这些出版商的网站,把文章、报道和其他原创作品复制到自己的服务器上,用来训练大语言模型,同时删除了作品里的版权管理信息,并且在用户提问时直接生成了这些内容。

    “除非开发AI产品的公司为其滥用出版商内容的行为负责,否则这场AI热潮将成为地方新闻业的丧钟。”
    ——原告出版商在诉状中陈述

    地方报纸请出了前新泽西总检察长

    这起诉讼的代理律所是Platkin LLP,创始人是前新泽西州总检察长Matthew Platkin(民主党)。Platkin在采访里说,这是迄今由地方和区域报纸牵头的最大规模法律行动。

    此前针对AI公司的版权诉讼——比如《纽约时报》的案子——虽然开了先河,但地方媒体一直没有被带到谈判桌上。Platkin说:”地方新闻是美国绝大多数人信任的新闻来源,是我们民主的命脉,但这个商业模式已经让地方新闻走到了灭绝的边缘。”

    他还提到了一个公平性问题:如果这场版权大战的最终结果只让最大的玩家受益,而那些今天还在兢兢业业报道本地新闻的人得不到任何补偿,”这是不公平的”。

    OpenAI的回应:”合理使用”

    OpenAI发言人在声明里说,他们的模型”赋能创新,基于公开数据训练,符合合理使用原则”。这是OpenAI在一连串版权诉讼中的标准回应。微软方面则没有立即回复置评请求。

    这起诉讼加入了针对AI公司的一波又一波版权诉讼大潮——CNN、《纽约时报》、Reddit、韦氏词典和大英百科全书等都已经分别起诉了Perplexity AI。而这起新诉讼的目标是直接指向了这个行业里最大的两个玩家:OpenAI和微软。


    地方报纸的困境是真实的。过去二十年,随着分类广告转到互联网、读者转到社交媒体,地方报纸的商业模式已经崩塌了大半。现在AI又来了——直接把他们的内容拿去,用来回答用户的提问,读者连点开原网站的动力都没有了。

    这起诉讼能不能赢,还得看法院怎么解释”合理使用”。但至少,地方报纸终于开始抱团跟最大的AI公司正面对抗了。

  • 都说AI要取代程序员,数据却显示工程师比谁都抢手

    AI到底有没有在抢程序员的饭碗?这场争论打了好几年,两边的人都能拿出一堆证据。裁员的公司说:用了AI,一个工程师能干过去三个人的活。但风投机构SignalFire刚出的一份报告,给了这个问题一个挺不一样的答案。

    AI与软件工程
    AI到底是在替代工程师,还是在让他们变得更高效?

    裁员理由写的是AI,但招人数据说的不是一回事

    SignalFire不是拍脑袋得出结论的。他们追踪了8000多万家公司的数亿名员工职业生涯数据,比那些靠调查问卷得出的结论要扎实得多。他们的发现是:2025年,工程岗位是所有职能里最抗打的。

    具体数字是这样——大型科技公司的总招聘量比2019年下降了25%,但工程岗位的降幅只有11%,远低于平均水平。更有意思的是,在SignalFire定义的”科技巨头”(Alphabet、Meta、Apple、Amazon、Microsoft、Netflix、Nvidia、Tesla、Uber、Airbnb、Block、Stripe)2025年的所有新员工里,工程师占了55%。2019年这个比例是46%。

    “很多公司裁员的理由一律写AI,尤其是说AI写代码厉害了,一个工程师能顶过去好几个。但我们在实际数据里看到的情况,跟这个说法不太一样。”
    ——Asher Bantock,SignalFire研究负责人

    早期创业公司的数据更说明问题。2025年,早期初创公司招的工程师数量比2019年还多了7%。如果AI真的在替代工程师,你不会看到这个趋势。

    Anthropic自己的人都不信”AI消灭就业”这个说法

    这事儿有点尴尬。Anthropic CEO Dario Amodei去年警告说,AI有可能在五年内消灭一半的入门级白领岗位,失业率冲到20%。但他自己公司负责经济学的研究主管Peter McCrory,今年3月跟TechCrunch说的情况完全不一样。

    McCrory说,他还没看到AI对就业市场有什么明显的实质影响。用Claude干活的那些人——技术写手、数据录入员、软件工程师——和那些不太被AI影响的工作相比,失业率”至少没有显著差异”。

    黄仁勋说得更直接。今年4月在斯坦福商学院的一场访谈里,有人问他怎么看”AI要消灭所有软件工程岗位”这个说法,他直接说反了。英伟达所有工程师现在都在用AI代理写代码,结果呢?”软件工程师比以前更忙了。”

    “代理写代码几乎是一瞬间的事,但它们一直在逼工程师想出’下一个想法’。”
    ——黄仁勋,Nvidia CEO

    Jevons悖论:效率越高,需求越大

    SignalFire的报告里提到了一个经济学概念——Jevons悖论。这个19世纪就有的理论说的是:蒸汽机效率越高,英国人烧的煤反而越多,因为用煤变得更划算了,需求就扩大了。

    AI写代码这事也是一样。工程师现在用AI辅助,产出效率翻了好几倍,按理说需要的人应该变少。但实际情况是:能做的事变多了,需求反而更大了。Bantock的说法很直白:”他们突然变得效率高了很多,但活是干不完的。”

    这个逻辑其实不难理解。AI降低了写代码的门槛,也让以前不敢想的项目变得可行了,结果就是更多想法等着被实现,而不是更少。


    5月份科技行业裁员创了近年单月新高,AI是头号背锅侠。但SignalFire的数据提醒了一个被忽略的角度:公司在裁员的同时,还在抢工程师。这两件事可以同时是真的——只是被裁掉的和被招进去的,可能不是同一批人。

  • 企业AI狂欢结束,Accenture们开始严控员工用AI的”零花钱”

    企业AI预算管控
    企业开始严控AI token支出(概念图)

    今年早些时候,AI行业还在鼓励每家公司的员工尽量多用AI,把token预算花到上限,甚至搞内部排行榜来激励大家——这个现象有个名字叫”tokenmaxxing”。但现在,风向变了。

    最新的信号来自Accenture。根据404 Media获得的内部会议录音,这家全球咨询巨头的agentic AI战略负责人Justice Kwak在会上说了一句话:”AI正在成为成本结构里不可忽视的一项,支出的可预测性越来越差,CFO、COO、CIO级别的人都在问,花的钱到底值不值。”

    从”多用AI”到”省着用”

    这个转折来得很快。就在不久之前,Accenture还在内部发话,说不用AI的员工”会失去晋升机会”。现在同样这家公司,却在想办法阻止员工把token预算花光——比如用AI把PDF转成PPT这种琐碎任务,在Accenture内部已经被点名了。

    这背后的逻辑其实很朴素:token不是免费的,而且价格不便宜。一家有几万名员工的公司,如果每个人每天用AI助手处理几十条请求,一个月下来账单可以很吓人。更关键的是,很多这样的用法并没有产生对应的商业价值。

    “我们正处在一个拐点,AI正在成为成本结构中实质性的存在。支出变得非常不可预测,领导层——尤其是CFO、COO和CIO级别——仍在问一个问题:我们从AI上花的钱,到底得到了什么价值?”
    ——Justice Kwak,Accenture agentic AI战略负责人

    不只是Accenture

    Accenture不是唯一一个开始”token配给”的公司。根据The Information的报道,Meta也在采取措施限制员工使用AI工具,原因是AI成本已经达到了数十亿美元的规模。

    Amazon之前也干过类似的事——他们曾经搞过一个”tokenmaxxing排行榜”,鼓励开发者尽量多用AI工具,后来因为成本失控,这个排行榜被悄无声息地撤掉了。

    这种现象背后是一个更深层的问题:企业到底该怎么衡量AI的ROI?员工用AI确实可能提高了效率,但这个效率提升能不能覆盖AI使用的成本,很多时候是一笔糊涂账。


    token经济的泡沫信号

    企业开始严控AI支出,这个时间节点值得注意。就在这几天,资本市场出现了一波”AI抛售”——memory芯片制造商的股价受到了明显冲击。投资者正在重新评估AI公司的盈利模型,光有”增长”和”兴奋感”已经不够了。

    从企业端来看,token成本的疑问正在动摇整个AI商业模式的根基。如果连Accenture这种最积极拥抱AI的公司都在问”值不值”,那说明这个行业已经从”跑马圈地”进入了”算账”阶段。

    对员工来说,这也意味着”AI技能”的含金量正在重新定义。会用AI不等于能产生价值,能证明AI使用带来实际产出的人,才会在新一轮的”AI绩效考核”里站得住脚。

    这场从”tokenmaxxing”到”token rationing”的转变,或许是企业AI应用成熟化的必经之路。狂欢结束之后,才是真正考验的开始。

  • OpenAI拿出第一块自己的AI芯片,代工的是Broadcom

    OpenAI Jalapeño AI芯片
    OpenAI首款定制AI推理芯片Jalapeño(概念图)

    昨天OpenAI办了个小仪式,Broadcom的CEO Hock Tan亲自把第一块Jalapeño芯片交到了Sam Altman和Greg Brockman手里。这块芯片的全名很长——OpenAI Intelligence Processor,代号Jalapeño——是OpenAI第一次真正拥有自己名字的定制AI推理处理器。

    这件事的意义不只是”OpenAI做了块芯片”这么简单。它意味着这家公司正在把掌控权从Nvidia手里往自己这边挪一步。

    为什么是现在

    OpenAI和Broadcom的合作关系去年10月就公布了,但芯片真正亮相还是这两天的事。根据OpenAI官方的说法,从设计到送厂制造(tape-out),整个过程只用了9个月。他们说自己用AI模型辅助了芯片设计,所以才能跑这么快。

    如果这个数字属实,这确实是高性能半导体行业里最快的ASIC开发周期之一。通常这种级别的芯片从设计到出炉要走两三年,OpenAI说自己9个月搞定了,里面有它自己模型的功劳——用AI设计AI芯片,这个逻辑闭环很有意思。

    Jalapeño不是一块通用加速卡,它是从零开始为大型语言模型推理设计的。用OpenAI硬件项目负责人Richard Ho的话说:”我们围绕对前沿AI模型推理需求的理解,从头优化了架构。”

    它到底强在哪里

    OpenAI目前给出的最核心数据是:性能功耗比(performance per watt)大幅优于当前业界最先进水平。具体好多少,他们说要等几个月后的技术报告才会披露。

    目前Jalapeño的工程样品已经在实验室里跑起来了,生产目标频率和功耗都达标,跑的负载包括GPT-5.3-Codex-Spark。这块芯片的设计思路是减少数据搬运(data movement),同时把计算、内存和网络资源平衡好,让实际利用率尽量接近理论峰值。

    专门做推理,不是训练。这个定位很清晰——预训练这种最吃算力的任务短期内还是会跑在Nvidia的GPU上,但推理侧的成本优化空间巨大,哪怕只省个10-20%,对OpenAI这种规模的运营来说都是真金白银。

    全栈叙事

    OpenAI在这波宣传里反复强调的一个词是”full stack”——全栈。他们的逻辑是:不光做模型,不光做产品,现在连芯片架构、内核、内存系统、网络、调度、部署系统全部自己设计,每一层都围绕同一个目标优化:让模型更快、更可靠、更便宜。

    这个叙事其实和Google的TPU、Amazon的Trainium是一个路子。这些公司都发现,与其完全依赖Nvidia,不如自己掌握一部分算力供应链。区别在于,OpenAI是纯软件公司起家,现在往硬件走,这个跨越比Google和Amazon都要大。


    接下来怎么铺

    Jalapeño只是第一代。OpenAI和Broadcom签的是multi-generation路线图,计划从2026年底开始部署到吉瓦级(gigawatt scale)的数据中心,合作方包括Microsoft和其他伙伴。

    Broadcom的CEO Hock Tan在声明里说:”这只是多代路线图的第一步。通过和OpenAI直接联合开发我们的领先硅片,我们能让吉瓦级数据中心从2026年开始部署。”

    吉瓦级是个什么概念?大概是一个中等城市的总用电功率。把AI数据中心做到这个规模,算力供给确实是个核心瓶颈,这也是为什么OpenAI要自己下场做芯片。

    这块芯片目前还在测试阶段,离大规模部署还有段时间。但它传递的信号很明确:OpenAI不想在算力这件事上完全被人卡脖子,哪怕这个”人”是Nvidia。

  • 做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    AI写作和AI检测,本来像是矛和盾的关系,现在被同一家公司握在手里了。

    Superhuman收购GPTZero
    Superhuman收购AI内容检测平台GPTZero

    Superhuman(就是那个改名前的Grammarly)宣布收购GPTZero——一个专门检测AI生成内容的工具。GPTZero能做的事包括:判断一段文字是不是AI写的、检测AI幻觉(就是模型瞎编的内容)、查抄袭。

    集成到Superhuman Go

    收购之后,GPTZero会集成到Superhuman Go里。这个AI助手号称能在”100万个应用和网站”里工作,以后用户在写东西的时候,就能同时用到写作辅助和内容真实性验证两套能力。

    Superhuman的说法是,他们要做”内容真实性”的两端:一边帮用户负责任地用AI写作,一边帮用户判断读到的内容是不是AI生成的。

    教师市场仍是重点

    这个组合确实有点意思。GPTZero之前最有名的用户群体是教师——老师们用它来检测学生作业是不是用ChatGPT写的。Superhuman收购后表示,教育市场仍然是重点,会把GPTZero的工具直接嵌到用户已经在用的写作场景里。

    当然,这事在外人看来有点矛盾:你一边卖AI写作工具,一边卖AI检测工具,这不是自己打自己吗?但Superhuman的逻辑是,用户既需要AI帮助写作,也需要知道哪些内容是AI生成的——两个需求同时存在,不如都攥在自己手里。

    收购金额没披露。GPTZero会继续以独立品牌运营,Superhuman方面表示不会把它完全吞掉,而是让它继续服务已有的用户群。


  • 白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    就在各家公司争相把AI模型开放给美国政府审查的时候,Meta选了最后一个当”钉子户”。

    Meta拒绝美国政府AI审查
    白宫与Meta在AI审查问题上的博弈

    《纽约时报》的报道说,白宫官员正在向Meta施压,要求它把AI模型提交给”AI标准与创新中心”(CAISI)做安全评估。OpenAI、Anthropic、Google、xAI、微软早就签了协议,只有Meta还没松口。

    行政令背后的推力

    这事可不是突然冒出来的。6月2日,特朗普签了一份行政令,要求前沿AI模型在公开发布前,给联邦专家最多30天的时间做审查。政府这边要在7月底前把正式评审流程搭好,但其他公司实际上已经交了几个月的作业了。

    CAISI这个单位是专门找软件漏洞、防网络攻击、阻止军事滥用的。政府现在最想看的,包括Meta今年4月刚发布的Muse Spark模型——这个模型还带了个专门的推理模式,用来处理复杂问题。

    Meta发言人的回应很外交辞令:”我们在研究具体细节,希望很快能签协议。”翻译过来就是:还在谈,别催。

    开源路线与政府审查的张力

    这事背后的张力挺有意思。Meta一直以来打的都是开源牌,跟OpenAI、Google那种把模型锁在服务器里的思路完全相反。现在政府说要提前审查,等于是要Meta把”开源”的节奏交给华盛顿来把关。

    几周前,政府刚命令Anthropic暂停Mythos 5对非美国公民的访问,理由是”国家安全关切”。这个信号发出去之后,剩下的公司基本都乖乖交卷了,只剩Meta还在扛。

    Meta到底会不会最终签字,还是个未知数。从它过去几年跟监管打交道的方式来看,拖字诀是常用手法——能拖就拖,拖到对自己最有利的时点为止。


  • 做人形机器人的Agility要上市了,估值25亿美元

    做人形机器人的Agility要上市了,估值25亿美元

    做人形机器人的Agility Robotics昨天宣布,将通过SPAC方式上市,估值约25亿美元。合并对象是Churchill Capital Corp XI,这笔交易预计募资超过6.2亿美元,其中约2亿美元来自新老机构投资者的认购。

    Agility2015年从俄勒冈州立大学分拆出来,最出名的产品是双足机器人Digit。目前Digit已经在9家客户现场投入实际使用,包括舍弗勒(Schaeffler)、GXO、加拿大丰田工厂、拉美电商Mercado Libre。该公司背后站着亚马逊、英伟达、软银Vision Fund 2、DCVC等重磅投资方。

    “人形机器人即将成为提升生产力、供应链韧性和美国技术领导力的关键驱动力。”Agility CEO Peggy Johnson在声明中说,”Agility已经在客户环境中部署了可执行商业任务的人形机器人,帮助企业应对劳动力短缺、提升效率,并将AI驱动的自动化安全地整合到运营中。”

    这次上市募资的用途很明确:扩大下一代Digit v5的产能、交付现有订单、拓展新老客户。Agility透露,新机型已经拿到超过3亿美元的多年度订单,还有30多个潜在客户在评估大规模部署方案。

    Agility Robotics的Digit人形机器人
    Digit人形机器人正在仓库中执行搬运任务(来源:TechCrunch)

    人形机器人是不是一门好生意,这个问题在2026年已经有了不同的答案。前几年大家还在争论”人形机器人到底能干什么实际工作”,现在Agility、Figure、Boston Dynamics都在推商业部署,客户也真的在掏钱。劳动力短缺在制造业和物流业是真实痛点,人形机器人如果能稳定干活,ROI是可以算过来的。

    25亿美元的估值贵不贵?对比一下:Figure AI此前融资估值也曾达到26亿美元左右,但Agility这边已经有实际商业部署和收入,故事讲起来更扎实一些。SPAC上市虽然比传统IPO快,但合并后股价表现参差不齐,投资人会盯着Digit能不能真正规模化交付。

    合并后的公司股票将在北美某交易所挂牌,代码AGLT,具体哪家交易所还未公布。SPAC合并预计在2026年晚些时候完成。


    一句话总结:人形机器人从实验室走向仓库 floor,Agility拿下了赛道里的一个重要里程碑——不是因为估值多高,而是它证明了一件事:人形机器人真的能赚钱。

  • OpenAI拿出第一块自研芯片,但它不想和你聊参数

    终于不再只靠英伟达,OpenAI拿出第一块自研芯片

    OpenAI昨天(6月24日)正式发布了首款自研AI芯片”Jalapeño”,这是一块与博通(Broadcom)合作开发的ASIC专用集成电路,专门用来跑AI推理任务——也就是处理你发给ChatGPT的那些请求。

    距离OpenAI官宣与博通合作造芯片,刚好过去了九个月。背后的算盘其实很清楚:减少对英伟达GPU的依赖。现在AI芯片紧缺,各家都在想办法摆脱”英伟达税”,微软、Meta、亚马逊也都在这条路上跑了,只是性能暂时还追不上英伟达。

    博通CEO Hock Tan在接受路透社采访时说,Jalapeño的性能可以对标英伟达的Blackwell芯片和谷歌的TPU。

    这里得解释一下,Jalapeño是一块ASIC芯片,意思就是它为特定任务而生——AI推理。推理和训练是两回事:训练是让模型”学东西”,需要吞掉海量数据;推理是用训练好的模型去回答用户问题、跑Codex这种智能体。推理芯片的要求和训练芯片不太一样,OpenAI选择从这个场景切入,算是一步稳棋。

    OpenAI把这块芯片称为”多代计算平台的第一步”,预计2026年底之前部署上线。官方说法挺克制:”虽然还在测最终性能,但早期测试显示Jalapeño的每瓦性能会比当前最先进的芯片明显更好。”

    OpenAI自研芯片Jalapeño
    OpenAI首款自研AI芯片Jalapeño,专为推理任务设计(配图为OpenAI办公室)

    这件事的意义不止于”OpenAI有了自己的芯片”。它折射出的是整个AI行业对算力的焦虑:大家都想摆脱对单一供应商的依赖,都在自研芯片这条路上加码。问题是,英伟达的护城河不只是芯片本身,还有CUDA生态——这块Jalapeño到底能不能在实际 workload 中打过Blackwell,还得等真正部署之后才能见分晓。

    有意思的是芯片名字Jalapeño(哈雷佩尼奥辣椒)。OpenAI内部给项目起食物名字不是第一次了,之前GPT系列的内部代号也用过料理-Related命名。这种做法让一家AI巨头看起来没那么”钢铁直男”,虽然本质上这还是一场算力争夺战。


    顺带一提:如果你在关注AI基础设施这条线,这块芯片值得记住——它不一定会颠覆英伟达,但会让OpenAI在和云服务商谈判时多一张牌。推理成本如果能压下来,ChatGPT的定价逻辑可能也会跟着变。