标签: AI芯片

  • 英伟达搞出AI PC专用芯片,要抢2000亿美元CPU市场

    英伟达最近又放了个大招,在台北电脑展上发布了一款专门给AI PC用的CPU芯片,名字叫RTX Spark,直接把消费级PC的算力拉到了1 petaflop(每秒千万亿次浮点运算),目标很明确:要抢总共2000亿美元的CPU市场份额。

    英伟达已联合华硕、戴尔、惠普、联想、微软Surface等厂商,首批产品定于2026年秋季开售。

    产品核心亮点

    这款芯片的核心定位是支持AI智能体安全高效运行,英伟达和微软专门合作开发了安全沙箱机制,能让OpenClaw、Hermes Agent这类AI智能体在本地安全运行,不用把所有数据都传到云端。同时芯片搭配的CPU、GPU、内存以及底层CUDA软件,都支持大语言模型本地化部署,现在已经有超过1000款游戏和应用支持RTX的AI功能了。

    英伟达CEO黄仁勋
    英伟达CEO黄仁勋(来源:TechCrunch)

    行业影响与挑战

    • 英伟达CEO黄仁勋表示,未来全球会出现数十亿个AI智能体,将带来海量CPU需求
    • 微软已推出搭载该芯片的Surface Laptop Ultra,称其为“有史以来最强大的Surface笔记本电脑”
    • 目前已有超过100家Windows软件厂商宣布支持RTX Spark芯片,覆盖Adobe、Blender、Riot Games等头部产品
    • 英伟达曾在2013年尝试推出ARM架构Windows设备,最终失败计提9亿美元减值,本次产品市场表现仍存不确定性

  • Groq转身求融资6.5亿美元——英伟达200亿非收购之后,这家芯片公司要去哪里

    Groq转身求融资6.5亿美元——英伟达200亿”非收购”之后,这家芯片公司要去哪里

    Groq这个名字你可能还不熟悉,但在AI芯片圈子里,他们是这几年最让人看不懂的公司之一。

    事情是这样的:2025年12月,英伟达和Groq签了一笔200亿美元的交易——但这不是收购。部分Groq的核心工程师去了英伟达,Groq的硬件技术授权给英伟达使用。对Groq的投资者来说,这相当于一次大规模退出,拿到了现金回报。

    现在,Axios爆料说Groq正在向现有投资者募集6.5亿美元新资金,用来做一件完全不同的事情:AI推理云(inference neocloud)。

    从造芯片到卖推理,这步棋走对了吗

    训练AI模型是一次性的大工程,而推理是每次用户发一条消息都要发生的事情——这个需求比训练大得多,也持续得多。Groq的判断是:与其和英伟达在训练芯片上硬碰硬,不如把赌注押在推理基础设施上。

    他们的逻辑有一定道理。推理市场确实在爆发,但目前这个赛道已经有大量玩家:亚马逊、谷歌、微软的云推理服务,加上无数中小型推理优化公司。Groq能不能在这片红海里杀出来,关键看他们的技术是不是真的比竞争对手快很多——而且快到客户愿意迁移的程度。

    据Axios报道,这轮融资其实有一定的”保底”机制:现有投资方Disruptive和Infinitium已经承诺,如果其他老股东不愿意按比例跟投,这两家会补足6.5亿美元的额度。换句话说,这轮钱基本上是有保障的。

    管理层动荡,时机有点微妙

    Groq目前由临时CEO Adam Winter和临时CFO Matt Eng领导。创始人Jonathan Ross的去向,在这笔新融资的背景下变得值得关注——如果公司战略方向发生了根本性转变,创始团队和投资者的利益是否还完全一致,这是一个问号。

    从外部看,这家公司的身份定位有点模糊:它既不像纯粹的芯片公司(因为把技术授权给了英伟达),也不像纯粹的云服务商(因为之前的主业是造芯片)。”推理云”这个方向能不能让市场重新给它一个清晰的估值逻辑,这轮融资之后大概会见分晓。


    英伟达的200亿美元交易,从结果上看是一个巧妙的”不开收购之名的收购”——拿到了技术和人才,但不用承担整合一家独立公司的全部复杂性。对Groq来说,拿到了一大笔现金,但也需要回答一个问题:接下来的Groq,到底是一家什么公司?

    6.5亿美元的新融资如果顺利完成,我们大概很快就能看到他们的推理云产品正式亮相。是骡子是马,到时候牵出来遛遛就知道了。

  • XCENA拿了一轮1.35亿美元:AI的最大瓶颈不是算力,是内存

    做AI芯片的公司在2026年并不稀奇,但一家韩国初创公司拿了1.35亿美元融资,理由是”AI的最大瓶颈不是算力,是内存”——这个说法至少让投资圈认真听了。

    数据在CPU、GPU、内存之间来回跑,每一次都要钱

    XCENA的核心判断很简单:你现在每次跟AI说一句话,数据都要在内存、CPU、GPU之间跑一个来回。数据从内存取出来,CPU预处理一遍,送到GPU算,结果再写回内存。生成一个词要走一遍这个流程。

    这不是纯理论问题。它意味着你每用一次AI,都伴随着一笔不算小的数据传输成本。日活几亿次请求的规模下,这个开销是真实的。

    XCENA的估算是:原本需要10台服务器才能跑完的AI推理任务,如果用他们的方案,1台就够了。

    把计算搬到内存旁边去

    他们的办法是做一枚叫MX1的芯片,思路叫”存算一体”——计算不要老盯着GPU做,把一部分活儿搬到内存模块附近完成。

    具体说,MX1通过CXL(Compute Express Link,一个专门连接处理器和内存的高速通道)跟CPU对接,把预处理、KV缓存管理、数据缓存这些事情,在内存模块里面直接做完。数据不用出门,结果也不用搬回来。

    XCENA MX1芯片
    XCENA MX1芯片原型(图源:TechCrunch)

    技术上有几个值得说的地方。MX1基于开源RISC-V指令集设计,里面有数千个小型高效核心,专门为数据搬运和预处理优化过。竞争对手Marvell的方案只用少量通用核心,理论上效率有差距。

    XCENA还做了垂直整合——内存层级、互联总线、DRAM控制器全是自研的。大多数芯片公司会把这类工作外包,他们选择自己做,理由是只有全栈控制才能把内存效率压榨到极限。

    三星、SK海力士的前员工出来创业,时机刚好

    这家公司2022年创办,三位创始人Jin Kim(CEO)、Dohun Kim(CTO)、Harry Juhyun Kim(CPO)全部来自三星和SK海力士。做内存的人出来做AI基础设施,这个组合在2026年看起来挺合理的。

    本轮1.35亿美元由韩国VC机构Atinum、IMM Investment联合领投,跟投方包括Corstone Asia、老股东SBI Investment、Mirae Asset Capital。公司累计融资已达1.85亿美元,估值5.7亿美元。


    一个有趣的行业背景:2026年5月,三星、SK海力士、美光三大内存芯片厂商的市值首次同时突破1万亿美元。内存价格的上涨和AI需求的持续拉动,正在把”内存中心架构”从学术概念推向产业现实。

    MX1目前还在原型阶段,预计2026年底在三星代工厂量产,2027年开始产生收入。目标客户很明确:每年在AI基础设施上花几百亿美元的超大云厂。对这些公司来说,内存效率提升5%,可能就意味着几亿美元的成本节省。

    XCENA不直接跟英伟达在训练侧竞争——他们瞄准的是推理侧的内存密集型层。这个位置刚好卡在GPU算力和内存带宽之间的夹缝里,是一个有理由存在的细分市场。

  • 英伟达砸完200亿美元,Groq自己又要融6.5亿美元

    英伟达刚跟Groq做完一笔200亿美元的”非收购式招聘”,这家AI芯片初创公司自己又要融资了。据Axios报道,Groq正在寻求6.5亿美元的新一轮融资,投资方正是它现有的那些支持者。

    Groq做的事跟英伟达不太一样。它押注的是AI推理环节——也就是模型接收用户提示后生成回答的那个阶段。现在整个行业都在疯抢推理算力,训练的需求反而没那么紧张了。

    英伟达那笔200亿美元的交易到底买了什么

    2025年12月,英伟达和Groq签了一笔结构很特殊的协议。表面上看不是收购,但Groq的多名高层直接跳槽去了英伟达,同时Groq把硬件技术授权给了英伟达使用。如果这是一笔正常的收购,它会是英伟达历史上最大的一笔。

    对Groq的投资者来说,这反而是个好消息——他们拿到了现金回报,现在又被邀请继续投钱,支持Groq把推理云(Inference Neocloud)业务做起来。


    推理为什么比训练更值钱

    训练一个大模型是一次性投入,而推理是每次用户发消息都要消耗算力的持续过程。ChatGPT每天要处理几十亿次请求,每一次都是推理。这个市场的规模,某种程度上比训练市场还要大。

    Groq的芯片设计思路跟英伟达完全不同,它追求的是极致的推理速度,而不是训练所需的大规模并行计算。这套打法能不能跑通,6.5亿美元的新融资会给出部分答案。

    • 现有投资者Disruptive和Infinitium已承诺,若其他投资者认购不足,将全额补足本轮融资
    • 临时CEO Adam Winter和临时CFO Matt Eng领导业务转型
    • Groq推理云直接面向开发者和企业提供API服务,与英伟达的芯片销售模式形成差异

  • 这家芯片初创把计算搬进内存,1.35亿美元融资到手

    每次你向ChatGPT提问,你的请求都会触发一场数据接力赛。信息离开内存,经过CPU预处理,传输到GPU进行繁重计算,然后再返回——而AI生成的每一个字,整个流程都会重复一遍。

    瓶颈是结构性的。这意味着每一个请求中,数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司,刚刚在B轮融资中筹集了1.35亿美元,估值达5.7亿美元。

    “几十年来,CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim

    把计算搬进内存

    XCENA的芯片MX1通过CXL(计算快速链接)连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近,而不是反过来。

    该公司声称,以前需要10台服务器完成的工作,现在可能只需要1台就可以完成。

    XCENA MX1芯片原型
    XCENA MX1芯片原型(图源:TechCrunch)

    为什么是内存,不是算力?

    XCENA的业务押注于一个论点,即”推理不仅是计算问题;它越来越是一个内存扩展问题。”

    虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排,包括预处理、KV缓存管理(存储之前的对话上下文的系统,这样模型就不需要重新处理它)、数据缓存,仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。


    创始团队来自三星和SK海力士

    XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司,三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。

    本月,主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是,AI基础设施正朝着以内存为中心的架构更广泛地转变。

    竞争对手和差异化

    XCENA最接近的竞争对手包括Astera LabsMarvell,这两家纳斯达克上市公司都在研发下一代内存连接技术。

    差异化因素在于知识产权。XCENA有数千个核心,每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下,Marvell的方法依赖少数几个通用核心。


    时间表和挑战

    MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线,该公司预计从2027年开始产生收入。

    XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业,即使内存效率有微小的提升,也可能意味着数亿美元的节省。

    • B轮融资1.35亿美元,估值5.7亿美元
    • 累计融资总额达1.85亿美元
    • MX1芯片基于RISC-V开源架构
    • 目标客户:超大规模AI基础设施运营商
    • 量产时间:2026年底;收入预期:2027年
  • 英伟达不再是唯一选择,AI芯片的牌桌正在重新洗牌

    英伟达不再是唯一选择,AI芯片的牌桌正在重新洗牌

    过去几年里,只要你聊到AI算力,所有人的第一反应都是英伟达。这家公司确实走到了一个前无古人的位置——数据中心AI芯片市场占有率一度超过90%,业绩增速让华尔街分析师不停地改预测模型。

    英伟达的巅峰与隐忧

    2026财年英伟达全年营收2159亿美元,同比增长65%。数字很漂亮,但细心的人已经注意到,几个大客户正在悄悄调整采购策略。

  • Snowflake砸600亿美元绑定AWS自研芯片,AI算力战争打到CPU了

    云计算的芯片战争,又烧到了一个新量级。数据仓库巨头Snowflake本周三宣布,与AWS签署了一份为期五年、总价值600亿美元的新协议。作为参照,Snowflake自2012年成立以来,通过AWS Marketplace销售的服务总额也就70亿美元。这份新合同几乎等于它过去十几年在AWS上赚到的所有钱。

    Snowflake为什么愿意掏这么多钱

    数字背后的驱动力并不复杂——AI。Snowflake的客户在AWS上的花费正在加速膨胀,2025年一年就翻倍到了20亿美元。这让Snowflake有信心锁定未来五年的算力资源。

    Snowflake这几年一直在推自己的AI构建工具Cortex AI,逻辑很顺:企业的数据存在Snowflake里,直接在上面接AI能力,比把数据搬来搬去省事得多。Cortex AI能提供文本界面查数据库(用自然语言问就行)、摘要报告生成等功能。

    数据中心与AI芯片
    AI 算力需求推动云巨头加码自研芯片(来源:TechCrunch)

    这份协议里有一个特别值得关注的细节:Snowflake签约的核心目的,是为了获取更多AWS自研的ARM架构CPU芯片Graviton的使用权。

    CPU在AI时代为什么突然值钱了

    训练大模型靠GPU,这没人反对。但当AI从训练走向日常推理、再走向Agent自动化之后,CPU的用量会急剧上升——因为Agent执行任务时的大部分工作(调度、I/O、业务逻辑)都是由CPU完成的。

    AWS的自研CPU芯片Graviton相比Nvidia的方案有价格优势。亚马逊向来对成本敏感,它也确实把这部分节省传递给了客户。需求旺盛到什么程度?AWS正在以最快速度部署这些芯片,但还是跟不上。

    上个月,AWS刚跟Meta签了一份供应数百万颗Graviton芯片的协议,以满足Meta日益增长的AI算力需求。而就在几个月前,Meta才刚刚跟Google Cloud签了一份100亿美元的云服务协议。AWS能从Google手里抢到Meta的订单,Graviton芯片的价格优势显然是重要原因。


    云巨头芯片军备竞赛

    AWS签下Snowflake这个级别的长期大单,也是在向Nvidia释放信号:云巨头的自研芯片正在抢食你的午餐。

    • Google的TPU已经自研多年,支撑着Gemini大模型的训练和推理
    • 微软今年1月刚发布了自研AI加速芯片Maia 200,专门针对推理场景
    • AWS的Graviton已经迭代多代,在性价比上确实对一部分客户有吸引力

    Nvidia CEO黄仁勋上周在财报会上显然也感受到了压力。他宣称Nvidia新推出的Vera CPU专为AI设计,将为公司打开一个「规模2000亿美元的全新市场」,而且已经拿到了200亿美元的订单。话说得很满,但云巨头们分散供应链的战略意图已经很明确了。

    不管这场芯片战争最后谁占上风,有一点可以确定:AI热潮里最稳赚不赔的,永远是把算力当自来水卖的那几家云厂商。

  • 白宫申请90亿美元买AI芯片,给间谍们用

    说美国政府在AI上”押重注”,已经不算新闻了。但最近这个数字还是让人倒吸一口凉气——《纽约时报》披露,白宫已经批准了一项高达90亿美元的预算申请,专门用来给CIA、NSA这些情报机构买最先进的AI芯片,以及搭建配套的基础设施。

    情报机构的算力焦虑

    事情的起因挺简单:CIA和NSA发现自己的算力不够用了。具体来说,他们缺乏足够的计算能力来运行最新的AI模型,导致在AI技术的推进速度上”跟不上节奏”。

    这听起来可能有点反直觉——情报机构不是一向技术最先进的部门吗?但AI大模型对算力的需求是指数级增长的,顶尖的模型训练一次要烧掉数千万美元的计算资源。情报机构虽然有预算,但采购流程繁琐,等芯片到位,可能新一代架构又出来了。

    据《纽约时报》报道,这项预算申请专门针对英伟达Grace Blackwell超级芯片的采购和配套基础设施建设。

    Grace Blackwell是什么来头

    英伟达的Blackwell架构是2024年发布的下一代GPU,专门为大模型训练和推理设计。Grace则是英伟达自研的CPU,搭配Blackwell GPU组成超级计算平台。这个组合是目前AI训练领域最顶尖的硬件配置,价格自然也不菲。

    一块Blackwell架构的B200芯片,公开市场的单价就在3万到4万美元之间。如果按”90亿美元”的规模来算,这笔采购可能涵盖数万块芯片,加上数据中心制冷、供电、网络配套,确实是个天文数字。


    钱还没到位,国会那关不好过

    白宫虽然已经批准了这项申请,但钱还没法马上花出去——还需要美国国会点头。90亿美元不是小数目,任何一笔巨额国防或情报预算,在国会都会经历一轮激烈的辩论。

    支持者会说,这是国家安全的必要投资,中国在AI领域的投入同样巨大,美国不能掉队。反对者则可能质疑:情报机构到底要用这些算力做什么?有没有监督机制?会不会进一步加剧AI军备竞赛?

    这件事的另一层背景是,AI已经深度渗透进情报工作。从卫星图像分析、信号拦截解码,到开源情报的自动化处理,AI工具正在改变 spy game 的玩法。谁能拥有更强的算力,谁就能更快地从海量数据里捞出有价值的情报。

    90亿美元买的不只是芯片,更是一张”未来情报优势”的入场券。这张入场券贵不贵?肯定贵。但这场竞赛里,不买票的人,可能连参赛资格都没有。

  • Nvidia季度营收创纪录达816亿美元,初创投资持仓暴增至430亿

    2026年5月20日,Nvidia发布了截至4月26日的最新季度财报,营收达到816亿美元,环比增长20%,再度刷新历史纪录。数据中心业务更是贡献了752亿美元,同样是历史新高。

    Nvidia CEO Jensen Huang
    Nvidia CEO Jensen Huang在GTC大会上(图源:Getty Images)

    Blackwell架构全面铺开,但增长将放缓

    Nvidia CFO Colette Kress在财报电话会上说:”我们的Blackwell架构无处不在,所有主流超大规模计算厂商、云服务商和头部大模型开发商都在用。”基于这份强劲业绩,公司授权了800亿美元的股票回购计划。

    不过Nvidia也给出了增长放缓的预期:下一季度营收指引为910亿美元,环比增速将降至12%。这算是给市场提前打了预防针。

    “我们今年和明年为Anthropic上线的算力规模将非常可观。此前Nvidia对Anthropic的算力覆盖几乎为零。”—— Jensen Huang


    430亿美元初创持仓,投资布局大扩张

    这份财报里最让人意外的,是Nvidia持有的非上市公司股权在1-4月之间近乎翻倍:季度初是220亿美元,季度末飙到430亿美元。光是本季度就砸了185亿美元收购,上一季度同类投入才6.49亿美元。

    这430亿还不包括对康宁、IREN等上市公司的投资,也不包含尚未交割的承诺。今年2月Nvidia承诺向OpenAI投300亿美元,具体交易结构到现在还没披露。

    中国市场依然悬而未决

    出口管制这事儿暂时还没对公司盈利产生明显影响。H200芯片虽然已经拿到美国出口许可,但Nvidia还没靠它在中国赚到一分钱,也不确定以后能不能卖进去。

    Kress的原话是:”我们还没有产生任何收入,也不确定是否会被允许进口到[中国]。”这话听起来,短期内外围市场这块还是个问号。

  • AI驱动交换芯片二次成长:2028年市场空间可达242亿元

    说到AI芯片,大家第一反应都是英伟达的GPU。但华泰证券最近一份研报提醒了一件容易被忽略的事:交换芯片作为数据中心互联的核心组件,2026年起要在AI驱动下开启”二次成长”了。

    交换芯片是干什么的?简单说,它负责处理数据交换和报文转发,是交换机的”大脑”。成本占比不低——占交换机成本30%以上。当AI集群从千卡迈向万卡级,网络系统必须更稳定可靠,这就推动数据中心Scale out交换机向更高容量、更高速度发展。

    万卡集群的”血管系统”

    你可以把AI集群想象成一个超大型工厂。GPU是工人,交换芯片就是工厂里的传送带系统——负责把数据快速、准确地从一个”工人”(GPU)传到另一个。

    当集群规模从1000张GPU扩展到10000张,这个”传送带系统”的压力不是线性增长,而是指数级增长。数据包要在成千上万个计算节点之间高速穿梭,任何瓶颈都会导致整个系统变慢。这时候,交换芯片的性能就成了关键。

    测算显示,2028年国产交换芯片市场空间有望达到242亿元,2026-2028年复合增长率(CAGR)高达96%。

    超节点架构:国产算力的破局之道?

    研报里提到一个有趣的观点:超节点架构可能是国产算力追赶海外算力的破局之道。

    这里的逻辑是:超节点架构放大了集群内Scale up(纵向扩展)的作用,而交换芯片的配比通常高于传统的Scale out(横向扩展)架构。换句话说,如果国产算力采用超节点架构,未来会催生大量交换芯片需求。

    这对国内交换芯片厂商来说,是个值得关注的机会。华泰证券的建议是:关注海外龙头及国内自研技术领先的芯片商。

    为什么是”二次成长”?

    第一次成长,是云计算和数据中心的传统需求驱动的。那时候交换芯片主要服务云服务商、大型企业。

    第二次成长,驱动力换成了AI。万卡集群、超节点架构、更高的数据交换速率需求——这些都让交换芯片从”配角”变成了”关键基础设施”。

    96%的三年复合增长率,放在任何行业都是夸张的数字。当然,这只是测算,实际能不能兑现,还得看AI集群建设的实际进度。


    最后提醒一句:研报是研报,投资是投资。96%的增长预测很美好,但交换芯片这个市场,最终谁能吃到蛋糕,还得看技术迭代速度和客户绑定能力。