标签： AI芯片

英伟达搞出AI PC专用芯片，要抢2000亿美元CPU市场
英伟达最近又放了个大招，在台北电脑展上发布了一款专门给AI PC用的CPU芯片，名字叫RTX Spark，直接把消费级PC的算力拉到了1 petaflop（每秒千万亿次浮点运算），目标很明确：要抢总共2000亿美元的CPU市场份额。

英伟达已联合华硕、戴尔、惠普、联想、微软Surface等厂商，首批产品定于2026年秋季开售。

产品核心亮点

这款芯片的核心定位是支持AI智能体安全高效运行，英伟达和微软专门合作开发了安全沙箱机制，能让OpenClaw、Hermes Agent这类AI智能体在本地安全运行，不用把所有数据都传到云端。同时芯片搭配的CPU、GPU、内存以及底层CUDA软件，都支持大语言模型本地化部署，现在已经有超过1000款游戏和应用支持RTX的AI功能了。

英伟达CEO黄仁勋（来源：TechCrunch）

行业影响与挑战
- 英伟达CEO黄仁勋表示，未来全球会出现数十亿个AI智能体，将带来海量CPU需求
- 微软已推出搭载该芯片的Surface Laptop Ultra，称其为“有史以来最强大的Surface笔记本电脑”
- 目前已有超过100家Windows软件厂商宣布支持RTX Spark芯片，覆盖Adobe、Blender、Riot Games等头部产品
- 英伟达曾在2013年尝试推出ARM架构Windows设备，最终失败计提9亿美元减值，本次产品市场表现仍存不确定性
📎 原文来源：Nvidia chases $200B CPU market with AI agent PCs from Microsoft, Dell, and HP | TechCrunch
2026年6月2日
Groq转身求融资6.5亿美元——英伟达200亿非收购之后，这家芯片公司要去哪里

Groq转身求融资6.5亿美元——英伟达200亿”非收购”之后，这家芯片公司要去哪里

Groq这个名字你可能还不熟悉，但在AI芯片圈子里，他们是这几年最让人看不懂的公司之一。

事情是这样的：2025年12月，英伟达和Groq签了一笔200亿美元的交易——但这不是收购。部分Groq的核心工程师去了英伟达，Groq的硬件技术授权给英伟达使用。对Groq的投资者来说，这相当于一次大规模退出，拿到了现金回报。

现在，Axios爆料说Groq正在向现有投资者募集6.5亿美元新资金，用来做一件完全不同的事情：AI推理云（inference neocloud）。

从造芯片到卖推理，这步棋走对了吗

训练AI模型是一次性的大工程，而推理是每次用户发一条消息都要发生的事情——这个需求比训练大得多，也持续得多。Groq的判断是：与其和英伟达在训练芯片上硬碰硬，不如把赌注押在推理基础设施上。

他们的逻辑有一定道理。推理市场确实在爆发，但目前这个赛道已经有大量玩家：亚马逊、谷歌、微软的云推理服务，加上无数中小型推理优化公司。Groq能不能在这片红海里杀出来，关键看他们的技术是不是真的比竞争对手快很多——而且快到客户愿意迁移的程度。

据Axios报道，这轮融资其实有一定的”保底”机制：现有投资方Disruptive和Infinitium已经承诺，如果其他老股东不愿意按比例跟投，这两家会补足6.5亿美元的额度。换句话说，这轮钱基本上是有保障的。

管理层动荡，时机有点微妙

Groq目前由临时CEO Adam Winter和临时CFO Matt Eng领导。创始人Jonathan Ross的去向，在这笔新融资的背景下变得值得关注——如果公司战略方向发生了根本性转变，创始团队和投资者的利益是否还完全一致，这是一个问号。

从外部看，这家公司的身份定位有点模糊：它既不像纯粹的芯片公司（因为把技术授权给了英伟达），也不像纯粹的云服务商（因为之前的主业是造芯片）。”推理云”这个方向能不能让市场重新给它一个清晰的估值逻辑，这轮融资之后大概会见分晓。

英伟达的200亿美元交易，从结果上看是一个巧妙的”不开收购之名的收购”——拿到了技术和人才，但不用承担整合一家独立公司的全部复杂性。对Groq来说，拿到了一大笔现金，但也需要回答一个问题：接下来的Groq，到底是一家什么公司？

6.5亿美元的新融资如果顺利完成，我们大概很快就能看到他们的推理云产品正式亮相。是骡子是马，到时候牵出来遛遛就知道了。

📎 原文来源：TechCrunch – After Nvidia’s $20B not-acqui-hire, AI chip startup Groq reportedly raising $650M

2026年5月30日
XCENA拿了一轮1.35亿美元：AI的最大瓶颈不是算力，是内存

做AI芯片的公司在2026年并不稀奇，但一家韩国初创公司拿了1.35亿美元融资，理由是”AI的最大瓶颈不是算力，是内存”——这个说法至少让投资圈认真听了。

数据在CPU、GPU、内存之间来回跑，每一次都要钱

XCENA的核心判断很简单：你现在每次跟AI说一句话，数据都要在内存、CPU、GPU之间跑一个来回。数据从内存取出来，CPU预处理一遍，送到GPU算，结果再写回内存。生成一个词要走一遍这个流程。

这不是纯理论问题。它意味着你每用一次AI，都伴随着一笔不算小的数据传输成本。日活几亿次请求的规模下，这个开销是真实的。

XCENA的估算是：原本需要10台服务器才能跑完的AI推理任务，如果用他们的方案，1台就够了。

把计算搬到内存旁边去

他们的办法是做一枚叫MX1的芯片，思路叫”存算一体”——计算不要老盯着GPU做，把一部分活儿搬到内存模块附近完成。

具体说，MX1通过CXL（Compute Express Link，一个专门连接处理器和内存的高速通道）跟CPU对接，把预处理、KV缓存管理、数据缓存这些事情，在内存模块里面直接做完。数据不用出门，结果也不用搬回来。

XCENA MX1芯片原型（图源：TechCrunch）

技术上有几个值得说的地方。MX1基于开源RISC-V指令集设计，里面有数千个小型高效核心，专门为数据搬运和预处理优化过。竞争对手Marvell的方案只用少量通用核心，理论上效率有差距。

XCENA还做了垂直整合——内存层级、互联总线、DRAM控制器全是自研的。大多数芯片公司会把这类工作外包，他们选择自己做，理由是只有全栈控制才能把内存效率压榨到极限。

三星、SK海力士的前员工出来创业，时机刚好

这家公司2022年创办，三位创始人Jin Kim（CEO）、Dohun Kim（CTO）、Harry Juhyun Kim（CPO）全部来自三星和SK海力士。做内存的人出来做AI基础设施，这个组合在2026年看起来挺合理的。

本轮1.35亿美元由韩国VC机构Atinum、IMM Investment联合领投，跟投方包括Corstone Asia、老股东SBI Investment、Mirae Asset Capital。公司累计融资已达1.85亿美元，估值5.7亿美元。

一个有趣的行业背景：2026年5月，三星、SK海力士、美光三大内存芯片厂商的市值首次同时突破1万亿美元。内存价格的上涨和AI需求的持续拉动，正在把”内存中心架构”从学术概念推向产业现实。

MX1目前还在原型阶段，预计2026年底在三星代工厂量产，2027年开始产生收入。目标客户很明确：每年在AI基础设施上花几百亿美元的超大云厂。对这些公司来说，内存效率提升5%，可能就意味着几亿美元的成本节省。

XCENA不直接跟英伟达在训练侧竞争——他们瞄准的是推理侧的内存密集型层。这个位置刚好卡在GPU算力和内存带宽之间的夹缝里，是一个有理由存在的细分市场。

📎 原文来源：TechCrunch – This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory

2026年5月30日
英伟达砸完200亿美元，Groq自己又要融6.5亿美元
英伟达刚跟Groq做完一笔200亿美元的”非收购式招聘”，这家AI芯片初创公司自己又要融资了。据Axios报道，Groq正在寻求6.5亿美元的新一轮融资，投资方正是它现有的那些支持者。

Groq做的事跟英伟达不太一样。它押注的是AI推理环节——也就是模型接收用户提示后生成回答的那个阶段。现在整个行业都在疯抢推理算力，训练的需求反而没那么紧张了。

英伟达那笔200亿美元的交易到底买了什么

2025年12月，英伟达和Groq签了一笔结构很特殊的协议。表面上看不是收购，但Groq的多名高层直接跳槽去了英伟达，同时Groq把硬件技术授权给了英伟达使用。如果这是一笔正常的收购，它会是英伟达历史上最大的一笔。

对Groq的投资者来说，这反而是个好消息——他们拿到了现金回报，现在又被邀请继续投钱，支持Groq把推理云（Inference Neocloud）业务做起来。

推理为什么比训练更值钱

训练一个大模型是一次性投入，而推理是每次用户发消息都要消耗算力的持续过程。ChatGPT每天要处理几十亿次请求，每一次都是推理。这个市场的规模，某种程度上比训练市场还要大。

Groq的芯片设计思路跟英伟达完全不同，它追求的是极致的推理速度，而不是训练所需的大规模并行计算。这套打法能不能跑通，6.5亿美元的新融资会给出部分答案。
- 现有投资者Disruptive和Infinitium已承诺，若其他投资者认购不足，将全额补足本轮融资
- 临时CEO Adam Winter和临时CFO Matt Eng领导业务转型
- Groq推理云直接面向开发者和企业提供API服务，与英伟达的芯片销售模式形成差异
📎 原文来源：TechCrunch – After Nvidia’s $20B not-aqui-hire, AI chip startup Groq reportedly raising $650M
2026年5月30日
这家芯片初创把计算搬进内存，1.35亿美元融资到手
每次你向ChatGPT提问，你的请求都会触发一场数据接力赛。信息离开内存，经过CPU预处理，传输到GPU进行繁重计算，然后再返回——而AI生成的每一个字，整个流程都会重复一遍。

瓶颈是结构性的。这意味着每一个请求中，数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司，刚刚在B轮融资中筹集了1.35亿美元，估值达5.7亿美元。

“几十年来，CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim

把计算搬进内存

XCENA的芯片MX1通过CXL（计算快速链接）连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近，而不是反过来。

该公司声称，以前需要10台服务器完成的工作，现在可能只需要1台就可以完成。

XCENA MX1芯片原型（图源：TechCrunch）

为什么是内存，不是算力？

XCENA的业务押注于一个论点，即”推理不仅是计算问题；它越来越是一个内存扩展问题。”

虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排，包括预处理、KV缓存管理（存储之前的对话上下文的系统，这样模型就不需要重新处理它）、数据缓存，仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。

创始团队来自三星和SK海力士

XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司，三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。

本月，主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是，AI基础设施正朝着以内存为中心的架构更广泛地转变。

竞争对手和差异化

XCENA最接近的竞争对手包括Astera Labs和Marvell，这两家纳斯达克上市公司都在研发下一代内存连接技术。

差异化因素在于知识产权。XCENA有数千个核心，每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下，Marvell的方法依赖少数几个通用核心。

时间表和挑战

MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线，该公司预计从2027年开始产生收入。

XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业，即使内存效率有微小的提升，也可能意味着数亿美元的节省。
- B轮融资1.35亿美元，估值5.7亿美元
- 累计融资总额达1.85亿美元
- MX1芯片基于RISC-V开源架构
- 目标客户：超大规模AI基础设施运营商
- 量产时间：2026年底；收入预期：2027年
📎 原文来源：TechCrunch — This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory
2026年5月29日
英伟达不再是唯一选择，AI芯片的牌桌正在重新洗牌

英伟达不再是唯一选择，AI芯片的牌桌正在重新洗牌

过去几年里，只要你聊到AI算力，所有人的第一反应都是英伟达。这家公司确实走到了一个前无古人的位置——数据中心AI芯片市场占有率一度超过90%，业绩增速让华尔街分析师不停地改预测模型。

英伟达的巅峰与隐忧

2026财年英伟达全年营收2159亿美元，同比增长65%。数字很漂亮，但细心的人已经注意到，几个大客户正在悄悄调整采购策略。

2026年5月28日
Snowflake砸600亿美元绑定AWS自研芯片，AI算力战争打到CPU了
云计算的芯片战争，又烧到了一个新量级。数据仓库巨头Snowflake本周三宣布，与AWS签署了一份为期五年、总价值600亿美元的新协议。作为参照，Snowflake自2012年成立以来，通过AWS Marketplace销售的服务总额也就70亿美元。这份新合同几乎等于它过去十几年在AWS上赚到的所有钱。

Snowflake为什么愿意掏这么多钱

数字背后的驱动力并不复杂——AI。Snowflake的客户在AWS上的花费正在加速膨胀，2025年一年就翻倍到了20亿美元。这让Snowflake有信心锁定未来五年的算力资源。

Snowflake这几年一直在推自己的AI构建工具Cortex AI，逻辑很顺：企业的数据存在Snowflake里，直接在上面接AI能力，比把数据搬来搬去省事得多。Cortex AI能提供文本界面查数据库（用自然语言问就行）、摘要报告生成等功能。

AI 算力需求推动云巨头加码自研芯片（来源：TechCrunch）

这份协议里有一个特别值得关注的细节：Snowflake签约的核心目的，是为了获取更多AWS自研的ARM架构CPU芯片Graviton的使用权。

CPU在AI时代为什么突然值钱了

训练大模型靠GPU，这没人反对。但当AI从训练走向日常推理、再走向Agent自动化之后，CPU的用量会急剧上升——因为Agent执行任务时的大部分工作（调度、I/O、业务逻辑）都是由CPU完成的。

AWS的自研CPU芯片Graviton相比Nvidia的方案有价格优势。亚马逊向来对成本敏感，它也确实把这部分节省传递给了客户。需求旺盛到什么程度？AWS正在以最快速度部署这些芯片，但还是跟不上。

上个月，AWS刚跟Meta签了一份供应数百万颗Graviton芯片的协议，以满足Meta日益增长的AI算力需求。而就在几个月前，Meta才刚刚跟Google Cloud签了一份100亿美元的云服务协议。AWS能从Google手里抢到Meta的订单，Graviton芯片的价格优势显然是重要原因。

云巨头芯片军备竞赛

AWS签下Snowflake这个级别的长期大单，也是在向Nvidia释放信号：云巨头的自研芯片正在抢食你的午餐。
- Google的TPU已经自研多年，支撑着Gemini大模型的训练和推理
- 微软今年1月刚发布了自研AI加速芯片Maia 200，专门针对推理场景
- AWS的Graviton已经迭代多代，在性价比上确实对一部分客户有吸引力
Nvidia CEO黄仁勋上周在财报会上显然也感受到了压力。他宣称Nvidia新推出的Vera CPU专为AI设计，将为公司打开一个「规模2000亿美元的全新市场」，而且已经拿到了200亿美元的订单。话说得很满，但云巨头们分散供应链的战略意图已经很明确了。

不管这场芯片战争最后谁占上风，有一点可以确定：AI热潮里最稳赚不赔的，永远是把算力当自来水卖的那几家云厂商。

📎 原文来源：Snowflake signs $6B deal with AWS for AI CPU chips — TechCrunch
2026年5月28日
白宫申请90亿美元买AI芯片，给间谍们用

说美国政府在AI上”押重注”，已经不算新闻了。但最近这个数字还是让人倒吸一口凉气——《纽约时报》披露，白宫已经批准了一项高达90亿美元的预算申请，专门用来给CIA、NSA这些情报机构买最先进的AI芯片，以及搭建配套的基础设施。

情报机构的算力焦虑

事情的起因挺简单：CIA和NSA发现自己的算力不够用了。具体来说，他们缺乏足够的计算能力来运行最新的AI模型，导致在AI技术的推进速度上”跟不上节奏”。

这听起来可能有点反直觉——情报机构不是一向技术最先进的部门吗？但AI大模型对算力的需求是指数级增长的，顶尖的模型训练一次要烧掉数千万美元的计算资源。情报机构虽然有预算，但采购流程繁琐，等芯片到位，可能新一代架构又出来了。

据《纽约时报》报道，这项预算申请专门针对英伟达Grace Blackwell超级芯片的采购和配套基础设施建设。

Grace Blackwell是什么来头

英伟达的Blackwell架构是2024年发布的下一代GPU，专门为大模型训练和推理设计。Grace则是英伟达自研的CPU，搭配Blackwell GPU组成超级计算平台。这个组合是目前AI训练领域最顶尖的硬件配置，价格自然也不菲。

一块Blackwell架构的B200芯片，公开市场的单价就在3万到4万美元之间。如果按”90亿美元”的规模来算，这笔采购可能涵盖数万块芯片，加上数据中心制冷、供电、网络配套，确实是个天文数字。

钱还没到位，国会那关不好过

白宫虽然已经批准了这项申请，但钱还没法马上花出去——还需要美国国会点头。90亿美元不是小数目，任何一笔巨额国防或情报预算，在国会都会经历一轮激烈的辩论。

支持者会说，这是国家安全的必要投资，中国在AI领域的投入同样巨大，美国不能掉队。反对者则可能质疑：情报机构到底要用这些算力做什么？有没有监督机制？会不会进一步加剧AI军备竞赛？

这件事的另一层背景是，AI已经深度渗透进情报工作。从卫星图像分析、信号拦截解码，到开源情报的自动化处理，AI工具正在改变 spy game 的玩法。谁能拥有更强的算力，谁就能更快地从海量数据里捞出有价值的情报。

90亿美元买的不只是芯片，更是一张”未来情报优势”的入场券。这张入场券贵不贵？肯定贵。但这场竞赛里，不买票的人，可能连参赛资格都没有。

📎 原文来源：The Verge – The White House is asking for $9 billion to buy AI chips for spies

2026年5月27日
Nvidia季度营收创纪录达816亿美元，初创投资持仓暴增至430亿

2026年5月20日，Nvidia发布了截至4月26日的最新季度财报，营收达到816亿美元，环比增长20%，再度刷新历史纪录。数据中心业务更是贡献了752亿美元，同样是历史新高。

Nvidia CEO Jensen Huang在GTC大会上（图源：Getty Images）

Blackwell架构全面铺开，但增长将放缓

Nvidia CFO Colette Kress在财报电话会上说：”我们的Blackwell架构无处不在，所有主流超大规模计算厂商、云服务商和头部大模型开发商都在用。”基于这份强劲业绩，公司授权了800亿美元的股票回购计划。

不过Nvidia也给出了增长放缓的预期：下一季度营收指引为910亿美元，环比增速将降至12%。这算是给市场提前打了预防针。

“我们今年和明年为Anthropic上线的算力规模将非常可观。此前Nvidia对Anthropic的算力覆盖几乎为零。”—— Jensen Huang

430亿美元初创持仓，投资布局大扩张

这份财报里最让人意外的，是Nvidia持有的非上市公司股权在1-4月之间近乎翻倍：季度初是220亿美元，季度末飙到430亿美元。光是本季度就砸了185亿美元收购，上一季度同类投入才6.49亿美元。

这430亿还不包括对康宁、IREN等上市公司的投资，也不包含尚未交割的承诺。今年2月Nvidia承诺向OpenAI投300亿美元，具体交易结构到现在还没披露。

中国市场依然悬而未决

出口管制这事儿暂时还没对公司盈利产生明显影响。H200芯片虽然已经拿到美国出口许可，但Nvidia还没靠它在中国赚到一分钱，也不确定以后能不能卖进去。

Kress的原话是：”我们还没有产生任何收入，也不确定是否会被允许进口到[中国]。”这话听起来，短期内外围市场这块还是个问号。

📎 原文来源：Nvidia posts another record quarter, reveals $43B of holdings in startups | TechCrunch

2026年5月24日
AI驱动交换芯片二次成长：2028年市场空间可达242亿元

说到AI芯片，大家第一反应都是英伟达的GPU。但华泰证券最近一份研报提醒了一件容易被忽略的事：交换芯片作为数据中心互联的核心组件，2026年起要在AI驱动下开启”二次成长”了。

交换芯片是干什么的？简单说，它负责处理数据交换和报文转发，是交换机的”大脑”。成本占比不低——占交换机成本30%以上。当AI集群从千卡迈向万卡级，网络系统必须更稳定可靠，这就推动数据中心Scale out交换机向更高容量、更高速度发展。

万卡集群的”血管系统”

你可以把AI集群想象成一个超大型工厂。GPU是工人，交换芯片就是工厂里的传送带系统——负责把数据快速、准确地从一个”工人”（GPU）传到另一个。

当集群规模从1000张GPU扩展到10000张，这个”传送带系统”的压力不是线性增长，而是指数级增长。数据包要在成千上万个计算节点之间高速穿梭，任何瓶颈都会导致整个系统变慢。这时候，交换芯片的性能就成了关键。

测算显示，2028年国产交换芯片市场空间有望达到242亿元，2026-2028年复合增长率（CAGR）高达96%。

超节点架构：国产算力的破局之道？

研报里提到一个有趣的观点：超节点架构可能是国产算力追赶海外算力的破局之道。

这里的逻辑是：超节点架构放大了集群内Scale up（纵向扩展）的作用，而交换芯片的配比通常高于传统的Scale out（横向扩展）架构。换句话说，如果国产算力采用超节点架构，未来会催生大量交换芯片需求。

这对国内交换芯片厂商来说，是个值得关注的机会。华泰证券的建议是：关注海外龙头及国内自研技术领先的芯片商。

为什么是”二次成长”？

第一次成长，是云计算和数据中心的传统需求驱动的。那时候交换芯片主要服务云服务商、大型企业。

第二次成长，驱动力换成了AI。万卡集群、超节点架构、更高的数据交换速率需求——这些都让交换芯片从”配角”变成了”关键基础设施”。

96%的三年复合增长率，放在任何行业都是夸张的数字。当然，这只是测算，实际能不能兑现，还得看AI集群建设的实际进度。

最后提醒一句：研报是研报，投资是投资。96%的增长预测很美好，但交换芯片这个市场，最终谁能吃到蛋糕，还得看技术迭代速度和客户绑定能力。

📎 原文来源：华泰证券：看好2026年起交换芯片在AI驱动下开启二次成长 | 36氪

2026年5月24日

标签： AI芯片

产品核心亮点

行业影响与挑战

从造芯片到卖推理，这步棋走对了吗

管理层动荡，时机有点微妙

数据在CPU、GPU、内存之间来回跑，每一次都要钱

把计算搬到内存旁边去

三星、SK海力士的前员工出来创业，时机刚好

英伟达那笔200亿美元的交易到底买了什么

推理为什么比训练更值钱

把计算搬进内存

为什么是内存，不是算力？

创始团队来自三星和SK海力士

竞争对手和差异化

时间表和挑战

英伟达不再是唯一选择，AI芯片的牌桌正在重新洗牌

英伟达的巅峰与隐忧

Snowflake为什么愿意掏这么多钱

CPU在AI时代为什么突然值钱了

云巨头芯片军备竞赛

情报机构的算力焦虑

Grace Blackwell是什么来头

钱还没到位，国会那关不好过

Blackwell架构全面铺开，但增长将放缓

430亿美元初创持仓，投资布局大扩张

中国市场依然悬而未决

万卡集群的”血管系统”

超节点架构：国产算力的破局之道？

为什么是”二次成长”？