标签: Groq

  • Groq转身求融资6.5亿美元——英伟达200亿非收购之后,这家芯片公司要去哪里

    Groq转身求融资6.5亿美元——英伟达200亿”非收购”之后,这家芯片公司要去哪里

    Groq这个名字你可能还不熟悉,但在AI芯片圈子里,他们是这几年最让人看不懂的公司之一。

    事情是这样的:2025年12月,英伟达和Groq签了一笔200亿美元的交易——但这不是收购。部分Groq的核心工程师去了英伟达,Groq的硬件技术授权给英伟达使用。对Groq的投资者来说,这相当于一次大规模退出,拿到了现金回报。

    现在,Axios爆料说Groq正在向现有投资者募集6.5亿美元新资金,用来做一件完全不同的事情:AI推理云(inference neocloud)。

    从造芯片到卖推理,这步棋走对了吗

    训练AI模型是一次性的大工程,而推理是每次用户发一条消息都要发生的事情——这个需求比训练大得多,也持续得多。Groq的判断是:与其和英伟达在训练芯片上硬碰硬,不如把赌注押在推理基础设施上。

    他们的逻辑有一定道理。推理市场确实在爆发,但目前这个赛道已经有大量玩家:亚马逊、谷歌、微软的云推理服务,加上无数中小型推理优化公司。Groq能不能在这片红海里杀出来,关键看他们的技术是不是真的比竞争对手快很多——而且快到客户愿意迁移的程度。

    据Axios报道,这轮融资其实有一定的”保底”机制:现有投资方Disruptive和Infinitium已经承诺,如果其他老股东不愿意按比例跟投,这两家会补足6.5亿美元的额度。换句话说,这轮钱基本上是有保障的。

    管理层动荡,时机有点微妙

    Groq目前由临时CEO Adam Winter和临时CFO Matt Eng领导。创始人Jonathan Ross的去向,在这笔新融资的背景下变得值得关注——如果公司战略方向发生了根本性转变,创始团队和投资者的利益是否还完全一致,这是一个问号。

    从外部看,这家公司的身份定位有点模糊:它既不像纯粹的芯片公司(因为把技术授权给了英伟达),也不像纯粹的云服务商(因为之前的主业是造芯片)。”推理云”这个方向能不能让市场重新给它一个清晰的估值逻辑,这轮融资之后大概会见分晓。


    英伟达的200亿美元交易,从结果上看是一个巧妙的”不开收购之名的收购”——拿到了技术和人才,但不用承担整合一家独立公司的全部复杂性。对Groq来说,拿到了一大笔现金,但也需要回答一个问题:接下来的Groq,到底是一家什么公司?

    6.5亿美元的新融资如果顺利完成,我们大概很快就能看到他们的推理云产品正式亮相。是骡子是马,到时候牵出来遛遛就知道了。

  • XCENA拿了一轮1.35亿美元:AI的最大瓶颈不是算力,是内存

    做AI芯片的公司在2026年并不稀奇,但一家韩国初创公司拿了1.35亿美元融资,理由是”AI的最大瓶颈不是算力,是内存”——这个说法至少让投资圈认真听了。

    数据在CPU、GPU、内存之间来回跑,每一次都要钱

    XCENA的核心判断很简单:你现在每次跟AI说一句话,数据都要在内存、CPU、GPU之间跑一个来回。数据从内存取出来,CPU预处理一遍,送到GPU算,结果再写回内存。生成一个词要走一遍这个流程。

    这不是纯理论问题。它意味着你每用一次AI,都伴随着一笔不算小的数据传输成本。日活几亿次请求的规模下,这个开销是真实的。

    XCENA的估算是:原本需要10台服务器才能跑完的AI推理任务,如果用他们的方案,1台就够了。

    把计算搬到内存旁边去

    他们的办法是做一枚叫MX1的芯片,思路叫”存算一体”——计算不要老盯着GPU做,把一部分活儿搬到内存模块附近完成。

    具体说,MX1通过CXL(Compute Express Link,一个专门连接处理器和内存的高速通道)跟CPU对接,把预处理、KV缓存管理、数据缓存这些事情,在内存模块里面直接做完。数据不用出门,结果也不用搬回来。

    XCENA MX1芯片
    XCENA MX1芯片原型(图源:TechCrunch)

    技术上有几个值得说的地方。MX1基于开源RISC-V指令集设计,里面有数千个小型高效核心,专门为数据搬运和预处理优化过。竞争对手Marvell的方案只用少量通用核心,理论上效率有差距。

    XCENA还做了垂直整合——内存层级、互联总线、DRAM控制器全是自研的。大多数芯片公司会把这类工作外包,他们选择自己做,理由是只有全栈控制才能把内存效率压榨到极限。

    三星、SK海力士的前员工出来创业,时机刚好

    这家公司2022年创办,三位创始人Jin Kim(CEO)、Dohun Kim(CTO)、Harry Juhyun Kim(CPO)全部来自三星和SK海力士。做内存的人出来做AI基础设施,这个组合在2026年看起来挺合理的。

    本轮1.35亿美元由韩国VC机构Atinum、IMM Investment联合领投,跟投方包括Corstone Asia、老股东SBI Investment、Mirae Asset Capital。公司累计融资已达1.85亿美元,估值5.7亿美元。


    一个有趣的行业背景:2026年5月,三星、SK海力士、美光三大内存芯片厂商的市值首次同时突破1万亿美元。内存价格的上涨和AI需求的持续拉动,正在把”内存中心架构”从学术概念推向产业现实。

    MX1目前还在原型阶段,预计2026年底在三星代工厂量产,2027年开始产生收入。目标客户很明确:每年在AI基础设施上花几百亿美元的超大云厂。对这些公司来说,内存效率提升5%,可能就意味着几亿美元的成本节省。

    XCENA不直接跟英伟达在训练侧竞争——他们瞄准的是推理侧的内存密集型层。这个位置刚好卡在GPU算力和内存带宽之间的夹缝里,是一个有理由存在的细分市场。

  • 英伟达砸完200亿美元,Groq自己又要融6.5亿美元

    英伟达刚跟Groq做完一笔200亿美元的”非收购式招聘”,这家AI芯片初创公司自己又要融资了。据Axios报道,Groq正在寻求6.5亿美元的新一轮融资,投资方正是它现有的那些支持者。

    Groq做的事跟英伟达不太一样。它押注的是AI推理环节——也就是模型接收用户提示后生成回答的那个阶段。现在整个行业都在疯抢推理算力,训练的需求反而没那么紧张了。

    英伟达那笔200亿美元的交易到底买了什么

    2025年12月,英伟达和Groq签了一笔结构很特殊的协议。表面上看不是收购,但Groq的多名高层直接跳槽去了英伟达,同时Groq把硬件技术授权给了英伟达使用。如果这是一笔正常的收购,它会是英伟达历史上最大的一笔。

    对Groq的投资者来说,这反而是个好消息——他们拿到了现金回报,现在又被邀请继续投钱,支持Groq把推理云(Inference Neocloud)业务做起来。


    推理为什么比训练更值钱

    训练一个大模型是一次性投入,而推理是每次用户发消息都要消耗算力的持续过程。ChatGPT每天要处理几十亿次请求,每一次都是推理。这个市场的规模,某种程度上比训练市场还要大。

    Groq的芯片设计思路跟英伟达完全不同,它追求的是极致的推理速度,而不是训练所需的大规模并行计算。这套打法能不能跑通,6.5亿美元的新融资会给出部分答案。

    • 现有投资者Disruptive和Infinitium已承诺,若其他投资者认购不足,将全额补足本轮融资
    • 临时CEO Adam Winter和临时CFO Matt Eng领导业务转型
    • Groq推理云直接面向开发者和企业提供API服务,与英伟达的芯片销售模式形成差异