标签: 算力

  • NVIDIA Vera Rubin NVL72发布:推理成本暴降90%,Vera CPU亲自送货上门

    如果你最近关注AI硬件圈,5月18日这天有个消息值得盯一下。NVIDIA CEO黄仁勋站在Dell Technologies World的舞台上,说了一句话:”需求正在抛物线式增长,完全是抛物线。”台下坐着的5000家企业代表应该都听懂了——这里面包括礼来、三星、霍尼韦尔这些已经在用Dell AI Factory跑AI负载的公司。

    这次发布的核心是两个东西:Vera Rubin NVL72架构,以及NVIDIA第一款专门为AI代理(Agent)设计的CPU——Vera CPU。别被名字搞混了,Rubin是GPU架构,Vera是CPU,俩搭配着用。

    推理成本直接砍掉90%

    Vera Rubin NVL72最吓人的数据是:每token推理成本只有上一代Blackwell平台的1/10。换句话说,原来跑100块钱的推理任务,现在只要10块。这个降幅不是靠砍性能换来的——Dell同步发布的PowerEdge XE9812服务器,用HGX Rubin NVL8架构,性能是上一代HGX B200的5.5倍。

    “67%的企业AI工作负载现在跑在云端之外——本地、设备端、边缘、托管机房,这才是真实的企业AI部署现状。”——NVIDIA CEO黄仁勋

    88%的受访企业至少运行1个本地AI工作负载。这个数据背后有个很现实的原因:把数据搬来搬去的成本,比直接在企业自己机房里跑AI贵多了。Vera Rubin NVL72就是为这种场景设计的——专门优化长序列推理和高并发Agent任务。

    Vera CPU:首款为AI代理设计的处理器

    NVIDIA之前出过Grace CPU,但Vera是第一款明确为”AI代理时代”设计的CPU。这里的逻辑是:AI代理干活的时候,不是一口气跑完的,它要查数据库、跑代码、调工具,这些步骤是串行的,特别吃CPU的单线程性能和内存带宽。

    Vera的三个关键数字:

    • 内存带宽1.2TB/s,是其他CPU的3倍
    • AI代理工作负载完成速度比x86处理器快50%
    • 企业数据查询速度提升3倍(Starburst引擎吞吐量提升3倍)

    第一批发货的Vera CPU已经送到三个地方:OpenAI在米申湾的办公室、SpaceX AI在帕洛阿尔托的实验室、以及Anthropic在旧金山的总部。下一批会送到甲骨文云基础设施在圣克拉拉的机房。NVIDIA超大规模计算副总裁Ian Buck亲自送货上门——这阵仗挺少见的,一般芯片发布都是发新闻稿,不会搞”ceo亲自交付”这套。


    2030年的AI基础设施市场:3-4万亿美元

    黄仁勋在台上给出了一个预测:2030年全球AI基础设施支出将达到3-4万亿美元,同期token消耗量预计增长3400%。这两个数字放在一起看就有意思了——基础设施投入增长,单位token成本下降,但总消耗量增长更快,所以市场总盘子还是在爆炸。

    Dell AI Factory这边的策略是把”计算、网络、存储”打包成一个整体方案,客户不用自己拼组件。配套的还有NVIDIA机密计算(Confidential Computing)支持,模型权重和企业数据在运行过程中全程加密,这个对金融、医疗这些敏感行业挺重要的。

    目前已经在Dell AI Factory上跑AI负载的5000家企业里,礼来用它加速药物研发,三星用它跑芯片设计仿真,霍尼韦尔把原来放在公有云上的工业AI迁移回了本地机房。这些案例的背后逻辑都一样:数据搬不动,算力得靠近数据放


    开源模型也在往这套基础设施上迁

    NVIDIA在这次发布会上列了一个支持Dell AI Factory的开源模型清单:Nemotron、Reflection、MiniMax-M2.7、DeepSeek Pro、DeepSeek-V4、GLM 5.1、Kimi K2.6。这些模型都做了NVFP4精度优化,在Vera Rubin架构上跑起来更高效。

    Hugging Face上已经开了Dell Enterprise Hub,企业可以直接拉取这些优化过的模型镜像部署。这个动作的信号很明确:NVIDIA不只是卖芯片,它在搭一个从芯片到模型到部署工具链的完整生态,让企业”买了硬件就能跑起来”,而不是买回去之后发现软件栈对不上。

    下一波详细技术发布会在6月1-4日的COMPUTEX GTC Taipei大会上放出。如果你在关注AI推理成本这条曲线,Vera Rubin NVL72的价格和实测数据值得等一下那个发布会。

  • Anthropic估值冲至1.2万亿美元,超越OpenAI登顶AI王座

    Anthropic最近在链上Pre-IPO市场的隐含估值冲到了1.2万亿美元,正式超过OpenAI,成为全球AI新王。这个数字有多夸张?比OpenAI高出20%,如果以此估值上市,Anthropic将直接空降全球第11大上市公司。

    Anthropic估值飙升
    Anthropic估值走势(图源:36氪)

    80倍增长,Dario在台上”凡尔赛”

    估值暴涨的背后是业绩真的在飞。CEO Dario Amodei在旧金山开发者大会上透露,今年第一季度Anthropic的年化收入和使用量同比涨了80倍——他们原本的规划仅仅是10倍。

    Dario甚至还”抱怨”说增速太快很难驾驭,希望回到仅仅10倍的增长,那样会轻松点。推动这波增长的核心是Claude Code,2025年底上线的这个编程工具在开发者群体里扩散速度超出了所有人预期。


    马斯克出手:22万块GPU救急

    因为需求爆炸,Anthropic的算力基础设施被瞬间击穿,用户发现Claude开始限流甚至高峰期掉线。关键时刻,马斯克出现了——Anthropic与SpaceX达成独家合作,拿下Colossus 1数据中心的全部算力。

    这个数据中心拥有300MW计算能力和22万块英伟达顶级GPU,一个月内全部到账。几个月前马斯克还在网上骂Claude”邪恶”,现在把给Grok准备的GPU全都给了Anthropic,也是挺讽刺的。

    拿到这22万块GPU之后,Anthropic直接给用户送了大礼包:Claude Code五小时限额翻倍,Pro/Max取消峰值限制,API速率大幅提升。


    2000亿美元抱上谷歌大腿

    据外媒透露,Anthropic已与谷歌签署了一份为期五年、价值约2000亿美元的云服务协议,占到了谷歌云合同积压总额的40%以上。现在的AI圈,正陷入一种疯狂的循环:云巨头掏钱给AI公司,AI公司转手把这笔钱作为”房租”买回算力服务。

    把Anthropic所有已公开的算力合同摊开:亚马逊5GW、谷歌+博通5GW、微软+英伟达300亿美元Azure容量、Fluidstack 500亿美元基础设施、SpaceX 300MW+22万张GPU,三线并进的算力格局已经成型。

    1.2万亿美元估值建立在2029年收入增长20-30倍的预期之上。这场算力豪赌能不能兑现,接下来三年见分晓。

  • Cerebras上市首日暴涨108%:AI芯片赛道跑出了2026年第一个超级IPO

    5月14日,AI芯片公司Cerebras Systems正式登陆纳斯达克,交易代码CBRS。这一天的表现,用”疯狂”来形容不为过。

    发行价定在185美元,远高于最初115-125美元的定价区间(后来上调至150-160美元,还是不够)。开盘价直接跳到385美元,较发行价暴涨108%。收盘价311.07美元,较发行价上涨68%,对应估值约660亿美元。

    这是2026年科技行业第一个大型IPO,而且一上来就给市场秀了一把肌肉。

    Cerebras纳斯达克敲钟仪式
    Cerebras在纳斯达克敲钟开业(图源:TechCrunch)

    Cerebras是谁?凭什么值这么多

    简单说,Cerebras是英伟达的竞争对手。它做了一件很硬核的事:造出了专门针对AI场景设计的大型芯片。这种芯片在AI推理(就是模型响应你提问时做的那些计算)上特别有优势。

    这家公司差点没上成市。2024年它首次提交IPO申请,但因为接受了阿布扎比G42集团的大额投资,被美国外国投资委员会(CFIUS)盯上了,审查拖了很久。再加上当时G42几乎贡献了它的全部营收,财务结构不太好看,IPO就搁置了。

    转机出现在2026年。更新财报后,投资者看到了一个完全不同的Cerebras:2025年营收5.1亿美元,同比增长76%;实现了2.378亿美元的净利润,而前一年还亏着近5亿美元。客户也拓宽了,不再只靠G42,现在包括OpenAI、亚马逊云科技(AWS)等。

    这个IPO为什么重要

    • 它证明AI芯片不只是英伟达一家独大,资本市场愿意给其他玩家机会
    • 它为其他想上市的AI产业链公司打了个样——只要财务数据够硬,市场会给出惊人的估值
    • 它反映出投资者对AI推理需求的长期看好,这块市场还远没到天花板

    Cerebras的CEO Andrew Feldman在上市当天的采访中说了一句话挺有意思:”用IPO募资来支持增长,这才是正确的方式。”看来他对公司的长期增长很有信心。至于这个信心能不能兑现,就看Cerebras能不能在英伟达的阴影下真正打出一片天了。

  • Anthropic接近$900B估值融资关闭:算力军备竞赛进入新量级

    Bloomberg的消息说,Anthropic这笔至少$300亿的新融资、投后估值$900亿以上的轮次,预计5月底就能关闭。截至5月16日,条款清单还没签,但各方已经在按这个时间表推进。

    如果最终落在$900B,Anthropic的估值将首次超过OpenAI——后者今年3月刚拿到$852B的投后估值。而更夸张的是,Anthropic自己今年2月的估值才$380B。三个月涨了2.37倍,这不是普通的增长型融资,这是算力军备竞赛的入场券。

    领投方阵容:硅谷最豪华的算力押注

    这一轮的联合领投方是Sequoia、Dragoneer、Greenoaks和Altimeter。这个组合本身就说明了很多问题——不是早期VC在赌概率,而是成长期的重量级基金在押注”算力即护城河”这个逻辑。

    Anthropic CEO Dario Amodei已经明确说了,这笔钱主要去向是两个:Amazon Web Services和Google Cloud的算力承诺,合同已经签到了2027年。翻译一下就是:我先把未来三年的算力锁死,你们其他家自己去排队吧。


    为什么是现在?Google I/O前的时间窗口

    把时间线摆在一起看就很有意思了。Google I/O是5月19日,Anthropic选在I/O之前把融资消息放出来,战略意图相当明显——在谷歌可能凭借Gemini 4.0夺回叙事主导权之前,先把自己的估值天花板顶上去。

    这也解释了为什么Anthropic愿意以$900B的估值融资。不是因为这个价格”合理”,而是因为他们在跟时间赛跑——在谷歌、Meta、xAI全部加码算力的窗口里,谁先锁定长期算力合同,谁就掌握了下一代模型的上限。


    算力即模型能力:一个被低估的逻辑

    外面很多人还在讨论”哪个模型更聪明”,但Anthropic、OpenAI和谷歌内部的人都知道,2026年的竞争核心不是算法,是算力。你能调度多少H100/B200,决定了你的模型能跑多大、跑多快、跑多稳。

    Anthropic同时还租了SpaceX的Colossus 1超算——22万块以上NVIDIA GPU,300兆瓦的算力规模。这不是临时补救,这是在AWS和Google Cloud的算力完全上线之前(2027年)的一座桥。Dario Amodei的计算是:等竞争对手反应过来,我已经跑了两年了。


    Q1营收80倍增长:融资背后的商业验证

    估值不是凭空来的。Anthropic在5月11日披露,2026年Q1营收同比增长80倍,当前ARR超过$440亿。年消费百万美元以上的客户,两个月内从500家翻倍到1000家以上。

    这些不是试点客户。PwC、Blackstone、Goldman Sachs、Hellman & Friedman、Gates基金会——这些都是生产级部署。Anthropic总裁Daniela Amodei的定位很清晰:Claude不是聊天机器人,是企业的操作系统。80倍的营收增长说明市场正在用真金白银为这个定位投票。


    月底见分晓

    如果这一轮真的在5月底关闭,AI产业格局会在48小时之内被重写。OpenAI盘了三年的”最值钱AI公司”头衔,将被一家成立才五年的公司夺走。

    对开发者来说,这意味着什么?更多的算力意味着Claude的能力上限会持续提升,API的可用性会更高,响应会更快。竞争的受益者永远是用户——这一轮融资的终极输家,可能是那些还在犹豫要不要全面切换到AI工作流的人。