分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • 国产大模型又放大招,MiniMax M3编程能力居然超过了GPT-5.5

    最近国产大模型圈又热闹起来了,MiniMax刚发布了新一代的通用模型MiniMax M3,据说编程能力在SWE-Bench Pro基准测试里超过了GPT-5.5和Gemini 3.1 Pro,只比Claude Opus 4.7差一点点。

    自研架构,1M超长上下文

    MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型,用的是自研的MiniMax Sparse Attention(MSA)稀疏注意力架构,1M上下文下单token的计算量只有上一代的1/20,处理长文本的时候效率高了很多。

    MiniMax的团队说,M3的编程能力已经能帮开发者完成很多复杂的编程任务,比如调试代码、优化性能、写复杂的算法,能省不少时间。

    MiniMax M3模型发布
    MiniMax正式发布新一代通用模型MiniMax M3

    除了模型本身,MiniMax还推出了配套的AI编程产品MiniMax Code,能自主运行数天不用人工干预,帮开发者完成从写代码到测试的全流程。现在很多开发者都已经用上AI辅助编程了,MiniMax Code这种能自主运行的工具,说不定能把编程的效率再提一个档次。


    国产大模型加速上市

    就在发布M3的同时,MiniMax还启动了A股IPO辅导,目标是在科创板上市。其实之前智谱也已经完成了第四期上市辅导,国产大模型公司现在都在加速上市进程,说明资本对AI落地价值的认可已经回归基本面了。以后我们不仅能用到更好的国产大模型,还能通过投资分享AI发展的红利。

    • M3编程能力超过GPT-5.5,接近Claude Opus 4.7
    • 支持1M超长上下文,自研稀疏注意力架构,效率更高
    • 推出MiniMax Code,可自主运行数天,辅助编程全流程
    • 启动A股IPO辅导,国产大模型加速上市进程
    📎 原文来源:MiniMax推出MiniMax M3模型
  • WWDC 2026:苹果准备再次介绍Siri,这次真的要用上Gemini了

    过去几年,苹果在AI这条路上一直在追赶。但换个角度看,落后未必是坏事。

    周一的WWDC 2026上,苹果准备再次向用户介绍新版Siri。说”再次”,是因为我们早在2024年苹果高调”推出”Apple Intelligence时就见过新Siri了——当时换上了发光边框,提供了不同的语音选项,还具备了把问题转交给ChatGPT的能力。苹果当时承诺Siri的”智能”功能很快上线,结果并没有。

    事实上,苹果围绕Apple Intelligence的宣传如此具有误导性,以至于公司正在和解一起集体诉讼,需要为从未兑现的功能向iPhone用户进行赔偿。

    2024年WWDC上苹果首次曝光AI版Siri
    2024年WWDC上,苹果首次曝光AI版Siri,口号是”AI for the rest of us”。两年过去了,这次得动真格了。

    AI助手竞赛,苹果已经输了

    如果把这事儿当成一场竞赛,苹果已经输得很彻底了。Gemini已经能实现叫Uber、点照烧外卖、查看你的日历并计算你该什么时候出发去机场这类功能。Gemini赢得这场竞赛,实至名归。

    但与此同时,人们对AI的不信任感正在上升,尤其是年轻人。Gemini越强大,给人的感觉就越诡异。要交付真正有用的助手,AI必须做到能预判你的需求,但”希望AI助手预判你的下一步需求”和”亲眼看到它真的这么做了”完全是两回事。

    我自愿授予了Gemini访问我的Google相册和Gmail的权限,但每次听到Gemini大声说出我儿子的名字,我还是会觉得毛骨悚然。

    苹果的新玩法:借力Gemini

    新版Siri将以某种形式基于Gemini构建。苹果无疑会为这项特权支付高昂的费用,但这种”隔了一层”的合作模式也有潜在的好处。

    你知道哪家公司没有和大型不受欢迎的数据中心项目绑定吗?是苹果。谷歌为了在全国各地的社区大规模开工建设数据中心,并没有赢得多少好感。苹果就算付费给谷歌,也不用背负这个负面名声,哪怕它付给谷歌的钱大概率会被投入到庞大的数据中心建设中。

    还有Copilot相关的争议:也就是”到处都是AI按钮”的问题。Siri尝试总结消息的功能既好笑又烦人,但至少Siri不会钻进你每一份工作文档里,非要帮你做总结。

    隐私牌,苹果的老本事

    可以预料,苹果会在WWDC上大谈隐私。私有云计算(Private Cloud Compute)会被再次搬出来,据说这项技术可以让你的数据就像从未离开过你的设备一样安全。新版Siri可能还会提供自动删除聊天记录的选项,而不是默认保留所有数据。

    承诺更私密、更安全的AI体验,可能会吸引那些不愿意向谷歌交出更多个人信息的人。但对于那些已经受够了软件里到处都是AI的人来说,这并没有什么帮助。


    苹果完全可以把AI进展缓慢包装成更负责任的做法。把之前的延迟说成是”花时间把事情做对”,并不是个坏策略。但虚假启动的阶段已经结束了。这次Siri必须要真的兑现承诺;这种第二次机会不会一直有,错过了就不会再来。

  • Meta自己下场做AI点击诱饵,还把已故女王生成了两遍

    Facebook上早就充斥着各种点击诱饵文章,现在Meta干脆自己动手,用AI批量生产这类内容了。

    事情是这样的。Meta的独立AI应用有个”为你推荐”板块,会推送一堆看着就很眼熟的故事卡片——标题党、配图夸张、内容空洞,典型的点击诱饵风格。但问题在于,这些故事从头到尾都是AI生成的,包括话题、配图、正文,一个字都不是人写的。

    AI眼中的英国是什么样

    驻伦敦的记者Robert Hart收到了一堆极具”英国特色”的推送:茶、礼仪、酒吧、王室、足球,还有排队技巧。具体标题大概是这样的:”王室管家终于解决了先加奶还是先加茶的争论”、”不知道原因就加入排队的心理学”、”英式责备的精髓解析”、”逛遍英国所有酒吧的极限运动”。

    他的同事更惨,被算法判定为奢侈品手表爱好者,推送了”我的假劳力士实验”和”劳力士候补名单背后的残酷数学”这类故事。

    Meta AI生成的错误王室图片,出现了两个伊丽莎白二世女王
    AI生成的英国王室图片,里面出现了两个伊丽莎白二世女王——而她已经去世几年了。图片来源:Meta AI

    AI生成的正文基本是凑字数的填充内容,翻来覆去重复提示词的前提,没有任何实质信息,也没有标注任何信息来源。如果你多次点击同一张卡片,每次生成的故事都是同一个主题的不同变体,但内容会略有不同。

    AI生成的内容里甚至出现了真实人物,而且错误百出。一张标题为”2026年谁真的在为王室买单?”的配图里,出现了两个伊丽莎白二世女王——而她已经去世几年了。她旁边还有看起来像是凯特王妃和威廉王子的人物,但面部扭曲、身体比例怪异,是典型的AI生成瑕疵。

    Meta的尴尬回应

    记者联系Meta询问这个功能的目的是什么、输出的内容算新闻还是虚构故事、有什么保障措施、生成真实人物图像是否符合其内容政策。Meta发言人的回应非常简短:”我们的目标是推荐对你最相关的内容——比如健身建议、膳食计划或其他见解——甚至在你提出要求之前。”

    后来这份声明又发了一遍,神秘地删除了”甚至在你提出要求之前”这句话。

    当天晚些时候,第三份声明来了:”这是针对有限数量用户的测试,该功能将被弃用。Meta没有推进该功能的计划。”

    这个回应反而引发了更多疑问:《The Verge》至少有四名记者都能使用这个功能,这算哪门子的”有限测试”?


    说到底,这件事暴露了Meta在AI内容生成上的草率。一个连”先加奶还是先加茶”都搞不清楚的AI,批量生产点击诱饵内容推送给用户,还生成已故王室成员的错误图像——这不是创新,这是 irresponsible。

  • 谷歌每月付SpaceX 9.2亿美元:AI算力军备竞赛打到外太空了

    AI算力不够用,连谷歌都要找SpaceX租显卡了。而且租金贵到离谱——每个月9.2亿美元,签了三年。

    这笔钱到底买了什么

    根据SpaceX在本周公开展露的监管文件,谷歌将从2026年10月开始,到2029年6月为止,每个月向SpaceX支付9.2亿美元。换回来的,是大约11万块英伟达GPU,加上配套的CPU、内存和相关组件的使用权。

    这个规模和Anthropic拿到的相比,大概是打了对折。就在这份文件公开前一周,SpaceX刚宣布和Anthropic签了同类型的协议——Anthropic每个月付12.5亿美元,用掉SpaceX在孟菲斯附近Colossus 1数据中心的全部可用算力。那个数据中心是马斯克早先为了训练xAI模型自己建的,现在xAI并入了SpaceX,这块资产也就顺带进了SpaceX的口袋。

    谷歌与SpaceX算力合作协议
    谷歌每月支付SpaceX 9.2亿美元算力费,为期三年 | 来源:TechCrunch

    谷歌真的缺算力吗

    这事最让人困惑的地方就在这:谷歌是全球公认的AI算力大户,有些估算甚至说它是全球最大的AI算力持有者。它自己有TPU,有谷歌云,为什么还要找马斯克租卡?

    谷歌的官方说法是:最近推出的AI产品需求远超预期,特别是企业级的Agent平台Gemini Enterprise,用户涨得太快,现有算力顶不住了。这个”短期、及时的协议”就是为了补上这段时间的算力缺口,等自己的新数据中心建好就能缓过来。

    “谷歌云和SpaceX是老搭档了。这是一个短期、及时的协议,确保我们有桥接容量来满足Gemini Enterprise代理平台超出预期激增的客户需求。”——谷歌声明

    SpaceX的算盘

    站在SpaceX的角度看,这笔交易一石二鸟。一方面,把原本只给自己xAI用的数据中心腾出一半租给谷歌,每个月净赚9.2亿美元,三年下来超过330亿美元。另一方面,谷歌本来就是SpaceX的早期投资方,IPO之后持股份额预计价值超过1000亿美元——算力租约加上股权收益,两边通吃。

    合同里还有一个取消条款:2026年12月31日之后,双方都可以提前90天通知对方终止协议。谷歌接入数据中心的过程会在9月前”以较低费用逐步 ramp up”。如果SpaceX到2026年9月30日还交不出承诺数量的GPU,谷歌可以选择直接终止协议,或者接受实际提供的数量并相应减少月费。

    SpaceX预计近期就要在纳斯达克挂牌了,目标估值1.75万亿美元。有谷歌这种量级客户排队付租金,这个IPO故事讲出来,投资人应该不难买单。


  • OpenAI上线Lockdown模式:AI时代的数据安全终于有人管了

    前几天OpenAI悄悄上线了一个新功能,名字叫Lockdown Mode(锁定模式)。乍一听像是什么军工级机密功能,其实就是给那些怕自己数据被AI”说漏嘴”的用户,加了一道保险杠。

    提示注入到底有多危险

    这事得从”提示注入攻击”说起。简单讲,就是有人把恶意指令藏在网页内容里,等你去问AI关于这个网页的问题时,那些隐藏指令就被”激活”了。AI会乖乖按照攻击者的意思去执行——比如把你的私人对话内容泄露出去,或者绕过你设好的使用限制。

    这个漏洞不是什么新鲜事,学术界2022年就开始讨论了,但真正让普通用户有感知,还是这两年AI Agent开始大规模联网之后。你的AI助手一旦能读网页、能调用工具、能替你发消息,提示注入就成了实打实的安全威胁。

    OpenAI在公告里说得很直白:开了Lockdown Mode,ChatGPT仍然可能被提示注入攻击——因为攻击可能藏在缓存的网页内容或上传的文件里,还是会影响AI的回复行为或准确性。

    Lockdown模式到底锁了什么

    开了这个模式之后,ChatGPT会做几件事:实时网页浏览直接禁用(只能用缓存内容);从网络检索和展示图片的功能也关了(但AI自己生成图片还能用);深度研究(Deep Research)和代理模式(Agent Mode)一同被禁用。

    换句话说,Lockdown Mode本质上是在”降智”——通过砍掉那些最容易出事的联网功能,来降低敏感数据被泄露的概率。OpenAI说得很清楚:这个功能不是给所有人用的,它是专门为处理敏感数据的个人和组织设计的。

    OpenAI Lockdown Mode安全防护
    OpenAI推出Lockdown模式,防范提示注入攻击 | 来源:TechCrunch

    谁真正需要这个功能

    目前这个功能正在向自助式ChatGPT商业账户,以及符合条件的个人用户推送。如果你只是拿ChatGPT写写周报、翻译点文档,大可不必理会它。但如果你在用AI处理客户数据、商业机密、或者任何不想外泄的信息,Lockdown Mode就是一个值得考虑的选项。

    这件事背后反映出的信号更有意思:AI安全正在从”实验室议题”变成”产品功能”。以前大家讨论AI安全,说的是对齐问题、说的是超级智能失控;现在OpenAI直接把它做成一个开关,放在普通用户的设置页面里。这个转变,值得整个行业想一想。


  • AI代币账单到期:企业花掉全年预算只用了4个月

    Uber今年4月就用完了2026年全年的AI编程预算。这件事听起来像段子,但它是真的。微软在给开发者开放Claude Code权限几个月后,悄无声息地撤销了授权。Priceline的一名员工告诉TechCrunch,Cursor的常规续约合同价格涨了4到5倍。

    AI成本失控
    企业AI支出正在失控(图源:TechCrunch)

    代币账单到期了

    尽管单个token的价格在下降,但AI的普及加上越来越自主的AI智能体,让token消耗量成倍增长。2025年初大量采购”无限量订阅”套餐的企业,现在正手忙脚乱地搞清楚钱都花到了哪里。

    OpenAI企业业务负责人亚历山大·恩比里科斯本周在纽约的一场活动中说得很直白:”六个月前和客户沟通,话题全是’它能做什么?效果够不够好?’现在这些话题根本不会出现了。现在的话题全是’嘿,我们花了太多钱了。你们能提供什么可见性?有什么审计能力?有什么token管控措施?你们的模型效率怎么样?’”

    “这就像可卡因泛滥一样。供应商先让你免费试用,让你上瘾,现在你就被它套牢了。”——Priceline IT财务高级总监 Chris Reed

    新模型让消耗爆炸

    2025年11月发布的新模型——Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和谷歌的Gemini 3 Pro——大幅提升了智能体工具的能力,也让token消耗量成倍增长。据报道,有一家公司因为忘记给员工设置使用限额,收到了5亿美元的Claude账单。

    工程运营平台Faros AI的CEO维塔利·戈登说,他最近和一位CTO沟通,对方告诉他:”我手下的一个工程师上个月花了4万美元买token,我真的不知道该阻止他,还是该告诉其他人都要像他一样用。”

    生产力提升的说法越来越模糊

    Faros今年4月发布的一项针对2万名开发者、为期两年的研究发现,开发者的产出确实在上升,但bug和返工的情况也在增加。工程管理平台Jellyfish也得出了类似的结论:使用token最多的工程师的生产效率大约是使用AI较少的工程师的2倍,但他们为此消耗的token是后者的10倍。

    Jellyfish的研究负责人尼古拉斯·阿科拉诺说:”极端支出是否值得,最终取决于上线代码带来的实际商业价值,而大多数企业目前还无法衡量这一点。”


    Tokenomics基金会来了

    正是在这样的背景下,Linux基金会本周公布了成立Tokenomics Foundation(代币经济学基金会)的计划。这是一个新的标准机构,目标是给AI token建立类似FinOps给云成本带来的成本管控规范。

    FinOps基金会的执行董事J.R. 斯托门特说:”今年4月和5月,我开始听到企业说:’天呐,我们2026年的全年token预算已经超支3倍了,现在才4月。’我们听到了很多关乎企业存亡的危机。”

    该基金会正在为”代币经济学”建立权威的定义和框架,计划7月正式推出。与此同时,一个市场已经在形成——Ramp、Datadog、New Relic,以及专门的初创公司如Pay-i和Paid,都在争相为企业提供AI成本管控工具。

    高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案,而该基金会的首个成果还要几个月才能推出。就像戈登说的:”也许我们创造了蒸汽机,但还没有搞清楚装配线怎么建。”

  • 谷歌每月给SpaceX交9.2亿美元,买的到底是什么算力?

    谷歌居然要向SpaceX租GPU,而且一租就是每月9.2亿美元。这笔交易出现在SpaceX提交给SEC的IPO文件中,时限是2026年10月到2029年6月。谷歌拿到的是约11万块英伟达GPU,加上配套的CPU和内存。

    有意思的地方在于,谷歌一直被认为是全球持有AI算力最多的公司之一。它自己有TPU,有谷歌云的数据中心,结果现在还要找SpaceX租算力。原因说起来也简单:Gemini Enterprise的需求比谷歌预期的还要猛,现有的容量跟不上,所以需要一笔”过渡性”的算力来补缺口。

    SpaceX数据中心
    SpaceX的数据中心算力设施(图源:TechCrunch)

    和Anthropic那笔交易比,谷歌拿到的少一半

    几周前SpaceX和Anthropic刚签了一笔每月12.5亿美元的交易,租的是孟菲斯附近Colossus 1数据中心的全部可用算力。谷歌这笔拿到的量大约是Anthropic的一半。SpaceX没有说明谷歌具体用哪个数据中心,但马斯克之前说过Colossus 2会留给xAI自用。

    “这是一份短期、及时的协议,旨在确保我们拥有过渡性的算力容量,以满足客户对Gemini Enterprise的需求,该平台的需求甚至比我们预期的还要高。”——谷歌声明

    两家公司都可以在年底撤

    这份协议有一个终止条款:2026年12月31日之后,任意一方提前90天通知就可以终止。如果SpaceX在2026年9月30日前交不出约定数量的GPU,谷歌可以立刻终止,或者接受已交付的部分并按比例降租金。

    谷歌母公司Alphabet今年已经承诺投入超过1800亿美元的资本支出,而且预计2027年的支出还会”显著增加”。为了支撑这些开支,Alphabet近期宣布了800亿美元的配股计划。在这种情况下还要额外每月花9.2亿美元租算力,说明AI算力的紧缺程度可能已经超出了外界的想象。


    谷歌是SpaceX的长期股东

    这笔交易还有一个背景:谷歌是SpaceX的早期投资者,据估计IPO后谷歌持有的SpaceX股份价值将超过1000亿美元。两家公司还在商谈建设轨道数据中心的事宜,这是SpaceX IPO后未来规划的重要组成部分。SpaceX预计以约1.75万亿美元的估值筹集约750亿美元,这将是史上规模最大的IPO。

    所以这笔算力交易表面上是一笔商业租赁,实际上也可能是谷歌在IPO前夕给SpaceX递的一个大红包,确保这家公司的财务数据在上市前尽可能好看。每月9.2亿美元,三年下来就是超过330亿美元。这笔钱对其他公司来说是天文数字,对谷歌的资产负债表来说,可能只是一笔”战略性支出”。

  • AI智能体学会了成长,但只认你一个人

    你训练的AI智能体,只认你一个人

    一家公司的AI智能体用得越久,表现应该越好。但现实很骨感:你花半天调教的智能体,隔壁工位的同事打开同一个工具,一切又从头开始。没有记忆共享,没有经验传递,每个用户都在重新发明轮子。

    Asana的首席产品官Arnab Bose说得很直白:”模型供应商已经把推理和重试循环做得非常好了,但他们不擅长的是——以人类能够推理的方式,把企业工作上下文引入进来。”

    问题到底出在哪

    场景是这样的:你在AI智能体里纠正了一个错误,比如告诉它你们公司的文档规范是什么。这个纠正被记录了,下次你再问,它答得很好。但是你的同事打开同一个智能体,问同样的问题,它还是会给错的答案。

    这个现象在多人协作的场景里会被放大。Asana自己的研究发现,75%的知识工作者在工作中使用AI,但只有5%的企业报告说获得了生产力提升。记忆无法在团队成员之间共享,是一个核心原因。

    模型本身是无状态的,每一次对话都是全新的开始。记忆存在于上下文窗口里,窗口一关,什么都没留下。要让智能体记住东西,需要在模型之外搭建专门的记忆层。

    几家公司的解法

    Asana的做法是建一个”上下文图谱”,任何一个团队成员对智能体的纠正,都会写入这个共享图谱,之后所有其他成员调用智能体时,都能受益。他们把这个叫做”共享记忆架构”。

    Collate的联合创始人兼CTO Sriharsha Chintalapani说,缺乏共享记忆是多智能体工作流的一个主要障碍,特别是在一致性方面。智能体对提示词的质量很敏感,理解任务深的人给出的提示,比新手给出的效果好得多——因为前者能提供更准确的反馈,智能体记住这些反馈,后续表现就会更好。

    Zeta Global的首席数据官Neej Gore说,共享上下文应该成为一种”活着的记忆”,能够在整个企业范围内复利式地增强智能。

    微软的做法不一样

    微软的Copilot走的是个人优先的路线。它会学习用户在组织中的角色、语气偏好和工作模式,然后把这些存成个人记忆,跨不同的Microsoft 365界面生效。这种做法对用户个人体验很好,但没有解决团队协作的问题。

    对于评估智能体平台的企业技术负责人来说,共享记忆现在已经成为一个采购考量因素。一个只能记住与你个人交互历史的智能体,和能记住整个团队经验的智能体,长期价值差距会越来越大。


    这个方向看上去简单,做起来全是坑。怎么保证写入共享记忆的信息是准确的?怎么控制权限,让该看到的人看到,不该看到的人看不到?这些都是接下来一年里企业AI落地要回答的问题。

  • 谷歌开源Gemma 4 12B,16GB内存笔记本就能跑多模态AI

    谷歌走了条不同的路

    大部分玩家都在冲更大、更强的模型,谷歌反过来证明:一个精心设计的120亿参数模型,配合聪明的架构选择,在边缘设备上也能给出不俗的多模态推理能力。

    谷歌刚刚做了一个挺有意思的举动。6月3日,这家公司悄悄上线了Gemma 4 12B——一个119.5亿参数的开源多模态模型,最关键的卖点是:普通16GB内存的笔记本就能跑。

    砍掉编码器,延迟和内存都降了

    这个人称”统一架构”的东西,说白了就是把传统多模态模型里那些分开的编码器给砍掉了。

    传统做法里,音频和图像得先经过专门的编码器转成语言模型能懂的表示,这一转就带来了延迟和额外内存消耗。Gemma 4 12B直接让原始音频波形和视觉块流入核心语言模型的嵌入空间,只用了3500万参数的轻量线性层。

    结果就是:延迟低了,内存需求降到16GB,还能一次性微调整个多模态系统。

    性能不弱,上下文窗口大到离谱

    这个小模型跑分接近谷歌自己260亿参数的混合专家模型。它支持256K token上下文窗口——这对需要处理长财报、大型代码库或一小时会议记录的企业来说很实用。

    另外还内置了”思考模式”,会在生成回复前先列出逐步推理过程;开箱就支持函数调用和系统提示,这些都是搭建自主智能体的基础能力。

    企业哪几种场景最适合

    • 严格数据隐私和合规要求(比如医疗、金融、国防),敏感数据不能传出本地
    • 多模态智能体工作流,需要实时音频和变分辨率图像输入
    • 成本敏感的边缘部署,比如零售库存监控、本地客服亭、离线现场服务

    当然也有局限

    如果你主要做的是海量知识检索,又不搭RAG管道,那可能还是需要更大的基础模型。

    另外音频输入严格限制在30秒内处理,视频理解只有60秒(按每秒1帧算)。需要处理长视频或大型音频档案的企业,还是得用API模型或分块架构。


    谷歌这次把小模型路线走得很坚决。对企业技术负责人来说,Gemma 4 12B值得认真评估——尤其是当你既想要多模态能力,又不想把所有数据都送到云端去的时候。

  • 谷歌每月给SpaceX交9.2亿美元:AI算力的军备竞赛,已经打到太空了

    Google SpaceX compute deal

    AI算力缺到什么程度了?谷歌每个月给SpaceX交9.2亿美元,而且一签就是三年。这份刚曝光的计算资源采购协议,让外界第一次看清大厂之间”算力租赁”已经到了什么量级。

    根据SpaceX在监管文件中披露的信息,从2026年10月到2029年6月,谷歌将每月支付9.2亿美元,换取”大约11万块英伟达GPU”以及配套CPU、内存和其他相关组件的使用权。

    每月9.2亿美元,三年下来谷歌要给SpaceX交超过330亿美元。这笔钱买到的,是AI时代最稀缺的资源——算力。

    SpaceX的算力生意经

    这份谷歌协议的结构,和SpaceX上个月跟Anthropic签的那份几乎如出一辙。当时Anthropic同意每月向SpaceX支付12.5亿美元,租用其位于田纳西州孟菲斯附近的Colossus 1数据中心的全部可用算力,协议同样签到2029年。

    谷歌这笔单子大概只用到Colossus 1算力的半份——约11万块GPU,不到Anthropic拿到的量的一半。SpaceX没有说明谷歌具体用的是哪个数据中心,但马斯克之前暗示过,Colossus 2会留给xAI自用。

    对SpaceX来说,这意味着它还没正式IPO,就已经锁定了两份长期大额算力采购合同。一周后SpaceX就要在纳斯达克挂牌了,招股书里这些信息足够让投资者看懂它的商业模式——不只是火箭和星链,它还在卖算力。

    谷歌真的不缺算力吗

    谷歌自己本来就是全球最大的AI算力持有者之一,它为什么要找SpaceX租?官方说法是:刚推出的Agent平台Gemini Enterprise需求远超预期,需要额外的”过渡性算力”来顶住。

    谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本开支,而且说明年还要”显著增加”。为了撑住这个开支规模,Alphabet最近还宣布了800亿美元的股权发售计划。

    所以真相是:即便对谷歌来说,AI算力的消耗速度也已经快到跟不上了。与其自己慢慢建数据中心,先租三年SpaceX的现成算力,是更快的补齐方式。

    IPO前最后一波造势

    SpaceX选择在IPO前一周披露这份谷歌合作协议,时机相当精准。它向市场传递的信号很明确:我们不仅有自己的AI业务(xAI),还能把数据中心租给全球最顶尖的科技公司,而且租约一签就是几年。

    招股书显示SpaceX目标融资约750亿美元,估值大约1.75万亿美元。如果成功,这将是史上规模最大的IPO。而谷歌本身就是SpaceX的长期股东,IPO之后持股份额预计价值超过1000亿美元。

    两家公司还在洽谈合作建设轨道数据中心——这听起来像科幻小说,但确实是SpaceX IPO后计划的重要组成部分。算力战争打到太空,可能比所有人预想的都要快。