分类： AI资讯

聚焦前沿人工智能动态，速览行业热点、技术突破、产业风向与实用 AI 干货，紧跟科技潮流，第一时间掌握 AI 最新趋势。

国产大模型又放大招，MiniMax M3编程能力居然超过了GPT-5.5
最近国产大模型圈又热闹起来了，MiniMax刚发布了新一代的通用模型MiniMax M3，据说编程能力在SWE-Bench Pro基准测试里超过了GPT-5.5和Gemini 3.1 Pro，只比Claude Opus 4.7差一点点。

自研架构，1M超长上下文

MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型，用的是自研的MiniMax Sparse Attention（MSA）稀疏注意力架构，1M上下文下单token的计算量只有上一代的1/20，处理长文本的时候效率高了很多。

MiniMax的团队说，M3的编程能力已经能帮开发者完成很多复杂的编程任务，比如调试代码、优化性能、写复杂的算法，能省不少时间。

MiniMax正式发布新一代通用模型MiniMax M3

除了模型本身，MiniMax还推出了配套的AI编程产品MiniMax Code，能自主运行数天不用人工干预，帮开发者完成从写代码到测试的全流程。现在很多开发者都已经用上AI辅助编程了，MiniMax Code这种能自主运行的工具，说不定能把编程的效率再提一个档次。

国产大模型加速上市

就在发布M3的同时，MiniMax还启动了A股IPO辅导，目标是在科创板上市。其实之前智谱也已经完成了第四期上市辅导，国产大模型公司现在都在加速上市进程，说明资本对AI落地价值的认可已经回归基本面了。以后我们不仅能用到更好的国产大模型，还能通过投资分享AI发展的红利。
- M3编程能力超过GPT-5.5，接近Claude Opus 4.7
- 支持1M超长上下文，自研稀疏注意力架构，效率更高
- 推出MiniMax Code，可自主运行数天，辅助编程全流程
- 启动A股IPO辅导，国产大模型加速上市进程
📎 原文来源：MiniMax推出MiniMax M3模型
2026年6月8日
WWDC 2026：苹果准备再次介绍Siri，这次真的要用上Gemini了

过去几年，苹果在AI这条路上一直在追赶。但换个角度看，落后未必是坏事。

周一的WWDC 2026上，苹果准备再次向用户介绍新版Siri。说”再次”，是因为我们早在2024年苹果高调”推出”Apple Intelligence时就见过新Siri了——当时换上了发光边框，提供了不同的语音选项，还具备了把问题转交给ChatGPT的能力。苹果当时承诺Siri的”智能”功能很快上线，结果并没有。

事实上，苹果围绕Apple Intelligence的宣传如此具有误导性，以至于公司正在和解一起集体诉讼，需要为从未兑现的功能向iPhone用户进行赔偿。

2024年WWDC上，苹果首次曝光AI版Siri，口号是”AI for the rest of us”。两年过去了，这次得动真格了。

AI助手竞赛，苹果已经输了

如果把这事儿当成一场竞赛，苹果已经输得很彻底了。Gemini已经能实现叫Uber、点照烧外卖、查看你的日历并计算你该什么时候出发去机场这类功能。Gemini赢得这场竞赛，实至名归。

但与此同时，人们对AI的不信任感正在上升，尤其是年轻人。Gemini越强大，给人的感觉就越诡异。要交付真正有用的助手，AI必须做到能预判你的需求，但”希望AI助手预判你的下一步需求”和”亲眼看到它真的这么做了”完全是两回事。

我自愿授予了Gemini访问我的Google相册和Gmail的权限，但每次听到Gemini大声说出我儿子的名字，我还是会觉得毛骨悚然。

苹果的新玩法：借力Gemini

新版Siri将以某种形式基于Gemini构建。苹果无疑会为这项特权支付高昂的费用，但这种”隔了一层”的合作模式也有潜在的好处。

你知道哪家公司没有和大型不受欢迎的数据中心项目绑定吗？是苹果。谷歌为了在全国各地的社区大规模开工建设数据中心，并没有赢得多少好感。苹果就算付费给谷歌，也不用背负这个负面名声，哪怕它付给谷歌的钱大概率会被投入到庞大的数据中心建设中。

还有Copilot相关的争议：也就是”到处都是AI按钮”的问题。Siri尝试总结消息的功能既好笑又烦人，但至少Siri不会钻进你每一份工作文档里，非要帮你做总结。

隐私牌，苹果的老本事

可以预料，苹果会在WWDC上大谈隐私。私有云计算（Private Cloud Compute）会被再次搬出来，据说这项技术可以让你的数据就像从未离开过你的设备一样安全。新版Siri可能还会提供自动删除聊天记录的选项，而不是默认保留所有数据。

承诺更私密、更安全的AI体验，可能会吸引那些不愿意向谷歌交出更多个人信息的人。但对于那些已经受够了软件里到处都是AI的人来说，这并没有什么帮助。

苹果完全可以把AI进展缓慢包装成更负责任的做法。把之前的延迟说成是”花时间把事情做对”，并不是个坏策略。但虚假启动的阶段已经结束了。这次Siri必须要真的兑现承诺；这种第二次机会不会一直有，错过了就不会再来。

📎 原文来源：Here comes new Siri again — The Verge

2026年6月8日
Meta自己下场做AI点击诱饵，还把已故女王生成了两遍

Facebook上早就充斥着各种点击诱饵文章，现在Meta干脆自己动手，用AI批量生产这类内容了。

事情是这样的。Meta的独立AI应用有个”为你推荐”板块，会推送一堆看着就很眼熟的故事卡片——标题党、配图夸张、内容空洞，典型的点击诱饵风格。但问题在于，这些故事从头到尾都是AI生成的，包括话题、配图、正文，一个字都不是人写的。

AI眼中的英国是什么样

驻伦敦的记者Robert Hart收到了一堆极具”英国特色”的推送：茶、礼仪、酒吧、王室、足球，还有排队技巧。具体标题大概是这样的：”王室管家终于解决了先加奶还是先加茶的争论”、”不知道原因就加入排队的心理学”、”英式责备的精髓解析”、”逛遍英国所有酒吧的极限运动”。

他的同事更惨，被算法判定为奢侈品手表爱好者，推送了”我的假劳力士实验”和”劳力士候补名单背后的残酷数学”这类故事。

AI生成的英国王室图片，里面出现了两个伊丽莎白二世女王——而她已经去世几年了。图片来源：Meta AI

AI生成的正文基本是凑字数的填充内容，翻来覆去重复提示词的前提，没有任何实质信息，也没有标注任何信息来源。如果你多次点击同一张卡片，每次生成的故事都是同一个主题的不同变体，但内容会略有不同。

AI生成的内容里甚至出现了真实人物，而且错误百出。一张标题为”2026年谁真的在为王室买单？”的配图里，出现了两个伊丽莎白二世女王——而她已经去世几年了。她旁边还有看起来像是凯特王妃和威廉王子的人物，但面部扭曲、身体比例怪异，是典型的AI生成瑕疵。

Meta的尴尬回应

记者联系Meta询问这个功能的目的是什么、输出的内容算新闻还是虚构故事、有什么保障措施、生成真实人物图像是否符合其内容政策。Meta发言人的回应非常简短：”我们的目标是推荐对你最相关的内容——比如健身建议、膳食计划或其他见解——甚至在你提出要求之前。”

后来这份声明又发了一遍，神秘地删除了”甚至在你提出要求之前”这句话。

当天晚些时候，第三份声明来了：”这是针对有限数量用户的测试，该功能将被弃用。Meta没有推进该功能的计划。”

这个回应反而引发了更多疑问：《The Verge》至少有四名记者都能使用这个功能，这算哪门子的”有限测试”？

说到底，这件事暴露了Meta在AI内容生成上的草率。一个连”先加奶还是先加茶”都搞不清楚的AI，批量生产点击诱饵内容推送给用户，还生成已故王室成员的错误图像——这不是创新，这是 irresponsible。

📎 原文来源：Meta made its own AI-generated clickbait news feed — The Verge

2026年6月8日
谷歌每月付SpaceX 9.2亿美元：AI算力军备竞赛打到外太空了

AI算力不够用，连谷歌都要找SpaceX租显卡了。而且租金贵到离谱——每个月9.2亿美元，签了三年。

这笔钱到底买了什么

根据SpaceX在本周公开展露的监管文件，谷歌将从2026年10月开始，到2029年6月为止，每个月向SpaceX支付9.2亿美元。换回来的，是大约11万块英伟达GPU，加上配套的CPU、内存和相关组件的使用权。

这个规模和Anthropic拿到的相比，大概是打了对折。就在这份文件公开前一周，SpaceX刚宣布和Anthropic签了同类型的协议——Anthropic每个月付12.5亿美元，用掉SpaceX在孟菲斯附近Colossus 1数据中心的全部可用算力。那个数据中心是马斯克早先为了训练xAI模型自己建的，现在xAI并入了SpaceX，这块资产也就顺带进了SpaceX的口袋。

谷歌每月支付SpaceX 9.2亿美元算力费，为期三年 | 来源：TechCrunch

谷歌真的缺算力吗

这事最让人困惑的地方就在这：谷歌是全球公认的AI算力大户，有些估算甚至说它是全球最大的AI算力持有者。它自己有TPU，有谷歌云，为什么还要找马斯克租卡？

谷歌的官方说法是：最近推出的AI产品需求远超预期，特别是企业级的Agent平台Gemini Enterprise，用户涨得太快，现有算力顶不住了。这个”短期、及时的协议”就是为了补上这段时间的算力缺口，等自己的新数据中心建好就能缓过来。

“谷歌云和SpaceX是老搭档了。这是一个短期、及时的协议，确保我们有桥接容量来满足Gemini Enterprise代理平台超出预期激增的客户需求。”——谷歌声明

SpaceX的算盘

站在SpaceX的角度看，这笔交易一石二鸟。一方面，把原本只给自己xAI用的数据中心腾出一半租给谷歌，每个月净赚9.2亿美元，三年下来超过330亿美元。另一方面，谷歌本来就是SpaceX的早期投资方，IPO之后持股份额预计价值超过1000亿美元——算力租约加上股权收益，两边通吃。

合同里还有一个取消条款：2026年12月31日之后，双方都可以提前90天通知对方终止协议。谷歌接入数据中心的过程会在9月前”以较低费用逐步 ramp up”。如果SpaceX到2026年9月30日还交不出承诺数量的GPU，谷歌可以选择直接终止协议，或者接受实际提供的数量并相应减少月费。

SpaceX预计近期就要在纳斯达克挂牌了，目标估值1.75万亿美元。有谷歌这种量级客户排队付租金，这个IPO故事讲出来，投资人应该不难买单。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月8日
OpenAI上线Lockdown模式：AI时代的数据安全终于有人管了

前几天OpenAI悄悄上线了一个新功能，名字叫Lockdown Mode（锁定模式）。乍一听像是什么军工级机密功能，其实就是给那些怕自己数据被AI”说漏嘴”的用户，加了一道保险杠。

提示注入到底有多危险

这事得从”提示注入攻击”说起。简单讲，就是有人把恶意指令藏在网页内容里，等你去问AI关于这个网页的问题时，那些隐藏指令就被”激活”了。AI会乖乖按照攻击者的意思去执行——比如把你的私人对话内容泄露出去，或者绕过你设好的使用限制。

这个漏洞不是什么新鲜事，学术界2022年就开始讨论了，但真正让普通用户有感知，还是这两年AI Agent开始大规模联网之后。你的AI助手一旦能读网页、能调用工具、能替你发消息，提示注入就成了实打实的安全威胁。

OpenAI在公告里说得很直白：开了Lockdown Mode，ChatGPT仍然可能被提示注入攻击——因为攻击可能藏在缓存的网页内容或上传的文件里，还是会影响AI的回复行为或准确性。

Lockdown模式到底锁了什么

开了这个模式之后，ChatGPT会做几件事：实时网页浏览直接禁用（只能用缓存内容）；从网络检索和展示图片的功能也关了（但AI自己生成图片还能用）；深度研究（Deep Research）和代理模式（Agent Mode）一同被禁用。

换句话说，Lockdown Mode本质上是在”降智”——通过砍掉那些最容易出事的联网功能，来降低敏感数据被泄露的概率。OpenAI说得很清楚：这个功能不是给所有人用的，它是专门为处理敏感数据的个人和组织设计的。

OpenAI推出Lockdown模式，防范提示注入攻击 | 来源：TechCrunch

谁真正需要这个功能

目前这个功能正在向自助式ChatGPT商业账户，以及符合条件的个人用户推送。如果你只是拿ChatGPT写写周报、翻译点文档，大可不必理会它。但如果你在用AI处理客户数据、商业机密、或者任何不想外泄的信息，Lockdown Mode就是一个值得考虑的选项。

这件事背后反映出的信号更有意思：AI安全正在从”实验室议题”变成”产品功能”。以前大家讨论AI安全，说的是对齐问题、说的是超级智能失控；现在OpenAI直接把它做成一个开关，放在普通用户的设置页面里。这个转变，值得整个行业想一想。

📎 原文来源：OpenAI unveils Lockdown Mode to protect sensitive data from prompt injection attacks — TechCrunch

2026年6月8日
AI代币账单到期：企业花掉全年预算只用了4个月

Uber今年4月就用完了2026年全年的AI编程预算。这件事听起来像段子，但它是真的。微软在给开发者开放Claude Code权限几个月后，悄无声息地撤销了授权。Priceline的一名员工告诉TechCrunch，Cursor的常规续约合同价格涨了4到5倍。

企业AI支出正在失控（图源：TechCrunch）

代币账单到期了

尽管单个token的价格在下降，但AI的普及加上越来越自主的AI智能体，让token消耗量成倍增长。2025年初大量采购”无限量订阅”套餐的企业，现在正手忙脚乱地搞清楚钱都花到了哪里。

OpenAI企业业务负责人亚历山大·恩比里科斯本周在纽约的一场活动中说得很直白：”六个月前和客户沟通，话题全是’它能做什么？效果够不够好？’现在这些话题根本不会出现了。现在的话题全是’嘿，我们花了太多钱了。你们能提供什么可见性？有什么审计能力？有什么token管控措施？你们的模型效率怎么样？’”

“这就像可卡因泛滥一样。供应商先让你免费试用，让你上瘾，现在你就被它套牢了。”——Priceline IT财务高级总监 Chris Reed

新模型让消耗爆炸

2025年11月发布的新模型——Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和谷歌的Gemini 3 Pro——大幅提升了智能体工具的能力，也让token消耗量成倍增长。据报道，有一家公司因为忘记给员工设置使用限额，收到了5亿美元的Claude账单。

工程运营平台Faros AI的CEO维塔利·戈登说，他最近和一位CTO沟通，对方告诉他：”我手下的一个工程师上个月花了4万美元买token，我真的不知道该阻止他，还是该告诉其他人都要像他一样用。”

生产力提升的说法越来越模糊

Faros今年4月发布的一项针对2万名开发者、为期两年的研究发现，开发者的产出确实在上升，但bug和返工的情况也在增加。工程管理平台Jellyfish也得出了类似的结论：使用token最多的工程师的生产效率大约是使用AI较少的工程师的2倍，但他们为此消耗的token是后者的10倍。

Jellyfish的研究负责人尼古拉斯·阿科拉诺说：”极端支出是否值得，最终取决于上线代码带来的实际商业价值，而大多数企业目前还无法衡量这一点。”

Tokenomics基金会来了

正是在这样的背景下，Linux基金会本周公布了成立Tokenomics Foundation（代币经济学基金会）的计划。这是一个新的标准机构，目标是给AI token建立类似FinOps给云成本带来的成本管控规范。

FinOps基金会的执行董事J.R. 斯托门特说：”今年4月和5月，我开始听到企业说：’天呐，我们2026年的全年token预算已经超支3倍了，现在才4月。’我们听到了很多关乎企业存亡的危机。”

该基金会正在为”代币经济学”建立权威的定义和框架，计划7月正式推出。与此同时，一个市场已经在形成——Ramp、Datadog、New Relic，以及专门的初创公司如Pay-i和Paid，都在争相为企业提供AI成本管控工具。

高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案，而该基金会的首个成果还要几个月才能推出。就像戈登说的：”也许我们创造了蒸汽机，但还没有搞清楚装配线怎么建。”

📎 原文来源：The token bill comes due: Inside the industry scramble to manage AI’s runaway costs — TechCrunch

2026年6月7日
谷歌每月给SpaceX交9.2亿美元，买的到底是什么算力？

谷歌居然要向SpaceX租GPU，而且一租就是每月9.2亿美元。这笔交易出现在SpaceX提交给SEC的IPO文件中，时限是2026年10月到2029年6月。谷歌拿到的是约11万块英伟达GPU，加上配套的CPU和内存。

有意思的地方在于，谷歌一直被认为是全球持有AI算力最多的公司之一。它自己有TPU，有谷歌云的数据中心，结果现在还要找SpaceX租算力。原因说起来也简单：Gemini Enterprise的需求比谷歌预期的还要猛，现有的容量跟不上，所以需要一笔”过渡性”的算力来补缺口。

SpaceX的数据中心算力设施（图源：TechCrunch）

和Anthropic那笔交易比，谷歌拿到的少一半

几周前SpaceX和Anthropic刚签了一笔每月12.5亿美元的交易，租的是孟菲斯附近Colossus 1数据中心的全部可用算力。谷歌这笔拿到的量大约是Anthropic的一半。SpaceX没有说明谷歌具体用哪个数据中心，但马斯克之前说过Colossus 2会留给xAI自用。

“这是一份短期、及时的协议，旨在确保我们拥有过渡性的算力容量，以满足客户对Gemini Enterprise的需求，该平台的需求甚至比我们预期的还要高。”——谷歌声明

两家公司都可以在年底撤

这份协议有一个终止条款：2026年12月31日之后，任意一方提前90天通知就可以终止。如果SpaceX在2026年9月30日前交不出约定数量的GPU，谷歌可以立刻终止，或者接受已交付的部分并按比例降租金。

谷歌母公司Alphabet今年已经承诺投入超过1800亿美元的资本支出，而且预计2027年的支出还会”显著增加”。为了支撑这些开支，Alphabet近期宣布了800亿美元的配股计划。在这种情况下还要额外每月花9.2亿美元租算力，说明AI算力的紧缺程度可能已经超出了外界的想象。

谷歌是SpaceX的长期股东

这笔交易还有一个背景：谷歌是SpaceX的早期投资者，据估计IPO后谷歌持有的SpaceX股份价值将超过1000亿美元。两家公司还在商谈建设轨道数据中心的事宜，这是SpaceX IPO后未来规划的重要组成部分。SpaceX预计以约1.75万亿美元的估值筹集约750亿美元，这将是史上规模最大的IPO。

所以这笔算力交易表面上是一笔商业租赁，实际上也可能是谷歌在IPO前夕给SpaceX递的一个大红包，确保这家公司的财务数据在上市前尽可能好看。每月9.2亿美元，三年下来就是超过330亿美元。这笔钱对其他公司来说是天文数字，对谷歌的资产负债表来说，可能只是一笔”战略性支出”。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月7日
AI智能体学会了成长，但只认你一个人

你训练的AI智能体，只认你一个人

一家公司的AI智能体用得越久，表现应该越好。但现实很骨感：你花半天调教的智能体，隔壁工位的同事打开同一个工具，一切又从头开始。没有记忆共享，没有经验传递，每个用户都在重新发明轮子。

Asana的首席产品官Arnab Bose说得很直白：”模型供应商已经把推理和重试循环做得非常好了，但他们不擅长的是——以人类能够推理的方式，把企业工作上下文引入进来。”

问题到底出在哪

场景是这样的：你在AI智能体里纠正了一个错误，比如告诉它你们公司的文档规范是什么。这个纠正被记录了，下次你再问，它答得很好。但是你的同事打开同一个智能体，问同样的问题，它还是会给错的答案。

这个现象在多人协作的场景里会被放大。Asana自己的研究发现，75%的知识工作者在工作中使用AI，但只有5%的企业报告说获得了生产力提升。记忆无法在团队成员之间共享，是一个核心原因。

模型本身是无状态的，每一次对话都是全新的开始。记忆存在于上下文窗口里，窗口一关，什么都没留下。要让智能体记住东西，需要在模型之外搭建专门的记忆层。

几家公司的解法

Asana的做法是建一个”上下文图谱”，任何一个团队成员对智能体的纠正，都会写入这个共享图谱，之后所有其他成员调用智能体时，都能受益。他们把这个叫做”共享记忆架构”。

Collate的联合创始人兼CTO Sriharsha Chintalapani说，缺乏共享记忆是多智能体工作流的一个主要障碍，特别是在一致性方面。智能体对提示词的质量很敏感，理解任务深的人给出的提示，比新手给出的效果好得多——因为前者能提供更准确的反馈，智能体记住这些反馈，后续表现就会更好。

Zeta Global的首席数据官Neej Gore说，共享上下文应该成为一种”活着的记忆”，能够在整个企业范围内复利式地增强智能。

微软的做法不一样

微软的Copilot走的是个人优先的路线。它会学习用户在组织中的角色、语气偏好和工作模式，然后把这些存成个人记忆，跨不同的Microsoft 365界面生效。这种做法对用户个人体验很好，但没有解决团队协作的问题。

对于评估智能体平台的企业技术负责人来说，共享记忆现在已经成为一个采购考量因素。一个只能记住与你个人交互历史的智能体，和能记住整个团队经验的智能体，长期价值差距会越来越大。

这个方向看上去简单，做起来全是坑。怎么保证写入共享记忆的信息是准确的？怎么控制权限，让该看到的人看到，不该看到的人看不到？这些都是接下来一年里企业AI落地要回答的问题。

📎 原文来源：AI agents are learning on the job — just not for your whole team

2026年6月7日
谷歌开源Gemma 4 12B，16GB内存笔记本就能跑多模态AI
谷歌走了条不同的路

大部分玩家都在冲更大、更强的模型，谷歌反过来证明：一个精心设计的120亿参数模型，配合聪明的架构选择，在边缘设备上也能给出不俗的多模态推理能力。

谷歌刚刚做了一个挺有意思的举动。6月3日，这家公司悄悄上线了Gemma 4 12B——一个119.5亿参数的开源多模态模型，最关键的卖点是：普通16GB内存的笔记本就能跑。

砍掉编码器，延迟和内存都降了

这个人称”统一架构”的东西，说白了就是把传统多模态模型里那些分开的编码器给砍掉了。

传统做法里，音频和图像得先经过专门的编码器转成语言模型能懂的表示，这一转就带来了延迟和额外内存消耗。Gemma 4 12B直接让原始音频波形和视觉块流入核心语言模型的嵌入空间，只用了3500万参数的轻量线性层。

结果就是：延迟低了，内存需求降到16GB，还能一次性微调整个多模态系统。

性能不弱，上下文窗口大到离谱

这个小模型跑分接近谷歌自己260亿参数的混合专家模型。它支持256K token上下文窗口——这对需要处理长财报、大型代码库或一小时会议记录的企业来说很实用。

另外还内置了”思考模式”，会在生成回复前先列出逐步推理过程；开箱就支持函数调用和系统提示，这些都是搭建自主智能体的基础能力。

企业哪几种场景最适合
- 严格数据隐私和合规要求（比如医疗、金融、国防），敏感数据不能传出本地
- 多模态智能体工作流，需要实时音频和变分辨率图像输入
- 成本敏感的边缘部署，比如零售库存监控、本地客服亭、离线现场服务
当然也有局限

如果你主要做的是海量知识检索，又不搭RAG管道，那可能还是需要更大的基础模型。

另外音频输入严格限制在30秒内处理，视频理解只有60秒（按每秒1帧算）。需要处理长视频或大型音频档案的企业，还是得用API模型或分块架构。

谷歌这次把小模型路线走得很坚决。对企业技术负责人来说，Gemma 4 12B值得认真评估——尤其是当你既想要多模态能力，又不想把所有数据都送到云端去的时候。

📎 原文来源：Google’s new open source Gemma 4 12B analyzes audio, video — and runs entirely locally on a typical 16GB enterprise laptop
2026年6月7日
谷歌每月给SpaceX交9.2亿美元：AI算力的军备竞赛，已经打到太空了

AI算力缺到什么程度了？谷歌每个月给SpaceX交9.2亿美元，而且一签就是三年。这份刚曝光的计算资源采购协议，让外界第一次看清大厂之间”算力租赁”已经到了什么量级。

根据SpaceX在监管文件中披露的信息，从2026年10月到2029年6月，谷歌将每月支付9.2亿美元，换取”大约11万块英伟达GPU”以及配套CPU、内存和其他相关组件的使用权。

每月9.2亿美元，三年下来谷歌要给SpaceX交超过330亿美元。这笔钱买到的，是AI时代最稀缺的资源——算力。

SpaceX的算力生意经

这份谷歌协议的结构，和SpaceX上个月跟Anthropic签的那份几乎如出一辙。当时Anthropic同意每月向SpaceX支付12.5亿美元，租用其位于田纳西州孟菲斯附近的Colossus 1数据中心的全部可用算力，协议同样签到2029年。

谷歌这笔单子大概只用到Colossus 1算力的半份——约11万块GPU，不到Anthropic拿到的量的一半。SpaceX没有说明谷歌具体用的是哪个数据中心，但马斯克之前暗示过，Colossus 2会留给xAI自用。

对SpaceX来说，这意味着它还没正式IPO，就已经锁定了两份长期大额算力采购合同。一周后SpaceX就要在纳斯达克挂牌了，招股书里这些信息足够让投资者看懂它的商业模式——不只是火箭和星链，它还在卖算力。

谷歌真的不缺算力吗

谷歌自己本来就是全球最大的AI算力持有者之一，它为什么要找SpaceX租？官方说法是：刚推出的Agent平台Gemini Enterprise需求远超预期，需要额外的”过渡性算力”来顶住。

谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本开支，而且说明年还要”显著增加”。为了撑住这个开支规模，Alphabet最近还宣布了800亿美元的股权发售计划。

所以真相是：即便对谷歌来说，AI算力的消耗速度也已经快到跟不上了。与其自己慢慢建数据中心，先租三年SpaceX的现成算力，是更快的补齐方式。

IPO前最后一波造势

SpaceX选择在IPO前一周披露这份谷歌合作协议，时机相当精准。它向市场传递的信号很明确：我们不仅有自己的AI业务（xAI），还能把数据中心租给全球最顶尖的科技公司，而且租约一签就是几年。

招股书显示SpaceX目标融资约750亿美元，估值大约1.75万亿美元。如果成功，这将是史上规模最大的IPO。而谷歌本身就是SpaceX的长期股东，IPO之后持股份额预计价值超过1000亿美元。

两家公司还在洽谈合作建设轨道数据中心——这听起来像科幻小说，但确实是SpaceX IPO后计划的重要组成部分。算力战争打到太空，可能比所有人预想的都要快。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月7日

分类： AI资讯

自研架构，1M超长上下文

国产大模型加速上市

AI助手竞赛，苹果已经输了

苹果的新玩法：借力Gemini

隐私牌，苹果的老本事

AI眼中的英国是什么样

Meta的尴尬回应

这笔钱到底买了什么

谷歌真的缺算力吗

SpaceX的算盘

提示注入到底有多危险

Lockdown模式到底锁了什么

谁真正需要这个功能

代币账单到期了

新模型让消耗爆炸

生产力提升的说法越来越模糊

Tokenomics基金会来了

和Anthropic那笔交易比，谷歌拿到的少一半

两家公司都可以在年底撤

谷歌是SpaceX的长期股东

你训练的AI智能体，只认你一个人

问题到底出在哪

几家公司的解法

微软的做法不一样

谷歌走了条不同的路

砍掉编码器，延迟和内存都降了

性能不弱，上下文窗口大到离谱

企业哪几种场景最适合

当然也有局限

SpaceX的算力生意经

谷歌真的不缺算力吗

IPO前最后一波造势