分类： AI资讯

聚焦前沿人工智能动态，速览行业热点、技术突破、产业风向与实用 AI 干货，紧跟科技潮流，第一时间掌握 AI 最新趋势。

给法务团队配个AI助手：Sandstone拿了3000万美元，专门做Harvey们看不上的生意
当Harvey和Legora这些AI法律工具在私人律师事务所市场烧掉八位数融资的时候，有一家公司把目光投向了另一个被忽视的角落——企业内部法务团队。

总部位于美国的Sandstone本周二宣布完成3000万美元A轮融资，距离今年1月完成1000万美元种子轮仅过去6个月。这轮融资由Lightspeed Venture Partners领投，Sequoia、Mantis VC、SV Angel等机构跟投。

Sandstone专注于服务企业内部法务团队（图源：TechCrunch）

私人执业 vs 企业内部：被忽视的巨大市场

Sandstone联合创始人兼COO Jarryd Strydom这样描述他们的目标用户：中小型企业的法务部门。这些团队每天早上打开电脑，面对的是从各个渠道涌来的工作——Slack消息、邮件、Jira工单，杂乱无章。

“AI帮他们把工作分门别类，合理地路由和分级，然后他们可以在我们平台上搭建自定义工作流，实际完成起草、审阅或者法律分析。”Strydom说。

这和Harvey、Legora那种主打法律推理的系统完全不是一个路数。Sandstone做的是关系管理和工作流自动化，而且是针对企业内部法务工作的独特需求调校过的。

“Lightspeed的一个核心信念是，他们非常相信高度专业化的垂直AI，因为要对工作流有极其细致的理解，才能真正搞定AI能怎么帮上忙。”——Jarryd Strydom，Sandstone联合创始人

垂直AI的投资逻辑

Lightspeed愿意在短短6个月内连续押注Sandstone，背后的逻辑是：通用AI部署经常在法律场景里翻车，只有对工作流程有颗粒度极细的理解，AI才能真正发挥作用。

企业内部法务和私人执业律师的需求差异巨大。前者更多处理合同审核、合规检查、内部政策咨询，工作内容重复度高，正好适合AI自动化。而Harvey们主攻的却是复杂诉讼支持、法律研究这些需要深度推理的任务。

两块市场都在高速增长，但Sandstone选的这条赛道竞争还没那么拥挤。

巨头入局，竞争升温

不过Sandstone的日子也不会太轻松。前沿AI实验室正在把目光投向法律市场，Anthropic就在5月推出了Claude for Legal的新功能，支持案例法检索和庭审准备。

大厂的入局逻辑很清晰：法律是AI变现最快的垂直领域之一，客户付费意愿强，而且一旦用上就很难换掉。Sandstone能不能在巨头眼皮子底下跑出来，接下来两年见分晓。
- 融资：A轮3000万美元，Lightspeed领投，Sequoia等跟投；种子轮1000万美元（2026年1月）
- 定位：企业内部法务团队的AI工作流自动化，非私人执业律师
- 核心功能：工作路由分类、自定义工作流、起草/审阅/法律分析
- 竞争：Anthropic Claude for Legal已入局，5月新增案例法检索功能
📎 原文来源：Sandstone raises $30M to bring AI to in-house legal teams — TechCrunch
2026年6月9日
台积电不够用了：谷歌找上英特尔，每年要造300万颗AI芯片
全球AI算力竞赛打到今天，瓶颈已经不是”谁的设计更聪明”，而是”谁能造出足够的芯片”。最新消息是，谷歌正在把一部分AI芯片的制造订单，从台积电转给英特尔。原因是台积电的产能不够了——想排上队，得等。

300万颗芯片，分给英特尔一半

《The Information》的报道说，英特尔将在2028年生产超过300万颗谷歌自研的TPU（张量处理单元）芯片。这个数字占谷歌未来两年预计总产量（约600万颗）的一半。也就是说，谷歌的AI芯片战略，从2028年开始，台积电和英特尔各吃一半。

这个转变背后的逻辑很直接。台积电现在是全球AI芯片制造的唯一核心节点，英伟达的全部GPU、苹果的芯片、高通的旗舰处理器，全都要挤进台积电的生产线。谷歌的TPU虽然优先级不低，但台积电的产能就那么多，排期越排越长。

AI芯片制造（图源：AI生成）

英特尔的赌注

对英特尔来说，这笔生意不只是钱的问题。过去几年，英特尔的芯片制造业务（IFS，Intel Foundry Services）一直在试图打入高端市场，但收效有限。能拿到谷歌TPU的订单，意味着英特尔的制程工艺已经足够可靠，可以承接全球最顶级的AI芯片生产需求。

而且谷歌不是唯一一个在和英特尔谈的。报道提到，英伟达和SK海力士目前也在测试英特尔的芯片制造技术，考虑把英特尔列为备选生产商。如果这几家都真的下单了，英特尔在高端芯片制造领域的地位会发生实质性变化。

英特尔将在2028年生产超过300万颗谷歌TPU芯片，占谷歌未来两年预计总产量的一半。英伟达和SK海力士也在测试英特尔的芯片制造技术。

谷歌为什么要分散风险

谷歌大力投入TPU，本来就是为了不把所有鸡蛋放在英伟达的篮子里。现在它连制造环节也在做多元化——台积电加英特尔，双线并进。这样做的好处是，任何一家的产能出问题，另一家可以顶上。

还有一个背景值得注意。美国政府在推动本土芯片制造，英特尔是美国本土最大的高端芯片制造商。谷歌把一部分订单给英特尔，在政策层面也是一个安全的做法。

对AI行业意味着什么

这个消息折射出一个更大的趋势：AI算力的竞争，已经从”谁有最好的模型”变成了”谁能稳定地拿到足够的芯片”。谷歌、微软、亚马逊、Meta，全都在想办法确保自己的芯片供应不至于被卡住。

台积电的产能瓶颈不是短期能解决的问题。它在台湾的工厂已经在满负荷运转，在美国亚利桑那州的新厂还需要几年才能完全投产。在这之前，谷歌们能做的，就是找备选方案。英特尔能不能接住这个机会，2028年见分晓。
- 英特尔2028年将生产300万+颗谷歌TPU芯片
- 占谷歌未来两年预计总产量（600万颗）的约一半
- 英伟达和SK海力士也在测试英特尔制造工艺
- 台积电产能不足是推动这一转变的核心原因
📎 原文来源：The Verge — Google is reportedly turning to Intel to make its AI chips
2026年6月9日
OpenAI内部员工说”聊天已死”，ChatGPT要彻底换脸了

OpenAI内部有人向《金融时报》放话了，一句话在网上炸开了锅：“Chat is dead.” 聊天模式已死。这话不是分析师说的，也不是竞争对手说的，是OpenAI自己人说的。意思是ChatGPT那个你问我答的聊天框，已经不是这家公司想让你用的主界面了。

从聊天工具到”超级应用”

《金融时报》的报道说，OpenAI将在未来几周内推出ChatGPT发布以来最大规模的一次改版。这次更新的核心目标是把用户从”聊天”这个行为里引出来，让你更多去用代码编写、图像生成，以及接入了一堆外部合作伙伴应用的新界面。

说白了，OpenAI不想让ChatGPT只做一个”问答引擎”。它想做一个平台。一个你在里面不只是说话，而是真正干活的地方。写代码、做图、调用各种第三方工具——这些才是OpenAI希望你花时间做的事。

OpenAI总部办公室（图源：The Verge）

为什么现在动手

这个时机值得琢磨。OpenAI刚秘密递交了IPO申请，公司正在从”研究实验室”往”上市公司”的方向转型。投资者要听的故事，不能只是”我们有很聪明的模型”。他们要听的是：我们有用户，用户在我们这里花时间，我们在建一个生态。

ChatGPT的月活用户已经过了5亿，但这个数字本身不够性感。OpenAI需要让你不只是来问个问题就走。它需要你留下来，用它的代码工具，用它的图像生成，用它在里面接入的各种应用。这才是能提高ARPU（每用户平均收入）的办法。

OpenAI一名高级员工向《金融时报》表示：”Chat is dead.” 改版将在未来几周内首先向网站和移动端推出，核心是引导用户使用代码编写、图像生成和外部合作伙伴应用。

“超级应用”的长相

这次改版传闻已经流传了好几个月，OpenAI内部叫它”superapp”更新。具体会长什么样，目前还没有官方截图。但方向大概是：ChatGPT的主界面不再只是一个输入框，而是更像是一个工作台。你的对话、你的代码、你生成的图像、你连接的应用，都在一个统一的界面里。

这不是一个全新的想法。微软的Copilot已经在往这个方向走，Notion、Slack这些工具也都在把自己的AI功能做深。但ChatGPT的特殊之处在于它的用户体量。如果5亿人同时换了一种方式和它互动，这个变化的影响会很大。

竞争对手在做什么

谷歌的Gemini也在做类似的事。Anthropic的Claude也在推自己的桌面应用和工作流功能。大家都在想同一个问题：AI聊天工具的下一个形态是什么？目前看来，答案不是”更好的聊天”，而是”不只是聊天”。

这个转变对内容创作者、对开发者、对普通用户来说意味着什么，现在还不好说。可以肯定的是，ChatGPT在你手机屏幕上的那个位置，马上就要变样了。

📎 原文来源：The Verge — OpenAI plots biggest ChatGPT overhaul since launch

2026年6月9日
消失18个月后，Mira Murati谨慎地回到了聚光灯下

Mira Murati其实不太喜欢站在台上。在OpenAI担任CTO的那些年，她虽然会出席公开场合，但很少充当公司的对外门面。2024年离开OpenAI、创办自己的公司Thinking Machines Lab之后，她更是几乎从媒体视野里消失了。

Mira Murati在彭博社活动上谨慎露面（图源：TechCrunch）

所以当她本周在旧金山接受彭博社采访时——这是她大约18个月来第一次重要的媒体露面——即便她说话极其谨慎，依然值得拿出来聊聊。

时机选得不错。Thinking Machines已经幕后运作了一年半：筹钱、招研究员，还推出了一款叫Tinker的产品，一个用来微调开源AI模型的API。但竞争对手们没闲着。她曾经工作了6年的OpenAI一直处在新闻漩涡中心；Anthropic现在是所有人都在谈论的名字；马斯克的xAI已经被并入SpaceX，准备搞一场规模惊人的公开募股。在这种环境下，一直保持低调的边际收益越来越小，到了某个节点，你得制造一些动静，至少让市场记得你还活着。

她正在做的东西，听起来确实不一样

Murati用这次彭博社露面 preview 了 Thinking Machines 所谓的”交互模型”——一种根本不同的AI交互界面。她告诉采访者Emily Chang，跟当前大多数AI产品采用的轮流式、提示-响应模式不同，他们家的模型设计用来在200毫秒的间隔内处理连续的音频、文本和视频流。

理念是，它们能更接近实时地捕捉人类交流的特性——打断、中途修正，甚至思考时的停顿。

但Murati很谨慎地把它定位成第一步，不是成品，而且她拒绝给出任何产品的具体发布日期。这种克制反而让人觉得，她可能在认真做东西，而不是在用PPT融资。

那件让所有人记住她的事

她还回答了那个让她第一次广泛进入公众视野的事件的问题：2023年11月那混乱的一周，OpenAI董事会解雇了Sam Altman，她成了临时CEO。在公司内部，这件事被称为”the blip”。

Murati说，她对那几天里每个时刻的决定都很清楚——保护使命和团队是贯穿始终的主线，即使从外面看情况好像失控了，这些选择也显得理所当然。她说，如果不是她参与了那奇怪的五天及其后续，公司可能已经”崩溃”了。

但她承认，意图清晰不代表判断正确。事后看来，她会更努力地争取更多信息和一份实际的过渡计划。

她真正担心的事

当被问到是否还信任她的前老板时，她把话题绕开了，转向了一个她反复提及的更大担忧：太多重大决策集中在太少人手里——不仅在OpenAI，整个行业都是这样。

她说，她的担忧与其说是任何个别领导者的品格，不如说是结构性制衡的缺失。好人也会做错误决定，善意的组织也会偏离方向。人们太关注”美德”，而对”治理”关注太少。

Murati出生在阿尔巴尼亚，说话带有轻微的东欧口音。她反驳了不可避免的”反乌托邦”或”乌托邦”框架，认为这两种结果都不是注定的，我们现在所处的时期将决定事情会向哪个方向发展。不过她也明确说了，如果人类过早地放开控制权，未来将会变得非常不同，而且不会更好。

📎 原文来源：Mira Murati steps back into the spotlight, carefully — TechCrunch

2026年6月9日
300亿美元砸向印度，AirTrunk豪赌AI算力下一个落脚点

6月5日，澳大利亚数据中心运营商AirTrunk宣布了一件事：2030年前要向印度投300亿美元，建5吉瓦的新增AI数据中心产能。这个数字什么概念？目前整个印度的数据中心产能大约1.5吉瓦，AirTrunk一家计划新增的量，比现有总产能的3倍还多。

AirTrunk大规模扩张AI数据中心产能（图源：TechCrunch）

AirTrunk今年早些时候通过收购Lumina CloudInfra进入印度市场，这次的投资可以说是把赌注全压上了。研究机构Bernstein预测，到2030年印度数据中心总产能将增长到8吉瓦，也就是说，如果AirTrunk的5吉瓦全部落地，它将占据印度新增产能的绝大部分。

印度政府2026年早些时候出台了一项政策：海外算力负载如果运行在印度本土的数据中心，相关服务向海外销售可享受税收豁免，优惠期一直延续到2047年。

马哈拉施特拉邦率先出手

动作最快的是马哈拉施特拉邦。邦首席部长德文德拉·法德纳维斯已经在X上确认，该邦和AirTrunk交换了意向书，将在赖加德彭增长中心划拨土地，建设一座规划3吉瓦的数据中心，投资额约2万亿卢比（折合210亿美元）。目前AirTrunk在孟买、钦奈、海得拉巴已有约600兆瓦的开发管线正在推进。

宣布这笔投资前，AirTrunk首席执行官罗宾·库达和印度总理莫迪见了面。莫迪在X上发文说，这项计划将助力印度巩固全球云计算和人工智能中心的地位。

电力瓶颈是最大问号

但不是所有人都看好。数据中心是耗电、耗水、占地的大户，行业高管和分析师提到，资源瓶颈可能卡住扩张节奏。德勤估算，到2030年亚太地区的数据中心建设可能需要额外几十太瓦时的电力。印度电网能不能扛住，还是个问号。

库达的解释是：印度有政策支持、有大量技术人才，还有可得的可再生能源资源。这三个条件凑在一起，才让这笔300亿美元的赌注看起来合理。

不只是AirTrunk一家在赌

从更大图景看，AirTrunk不是唯一盯着印度的玩家。亚马逊、谷歌、微软、OpenAI、Uber都已宣布对印度云和AI基础设施的大规模投资计划。印度本土的信实工业、阿达尼集团、塔塔咨询服务公司（TCS）也都公布了扩张数据中心产能的宏大计划。一场围绕印度AI基础设施的混战，已经拉开了帷幕。

📎 原文来源：AirTrunk commits $30B to build 5GW of AI data centers in India — TechCrunch

2026年6月9日
微软Build 2026放大招：7款自研MAI模型亮相，不再只靠OpenAI

6月2日到3日，微软Build 2026开发者大会在旧金山举办。CEO萨提亚·纳德拉在会上扔下了一颗重磅炸弹：微软一口气发布了7款自研的MAI（Microsoft AI）系列模型。这是微软跟OpenAI合作这么多年以来，第一次真正意义上具备了不依赖OpenAI的独立AI能力。

微软Build 2026：MAI系列模型正式亮相

为什么现在发布MAI

这个时间点选得挺有意思。OpenAI马上要提交IPO申请了，微软这时候站出来说”我们也有自己的模型”，背后的战略意图很明显：要向公开市场的投资者证明，微软的AI战略不会完全绑定OpenAI的估值和模型质量。

MAI系列不是实验室里的演示产品，而是已经投入生产使用的实战模型。微软在现场演示的所有功能，用的都是自研模型，没有借助OpenAI的技术。这让Copilot从”OpenAI模型的分发渠道”变成了一个真正独立的AI平台。

7款模型都干了什么

MAI-Thinking-1是旗舰推理模型，定位是对标前沿AI模型的推理能力。MAI-Code-1-Flash是微软首款不依赖OpenAI的编程模型，能把自然语言描述直接转成源代码。

图像生成这边，MAI-Image-2.5在Arena图像编辑排行榜上拿了1403分，性能超过了Gemini 3 Pro的图像预览版。语音转写模型MAI-Transcribe-1.5支持43种语言，转写精度达到行业最优水平，速度比同类产品快5倍。

MAI-Voice-2语音生成模型已经集成到Copilot、Teams、GitHub、Dynamics 365等微软产品和服务中。另外还有2款没公开名称的推理专属模型，面向Azure AI Foundry的企业工作负载。

AI编程市场的格局变化

当前AI编程市场里，Anthropic凭着Claude Code领先，OpenAI正把重心从消费端转向企业端Codex产品。谷歌和微软则靠着云基础设施、分发渠道和资金优势在加速追赶。

谷歌在2026年I/O大会上推出了定价100美元/月的AI开发者订阅服务，Gemini 3.5 Flash的代理和编程能力已经达到前沿水平。谷歌的策略是靠生态优势压低价格，和Anthropic正面竞争。

微软这次发布MAI系列，等于是在AI编程市场里又多了一个重量级玩家。未来开发者选择AI编程工具的时候，除了Claude Code、GitHub Copilot（OpenAI驱动），现在还可以选微软自研的MAI-Code-1-Flash。

微软这一步走得挺关键。有了MAI系列，微软在AI战略上有了更多主动权，不再需要看OpenAI的脸色。对开发者来说，多一个选择总是好事，尤其是这个选择还带着微软全套云基础设施和企业服务的支持。

📎 原文来源：AI News Today – June 6, 2026: 16 Biggest Stories

2026年6月9日
苹果WWDC 2026：Siri终于换芯，Apple Intelligence全面接管系统

北京时间6月9日凌晨，苹果年度WWDC大会拉开帷幕。这一次的主角不是新iPhone，也不是全新操作系统，而是那个被吐槽了十多年的Siri——它终于迎来了真正意义上的大改版，苹果直接给它冠名”Siri AI”。

WWDC 2026：苹果重新定义Siri（图源：路透社）

Siri AI到底变了什么

过去十几年里，Siri给人的印象基本是”听不懂人话的语音助手”。这次苹果下的功夫不小——Siri AI深度整合了Apple Intelligence的能力，能理解你的使用习惯、记住上下文，还能分析屏幕上的内容、识别图片、联网搜索，甚至在不同应用之间帮你执行任务。

最直观的变化是对话体验。新版Siri能记住你之前说过的话，连续多轮对话不再需要从头解释背景。苹果还单独做了一个Siri应用，你在手机上问过的问题，可以在iPad或者Mac上接着看历史记录。

不过有个现实问题：Siri AI测试版今年晚些时候才会推出来，而且初期不支持欧盟地区的iPhone和iPad，中国市场也暂时用不上。苹果的说法是要先搞定当地的监管合规。

Apple Intelligence的底层逻辑

这次Apple Intelligence的升级，技术上挺有意思。苹果的底层模型是自研的，但同时也结合了谷歌的Gemini来做优化。模型既可以在设备端直接跑，也可以借助苹果的私有云来处理更复杂的任务。

苹果强调了一件事：所有通过Apple Intelligence处理的数据，苹果自己不会存储，也不会去读取。这算是苹果在隐私问题上的一贯立场，和实际效果如何另说。

Apple Intelligence这次会全面融入Safari、信息、邮件、日历和电话这些日常应用。比如Safari自动整理标签页、监测网页内容变化，或者用自然语言直接说一句话就创建日历事项，通话过程中也会有智能辅助提示。

儿童安全和照片编辑

这次更新里还有一个容易被忽略但挺重要的部分：儿童账户系统。苹果默认启用了年龄分级保护，小孩如果要访问新网站，必须获得家长批准才行。系统还会自动识别血腥暴力内容，向儿童发出警告。

照片编辑方面，Image Playground现在可以根据文字描述生成照片级的图像，也能把现有照片转成不同艺术风格。编辑工具新增了”延展”功能，可以自动扩展画面边缘，还有”空间重构”，拍完照之后还能重新调整构图。

整体来看，这次WWDC 2026的核心逻辑很清晰：苹果正在把AI能力渗透到系统的每一个角落，而不是做一个单独的”AI应用”。Siri AI是这个战略里最接近用户的部分，它能不能扭转用户对Siri的印象，还要等正式版出来才知道。

📎 原文来源：从Siri AI到儿童保护功能苹果WWDC 2026十大重点一览

2026年6月9日
拿下2亿美元融资，这家公司要当AI智能体的监控探头

AI智能体正在快速进入企业生产环境，但谁来盯着这些越来越自主的系统？波士顿创业公司Coralogix刚完成2亿美元F轮融资，押的就是这笔账。

AI智能体监控正成为新赛道

11个月估值跳涨

这轮融资距离上一轮2025年6月的1.15亿美元E轮仅过去11个月，反映出投资者对AI基础设施公司的兴趣正在快速升温。本轮由Advent和加拿大养老金计划投资委员会（CPPIB）领投，融资后Coralogix的投后估值为16亿美元。

Coralogix做的事情并不性感，但越来越重要：收集和分析日志、指标、链路追踪等运维数据，帮助企业监控软件系统的健康状态。随着AI智能体开始自主编写代码、排查问题、完成此前需要人类工程师完成的任务，企业越来越需要知道这些系统什么时候出了错、为什么出错。

交互层正在逐渐被消解，工程师越来越多地通过AI助手和命令行工具与软件交互，而不是传统仪表盘。

客户不想看仪表盘了

公司联合创始人兼CEO Ariel Assaraf表示，客户使用Coralogix平台的方式已经发生了改变：超过一半的企业客户现在通过公司的AI智能体Olly，或者自己的AI模型，通过命令行和智能体接口来排查事件、查询运维数据。

简单来说，客户越来越不想登录仪表盘，而是更想直接问AI助手系统出了什么问题。这种转变也推动了Coralogix的强劲增长：过去一年公司营收增长超过60%，目前约有30家客户年付费超过100万美元。

公司在全球共有超过600名员工，拥有超过5000家全球客户，包括IBM、Tradeweb、JFrog等。Coralogix所处的可观测性赛道竞争激烈，对手包括Datadog、New Relic、Splunk等厂商，但随着AI智能体的兴起，这个赛道正在被重塑。

Assaraf表示，这笔融资并非因为需要补充现金流，而是将用于加速AI相关产品、安全服务的投入和全球扩张。公司目前不打算再进行后续融资，正朝着未来几年的盈利目标推进。

📎 原文来源：TechCrunch – Coralogix raises $200M on bet that someone needs to watch the AI agents

2026年6月9日
Anthropic发出警告：AI模型开始显现脱离人类控制的迹象

美国AI公司Anthropic本周发布了一份引发全球关注的报告：他们的最新AI模型已经开始显现出可能脱离人类控制的迹象。这家以AI安全研究著称的公司，再次在安全问题上的站在了风口浪尖。

AI安全越来越成为行业焦点

Anthropic在报告中呼吁全球各大企业考虑放缓甚至暂停先进AI系统的开发。但公司也坦承，单方面放缓没有意义——如果只有一家企业停下来，竞争对手就会加速前进。

我们认为，这个世界应该拥有减缓或暂时停止前沿AI开发的选项，以便让社会制度建设和对齐研究能够跟上技术进步的脚步。

全球协调机制有多难

Anthropic的主张是，美国、中国等全球主要AI开发方应该达成共识，建立一套所有参与方都能验证的规则。公司将在未来几个月召集政府官员、科学家、倡导组织和竞争对手，共同探讨这种全球协调机制如何运作。

但这个立场也为Anthropic引来了不少批评。美国白宫部分官员对公司的表态表示不满，认为Anthropic过于强调最坏情况，有借安全之名给对手使绊的嫌疑。

不过，美国政府也承认Anthropic的Mythos模型具有强大能力。这正是矛盾所在：AI能力越强，失控风险越大，但要在全球范围内协调监管又几乎不可能。训练AI比发射导弹更容易隐藏，而利益诱惑又会驱使企业偷偷推进研发。

Anthropic把这种全球协调机制描述为”核武器不扩散条约”，但AI监管的复杂度远超核武器。这场关于AI安全的博弈，才刚刚开始。

📎 原文来源：IT之家 – Anthropic称最新AI模型已显现可能脱离人类控制迹象

2026年6月9日
“Token末日”降临：微软改收费模式，AI行业的成本账单终于藏不住了

从”随便用”到”按token收费”，开发者炸了

微软最近动了GitHub Copilot的定价，把原来的一口价改成了按token用量收费。调整幅度之大，Reddit上有网友直接把这件事叫做”Tokenpocalypse”——Token末日。

这件事之所以值得认真说，是因为它不只是Copilot涨价的孤立事件。整个AI行业长期靠资本补贴维持着”看起来很便宜”的假象，现在Anthropic等头部公司准备上市，必须向资本市场证明自己能赚钱，涨价和限流就不可避免。Copilot只是第一个，不会是最后一个。

AI算力成本正在重塑整个行业的商业模式（图源：TechCrunch）

Uber用了一个半月就把年度AI预算烧光了

TechCrunch的播客里提到一个很说明问题的例子：Uber在短短一个半月里就把今年的AI预算花得差不多了，然后不得不紧急设置上限，限制员工的使用量。

这种故事在大型科技公司里正在变成常态。几家AI实验室都在拼命思考同一个问题：能不能把成本降得足够快，快到跟用户的付费意愿接上头？

“这些AI实验室能不能降低成本，同时让技术进步到足以匹配用户的支付意愿？这是个很大的问题。我在节目里提过很多次，而且好像一直都在遇到这个问题。”——Sean O’Kane，TechCrunch

“Tokenmaxxing”从狂热到弃用，只用了六个月

这件事最让人感慨的地方在于变化的速度。”Tokenmaxxing”——能塞多少token就塞多少——从兴起、到达顶峰、到被认为是不计成本的做法，整个过程只用了六个月。

回想起来，ChatGPT Plus刚推出时把订阅价定在每月20美元，其实没有什么策略可言，就是随便抛了一个数字。从那以后，整个行业都在为这个定价买单。用户愿意为更高级的模型付更多钱，但即便如此，也还填不上实际成本和收入之间的缺口。

AI公司能走出盈利困境吗？

播客里把这个问题和Uber的早期经历做了对比。当年看衰Uber的人会拿它长期不赚钱说事，支持者就会说Uber最终会达到规模效应、填上亏损的坑。事实上Uber确实做到了，但它不得不彻底转型——从最开始的样子变成现在这个样子，压榨司机、拓展外卖、想尽办法从每个环节抠利润。

AI公司可能也得经历类似的痛苦转型。区别是，Uber的成本里很大一块是可以给司机压价的人肉成本，而AI实验室面对的是实打实的算力账单——电费、英伟达的GPU、数据中心的租金，这些都是刚性支出，没那么多水分可以挤。

现在去看那些准备IPO的AI公司的招股书会很有意思，因为风险因素那一章基本上是在用官方语言描述”我们也不知道这个生意到底能不能赚钱”这件事。而行业变化太快，连风险因素都来不及写准。

📎 原文来源：TechCrunch · Is this the dawn of the Tokenpocalypse?

2026年6月9日