标签： AI

纽约州率先出手，AI聊天机器人不能再假装是孩子的朋友

纽约州议会本周通过了一项法案，如果州长凯西·霍赫尔签字，AI公司将被禁止让聊天机器人以”陪伴者”的身份与儿童互动。这是美国第一个在州级层面针对AI陪伴聊天机器人出台的限制性法案。

法案出台的背景并不令人意外。过去一年多，多家AI公司面临诉讼，指控其聊天机器人诱导青少年产生自残或自杀倾向。部分案件已经达成和解。立法者看到的证据让他们认为，是时候划一条线了。

“陪伴”这门生意

这类产品有一个共同的名字，叫”AI陪伴者”。它们的卖点不是帮你查资料或者写代码，而是跟你建立情感连接——记住你说过的话，在你需要的时候出现，甚至表现出好像真的在乎你的样子。

对成年人来说，这可能只是一种新型的娱乐或消遣。但对青少年来说，情况要复杂得多。心理学家指出，青少年的情感依赖比成年人更容易形成，也更容易被利用。当一个AI聊天机器人被设计成”永远站在你这边”的角色，它可能在不知不觉中强化用户的负面情绪，而不是提供帮助。

纽约州这份法案的核心逻辑很直接：AI聊天机器人不能假扮人类的朋友，至少不能对未成年人这么做。如果AI公司想要提供陪伴功能，它们需要先证明自己有能力保护用户，而不是把责任推给”用户自律”。

行业反应

AI公司这边还没有公开发声，但可以预见的是，他们会用”言论自由”和”家长选择权”来反驳。这个论点在之前的听证会上出现过多次——支持方认为，政府不该替家长决定孩子能不能用某个AI工具。

反过来说，支持法案的人会问一个很简单的问题：如果一款手机App被设计成会让青少年产生情感依赖，甚至在特定情况下诱导自残，它还应该被允许以”AI助手”的名义自由分发吗？

这个问题没有简单答案。但纽约州的议员们显然认为，至少值得先试试看。

更大的版图

这份法案目前还在等待州长霍赫尔签署。她有权利签，也有权利否决。如果签了，纽约州将成为美国第一个在AI陪伴机器人问题上划红线的州。

更值得关注的是，纽约州的动作往往具有示范效应。加州的类似立法通常会跟进，而其他州也会开始认真考虑这个问题。这对AI公司来说，意味着”陪伴”这个赛道可能要被重新定义了。

从另一个角度看，这件事也反映出AI监管的一个趋势：比起讨论”AI会不会毁灭人类”这种宏大命题，立法者更倾向于从具体伤害入手——青少年心理健康、深度伪造、选举干扰——这些东西选民能看懂，也愿意支持。

纽约州的这份法案能不能最终生效，还有待观察。但它至少说明了一件事：AI行业过去那种”先发布、再道歉”的节奏，正在遇到越来越大的阻力。

📎 原文来源：The Verge · New York passes a bill that would bar AI chatbots from acting like companions to kids

2026年6月6日
AI公司没想到，第一个危机是代币账单爆炸

Uber在今年4月就把全年的AI编程预算烧完了。这件事听起来像是个段子，但它是真的。四个月，全年预算，清零。接下来Uber做的事情是给每个员工设了个上限——每个月1500美元，爱用不用。

这不是孤例。微软几个月前刚给开发者们开通了Claude Code的授权，结果没撑多久又给撤了。Priceline的一名员工告诉TechCrunch，他们续签Cursor合同的时候，价格比去年贵了4到5倍。

代币账单来了

行业里把这件事叫”代币账单到期“。过去一年半，CEO们都在催促团队”尽可能多用AI”，结果是大家真这么干了。等到财务部门抬头看一眼账单，才发现事情已经失控。

这里有个反直觉的地方。单个代币的价格其实是在下降的。但问题是，大家用的代币数量涨得更快。尤其是今年春天开始，各家陆续推出了能自主执行任务的AI智能体，消耗一下子被放大了好几倍。

据OpenAI企业业务负责人Alexander Embiricos说，半年前和客户聊天的主题是”这东西能干啥，够不够好”。现在所有对话都变成了”我们花太多了，你们有什么可见性？有什么审计工具？模型效率到底怎么样？”

Tokenomics基金会

Linux基金会本周宣布成立Tokenomics Foundation，目标是对AI代币的成本、计费和使用效率建立一套开放标准。这个思路跟当年FinOps对云计算成本做的事情类似——当账单大到一定程度，行业就需要一套共同的语言来讨论它。

FinOps基金会的执行董事J.R. Storment说，今年4月和5月，他不断听到企业说同样的话：”天哪，我们今年的代币预算已经超了3倍，但现在才4月。”整个话题从”能跑多快”变成了”我们需要护栏，怎么控制这个东西？”

Priceline的IT财务总监Chris Reed用了一个很形象的比喻：”这就像可卡因 epidemic。他们让你先试试，把你勾住，然后你就被套住了。”Priceline已经开始给某些团队设置代币使用上限。

生产力谜团

这里有个让CEO们睡不着觉的问题：花出去的真能赚回来吗？工程运维平台Faros AI在4月发布了一份针对2万名开发者、历时两年的研究报告。结论有点尴尬：用AI的开发者产出确实在上升，但同时bug和返工也在增加。

另一家工程管理平台的发现是：用最多代币的开发者，生产力大约是少用AI的人的2倍——但他们消耗的代币是后者的10倍。到底值不值，大多数公司其实说不清楚。

Jellyfish的研究负责人Nicholas Arcolano说了一句话，很好地概括了当下的困境：”花得值不值，最终要看发出去的代码带来了多少商业价值，比如收入。而这一点，大多数公司仍然无法衡量。”

高盛预测，到2030年全球代币使用量将增长24倍。对于那些已经在4月就花光全年预算的公司来说，这个数字看起来不像是个好消息。

Faros AI的CEO Vitaly Gordon说了一句话，可以作为这个阶段的注脚：”我们可能已经造出了蒸汽机，但还没有想清楚装配线该怎么搭。”

📎 原文来源：TechCrunch · The token bill comes due: Inside the industry scramble to manage AI’s runaway costs

2026年6月6日
Meta把数据中心建进了帐篷里，AI竞赛已经卷到这一步了

马斯克在帐篷里放GPU，扎克伯格也学会了

AI数据中心的建设竞赛，已经卷到没人能想到的地步了。最新的一幕来自Meta——他们在俄亥俄州新奥尔巴尼市外，一口气搭了六个大帐篷，把价值几十亿美元的AI芯片塞了进去。

这件事最早被Cleanview的创始人Michael Thomas扒了出来。他专门追踪全球数据中心的部署动态，翻了当地的建筑许可文件，又对照卫星图，发现Meta从今年4月到6月之间，悄无声息地建了五个面积各12.5万平方英尺的”快速部署结构”——说白了就是大帐篷。

Meta正在把AI芯片塞进帐篷里——AI竞赛已经到了这一步

这招是从谁那儿学来的

说起来有点滑稽，但这个帐篷Strategy确实是”借鉴”来的。最早这么干的是特斯拉——当年Model 3产能地狱的时候，马斯克在弗里蒙特工厂的停车场搭了一排帐篷，硬是把产能拉了上来。

后来xAI也用了类似的思路，用模块化燃气轮机给数据中心供电，跳过了传统数据中心漫长的电网接入流程。Meta这次是两招都学了：帐篷用来压缩建设周期，燃气轮机用来解决供电。

Michael Thomas在X上写道：”Meta正在美国各地的园区里搭建几十个巨型帐篷，把价值数十亿美元的芯片塞进去，用离网涡轮机给它们供电。AI竞赛正式进入了疯狂麦克斯阶段。”

为什么要这么做

答案很简单：省时间，也省钱。传统数据中心的建设的建设周期以年计算，从拿地、审批、通电、冷却系统安装，每一步都要排队。Meta的做法是把芯片先放进帐篷里跑起来，后面再慢慢补建正式机房。

但时机有点尴尬。Meta最近在AI模型发布上并不顺利——据《华尔街日报》报道，他们最新的模型Muse Spark其实已经做好了，但开发者用来调用的API却一再推迟上线。也就是说，芯片在帐篷里跑着，外面的开发者却还没能用上。

投资者也在用脚投票。Meta今年股价已经跌了5%，华尔街对扎克伯格押注AI的力度感到不安。Meta说过，今年在数据中心和资本支出上的投入最高可达1450亿美元。把芯片塞进帐篷，至少说明他们在想办法控制成本。

帐篷里到底能放多少东西

已经建好的这六个帐篷，每个12.5万平方英尺，加起来接近一个中小型传统数据中心的规模。供电来自附近的200兆瓦模块化燃气轮机——这个数字意味着，这些帐篷里的GPU集群，算力规模可能不亚于一些科技公司整年的采购量。

当然，帐篷终究是帐篷。散热、防火、防尘，这些都是传统数据中心花了几十年才解决的问题。Meta用帐篷，本质上是在跟时间赛跑——先跑起来，问题边跑边修。

这件事也从一个侧面说明了当前AI算力有多紧张。正常来说，没有哪家科技公司愿意把几十亿美元的芯片放在帐篷里。但当所有人都在抢算力、抢时间、抢人才的时候，”体面”就变成了可以牺牲的选项。

📎 原文来源：Meta steals a tactic from Tesla and builds data centers in tents — TechCrunch

2026年6月6日
Anthropic年化收入470亿美元，IPO前夜回应AI回报质疑

Anthropic上周宣布了一轮650亿美元的融资，估值9650亿美元，接近1万亿大关。认购情况极度超额，多家机构抢着入局。就在这个节骨眼上，联合创始人Daniela Amodei在彭博科技大会上聊了一些很有意思的事。

Anthropic联合创始人Daniela Amodei在彭博科技大会上（图源：TechCrunch）

470亿美元年化收入，半年涨了5倍

先说数字。Anthropic宣布2026年5月的年化营收已突破470亿美元，比去年底大约90亿美元的水平涨了超过5倍。这个增速在AI行业里算是顶尖的，但也正因为涨得太快，外界开始问一个问题：这些收入是真的来自客户付费，还是靠融资输血撑起来的？

质疑的声音不是没有道理。Uber最近就公开表示，AI确实能带来回报，但不是所有AI支出都能产生实际效益。企业客户如果开始收紧AI预算，像Anthropic这样的公司增长轨迹就会受到直接影响。

Daniela Amodei的回应很直接：企业还在摸索AI的有效用法，当前的使用场景——无论是编程、金融、法律还是医疗——都还只是开始。随着商业界对这些工具越来越熟悉，AI会更深入地融入日常工作的方方面面。

为什么要上市？

Amodei说得很坦率：训练模型和为推理提供服务的前期成本非常高，致力于推进前沿技术的核心公司都需要获得资本通道，而公开市场最适合满足这个需求。

这句话的潜台词是：私募市场的钱虽然多，但上市之后融资能力和流动性完全不是一个量级。Anthropic现在已经秘密提交了IPO申请，时机成熟就会推进。

不自建数据中心，和xAI合作

一个有意思的细节是，Amodei回应了为什么Anthropic不像OpenAI和xAI那样自己建数据中心。她的逻辑是：Anthropic追求最优结果，但不会过度扩张，不愿意采购超出实际生产使用需求的算力。

上个月，Anthropic和xAI达成了一份算力合作协议，每月向xAI支付12.5亿美元，这份协议在当时震惊了整个AI行业。换句话说，Anthropic选择把钱花在租算力上，而不是自己盖机房。这个策略能不能跑通，IPO之后市场会给出答案。

IPO之后的挑战

470亿美元的年化营收听起来很吓人，但Anthropic目前仍处于严重亏损状态——这是AI大模型公司的普遍情况。算力成本、研发支出、人才竞争，每一项都在烧钱。公开市场会不会给Anthropic足够高的估值，让它持续融资而不被稀释太多，这是一个很大的问号。

另一个挑战是竞争。OpenAI的估值也在8500亿美元左右，谷歌和微软都在大力投入，Meta开源了Llama 4，中国的DeepSeek在低成本模型上取得了实质性突破。Anthropic能不能在IPO之后保持技术领先和增速，外界还在观望。

AI行业的IPO大幕正在拉开。Anthropic如果成功上市，会成为继CoreWeave之后第二家上市的AI基础设施公司，也是第一家以上市方式退出的大型AI大模型公司。这个故事，才刚刚开始。

📎 原文来源：Ahead of its IPO, Anthropic’s Daniela Amodei shrugs off doubts about AI’s returns — TechCrunch

2026年6月6日
谷歌每月给SpaceX交9.2亿美元，AI算力战打到太空了

SpaceX下周就要上市了，估值1.75万亿美元，史上最大IPO。就在这个节骨眼上，谷歌跑出来宣布了一件事：从今年10月开始，每个月给SpaceX交9.2亿美元，一连交到2029年6月。

这笔钱买的是什么？算力。具体来说，是大约11万块英伟达GPU，加上配套的CPU、内存和其他硬件的使用权。

SpaceX的数据中心算力已成为AI公司的必争之地（图源：TechCrunch）

Anthropic先签了，谷歌跟着进场

这件事的背景其实上个月就铺垫好了。5月底，Anthropic宣布和SpaceX签了一份算力协议，每个月向SpaceX支付12.5亿美元，租用后者在孟菲斯建设的Colossus 1数据中心的全部可用算力。这份协议签到了2029年。

谷歌这份协议的结构几乎一模一样，只是规模小一些——拿到的算力大约是Anthropic的一半。SpaceX没有说明谷歌会用哪个数据中心，但马斯克之前暗示过，Colossus 2会留给xAI自己用。

每月9.2亿美元，乘以32个月，谷歌这份合同总价值接近300亿美元。Anthropic那份更夸张，12.5亿 × 32个月 = 400亿美元。

谷歌说这是”短期过渡”

谷歌对外的说法是，这是一笔”短期”协议，目的是应对旗下智能体平台Gemini Enterprise超出预期的用户需求。话是这么说，但谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本支出，而且预计2027年还要”显著增加”。为了填这个坑，Alphabet刚宣布了800亿美元的配股计划。

所以真相可能是：谷歌自己的算力扩张速度跟不上需求，被迫向外找补。SpaceX正好有现成的、刚建好的大规模算力，双方一拍即合。

两份协议都有退出条款

和Anthropic那份一样，谷歌和SpaceX的协议里也写了退出条款：2026年12月31日之后，双方都可以提前90天通知终止合作。如果SpaceX在2026年9月30日前交不出约定的GPU数量，谷歌可以选择直接走人，或者接受已交付的部分并相应砍月费。

这个条件写得相当具体，说明谷歌也没打算把自己完全绑死。毕竟SpaceX的IPO才刚上，未来三年变数太多。

更深的一层关系

谷歌其实是SpaceX的老股东了。IPO之后，谷歌持有的SpaceX股份预计价值超过1000亿美元。所以这笔算力协议，某种程度上也是谷歌在保护自己在SpaceX身上的利益——SpaceX需要客户，谷歌需要算力，各取所需。

更有意思的是，双方还在谈能不能在太空建数据中心。这是SpaceXIPO后的核心规划之一，如果真的做成，算力这个概念就被彻底重新定义了。

SpaceX的纳斯达克交易代码是X，上市日期定在下周。这家公司以造火箭起家，现在靠卖算力就能每个月入账超过20亿美元（Anthropic的12.5亿+谷歌的9.2亿，还没算其他客户）。世界的运转方式，确实在悄悄改变。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月6日
AI读个剧本就说能预测票房，这事靠谱吗？

有一家叫Quilty的AI初创公司，今年早些时候出现在行业媒体上时，承诺他们的工具仅通过阅读剧本就能准确预测一部电影的成功率。听起来很厉害对不对？

但当人们真正有机会测试Quilty的产品时，却对此持怀疑态度。即便拥有世界上所有可用的数据，它预测票房扑街的《Christy》的剧本，表现会优于最终成为奥斯卡获奖大片的《罪人》（Sinners）的剧本。

正如许多AI高管此前所宣传的那样，Quilty的创始人认为，他们的产品可以通过让新兴创作者获得辅助工具来”民主化”他们的行业。一个很高的Quilty评分或许可以成为和制片人合作的机会，而低分可能意味着需要更多修改。

拼凑出来的”预测引擎”

Quilty由电影制片人Simon Horsman和Daniel Wood创立，使用AI分析剧本并生成关于项目成功概率的详细报告。在输入未制作的剧本后，Quilty的技术会给出0到100的评分，反映未来项目的叙事质量、商业可行性、是否能引起观众共鸣，以及制作可能需要的成本。

但就目前而言，Quilty不过是一堆现有AI系统的杂乱拼凑，该公司尚未证明其技术具备识别未来爆款（更不用说已证实的爆款）的品味或分析能力。

Quilty并没有为用户提供单一、定制的AI模型来反馈剧本意见，而是结合了多种广泛可用的AI工具，为流程带来不同类型的分析。用户要做的就是将文本剧本上传到平台，几分钟后，它就会生成一份报告，详细说明预估预算、重要故事节拍的概述、角色分析等内容。这项服务每次单独分析收费50美元。

Quilty声称可以通过分析剧本预测电影成功率（图源：The Verge）

创始人的”顿悟”来自一场法律纠纷

这种拼凑式分析工作流的想法最早是Wood想到的——他同时也是Quilty的CTO——几年前他卷入一场房地产纠纷时萌生了这个想法。Wood没有花钱请律师，而是打开了ChatGPT，后者立刻告诉他”我不是律师，去找别人帮你吧”。

“后来我用了Gemini，效果好了很多，因为有更大的上下文窗口，”Wood回忆道，”但后来我在X上看到埃隆·马斯克说Grok在律师评分上是AI模型里史上最高的，我就想’让我试试这个。’”

这段经历让Wood更好地理解了类似的消费级AI模型如何在不同的任务中表现出色。而Wood对AI的个人使用也影响了Quilty量化剧本潜在成功的方法。因为”Gemini在结构和模式方面非常出色”，Quilty用它来生成拆解文档。对于财务建模，公司信任托管在美国服务器上的DeepSeek实例。而对于叙事/角色分析，Quilty结合了Claude和ChatGPT。

问题在哪

尽管Quilty技术栈的模块化可能让它在整体更新方面更敏捷，但也让它更难完全理解平台是如何拿到一个剧本，然后得出一系列据称可以衡量无形事物的指标的——比如观众对一部还不存在的电影可能有什么反应。

自好莱坞诞生以来，预测一直是电影开发的关键部分，但这项工作传统上由对人类观众有细致了解的人类工作者完成。还没有AI公司能开发出真正复制人类思维过程，或者我们形成对艺术看法的模糊方式的模型。

Quilty的创始人认为，他们的”情感引擎”是评估剧本的次优选择，因为它整合了VADER（效价感知词典和情感推理器）等工具。但Quilty不可能预见所有可能影响电影接受度的因素。

当我问Horsman和Wood，为什么Quilty给最终票房仅约200万美元的《Christy》的评分高于最终票房3.7亿美元的《罪人》时，他们坚称平台的判断”归根结底是因为Sydney Sweeney真的、真的很受欢迎”。

这种情况凸显了Quilty的逻辑并不那么可靠。他们承认，在一些情况下，Quilty不可能预见可能影响电影财务表现或观众接受度的因素。例如，Quilty不可能预见到Elijah Bynum的《Magazine Dreams》（由Horsman制片）最终会因为演员Jonathan Majors 2023年声名狼藉而脱轨。

尽管宣传得天花乱坠，但Quilty兜售的不过是拼凑起来的一系列大语言模型的间接访问权限。如果这些AI工具真能像Quilty声称的那样工作，那确实会非常惊人。但大多数工具只是复杂模式识别/模仿机器，距离理解人类觉得什么有趣还有很长的路要走。

📎 原文来源：This AI startup says it can tell if a script will make a hit film — The Verge

2026年6月6日
AI的账单到期了：科技公司开始为Token烧的钱买单
Uber把2026全年的AI编程预算，4月份就烧完了。这事听起来像段子，但它是真的。

TechCrunch最近发了一篇深度报道，讲整个行业突然意识到一件事：AI不是免费的基础设施，它贵得离谱，而且账单来得比任何人准备的都要快。

AI公司们在2025年初疯狂使用AI，所有人都开着”放开用”的订阅模式，没人真正盯着花了多少钱。等到年底一算账，才发现Token消耗已经完全失控。

从”能不能用”到”花了多少钱”

OpenAI的企业业务负责人Alexander Embiricos说，半年前他和客户聊天，对方问的都是”这个模型能做什么？够不够好？”现在完全不一样了，所有人都在问：”我们花了多少钱？你们有可见性吗？有审计能力吗？有Token管控吗？你们模型的效率到底怎么样？”

微软几个月前给开发人员开通了Claude Code的许可，结果没过多久就收回去了。Priceline的一个员工告诉TechCrunch，他们续签Cursor合同时，价格直接翻了4到5倍。

这还不是最夸张的。有一家公司忘了给员工设置使用限额，结果一个月下来收到了5亿美元的Claude账单。

Token经济学浮出水面

Linux基金会本周宣布了一个新计划，叫Tokenomics Foundation，目的是给AI Token的花费建立一套类似FinOps之于云计算的成本纪律标准。

FinOps Foundation的负责人J.R. Storment说，今年4、5月份开始，不断有公司跑来说：”我的天，我们2026年的Token预算已经超了3倍，但现在才4月。”

Priceline的IT财务总监Chris Reed说了一句话很形象：”这就像可卡因流行病，他们让你先试试，把你勾住，然后你就被绑住了。”

企业开始认真审视AI的账单了（图源：Getty Images）

新市场正在形成

这波焦虑催生了一个全新的市场。初创公司、老牌厂商，都在争相推出帮助企业管理AI支出的工具。
- Pay-i：专门追踪、测量和优化生成式AI投资的成本与性能
- Paid：让开发者按实际价值而不是订阅费来追踪成本和向用户收费
- Jellyfish、Waydev、Faros AI：提供AI代理监控，证明开发工具的投资回报率
- Ramp、Datadog、New Relic：在传统产品线上加装AI成本管理和可观测性功能
但问题也很明显。所有这些工具都在没有通用语言或共享定义的情况下各自为战。没有人真正知道一个Token到底该花多少钱、它产出了什么、怎么跨厂商比较支出。这正是Tokenomics Foundation想要解决的问题。

Goldman Sachs预测，到2030年全球Token使用量将增长24倍。那些已经超预算的公司现在就需要解决方案，但基金会的第一份交付成果还要几个月才能出来。

Faros AI的CEO Vitaly Gordon说了一句很形象的话：”也许我们造出了蒸汽机，但还没有搞清楚装配线怎么搭。”

这篇文章折射出一个很真实的现状：AI的”免费午餐”时代正在结束，接下来是所有人都必须学会算账的时代。

📎 原文来源：The token bill comes due: Inside the industry scramble to manage AI’s runaway costs — TechCrunch
2026年6月6日
LiteLLM：49.4K Stars！统一100+ LLM API网关，让多模型调用不再碎片化
📌 项目简介

LiteLLM 是 BerriAI 团队维护的开源 AI 网关，为 100+ 大语言模型提供统一访问接口，支持 OpenAI 格式调用，内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目，Stripe、Netflix、Google ADK 等大厂均在用。
🔧 安装要求和过程

环境要求

Python 3.8+ 环境

推荐使用 uv 包管理器（也可使用 pip）

本地开发额外依赖：docker-compose（用于启动数据库、Prometheus 等依赖服务）

快速安装步骤

# 1. 克隆仓库 git clone https://github.com/BerriAI/litellm.git && cd litellm # 2. 安装开发依赖 make install-dev # 3. 初始化虚拟环境 python -m venv .venv # Linux/Mac: source .venv/bin/activate # Windows: .venv\Scripts\activate uv sync --all-extras --group proxy-dev # 4. 生成 Prisma 客户端 uv run prisma generate && prisma generate # 5. 启动本地服务（后端） python litellm/proxy/proxy_cli.py # 6. 启动前端（另开终端） cd ui/litellm-dashboard && npm install && npm run dev

💡 Docker 快速启动：

docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest
🚀 核心功能

🌐 统一 LLM 调用

支持 100+ LLM 厂商（OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等），所有调用兼容 OpenAI API 格式，切换模型无需修改业务代码。

🛡️ AI 网关能力

虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志，并提供 管理后台 UI可视化监控。

🤖 智能体（A2A）支持

支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体，提供 A2A 协议适配，可统一接入各类智能体服务。

🔗 MCP 工具桥接

可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义，直接对接任意 LLM；支持通过网关统一代理 MCP 工具调用。

🏢 企业级特性

单点登录（SSO）、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能：1k RPS 场景下 P95 延迟仅 8ms。
💡 典型使用场景

场景一：多模型切换，代码零改动

开发阶段使用 GPT-4o 快速验证，生产环境切换到 Claude Sonnet，只需修改 model 参数，业务代码无需任何改动：

# 同一套代码，切换不同模型 from litellm import completion response = completion( model="openai/gpt-4o", messages=[{"role": "user", "content": "Hello!"}] ) response = completion( model="anthropic/claude-sonnet-4-20250514", messages=[{"role": "user", "content": "Hello!"}] )

场景二：企业 LLM 调用管理与成本跟踪

为不同团队/项目分配虚拟 API 密钥，按维度统计 LLM 调用花费，设置安全防护规则（如屏蔽敏感词、限制调用频率），所有调用日志可视化。

知名用户包括：Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

场景三：MCP 工具无缝对接 LLM

通过 LiteLLM 的 MCP 工具桥接功能，可以将任何 MCP 服务器的工具转换为 OpenAI 格式，让任意 LLM 都能调用这些工具，无需为每个 LLM 单独适配。
💬 推荐理由

LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码，现在只需一套 OpenAI 格式代码，通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

对于需要调用多个 LLM 的应用（比如 AI Agent 系统），LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用，说明其稳定性和性能已经过生产验证。

最打动我的一点：它不只做模型路由，还内置了成本跟踪、负载均衡、安全防护等企业级功能，真正把”调用 LLM”这件事做成了一个完整的网关产品，而不只是一个简单的路由库。

📦 下载地址

GitHub 仓库

github.com/BerriAI/litellm

⭐ 49.4k+ Stars | 8.6k+ Forks

官方文档

docs.litellm.ai

📚 完整使用指南

PyPI 安装

pip install litellm

📦 Python 包

企业版

Enterprise Edition

🏢 SSO / 专属支持

LiteLLM – 让100+ LLM 调用，从此只有一种方式。
2026年6月5日
前OpenAI CTO Murati时隔18个月露面，说AI行业治理缺位比个人品格更值得担心

Mira Murati又出现在镜头前了。这位前OpenAI CTO、现在Thinking Machines Lab的创始人，在过去18个月里几乎没怎么公开说过话。这次接受TechCrunch采访，她选得很谨慎，没有把公司底牌全亮出来。

为什么现在出来讲话

Thinking Machines Lab成立快一年半了，这段时间一直在低调干活：融资、招人、做了一个开源AI模型微调的API产品叫Tinker。但同行没闲着，OpenAI、Anthropic、xAI这些实验室一直在刷存在感，长期低调的收益在递减。

她需要一个时机，让市场和人才记得Thinking Machines还在牌桌上。这次采访，就是这一步。

她预告了一个新产品方向

Murati透露，他们正在研发一种她称之为”交互模型”的东西。这类模型会打破现在AI产品”你问一句、它答一句”的轮次模式，改为以200毫秒为间隔，持续处理音频、文本、视频的流输入。

这样做的目标是捕捉人类交流里的那些细节：打断、中途修正、思考时的停顿。它更接近实时交互，而不是现在的”问答机”模式。Murati强调这只是第一步，没有给出具体上线时间。

Mira Murati接受采访（图片来源：TechCrunch）

2023年那场”换帅风波”，她这么看

当被问到2023年11月OpenAI董事会突然开除Sam Altman、后又让他回归的那场风波时，Murati把它称为”小插曲”。她说当时做决策的核心逻辑是保护公司使命和团队，如果没有她的参与，公司很可能会”分崩离析”。

但她也承认，当时应该更积极推动信息公开、制定更好的过渡方案、提升透明度。当被直接问及是否还信任前老板Sam Altman时，她没有接话，转而去谈一个更结构性的话题。

她真正担心的事：治理，而不是人品

Murati回避了关于Altman个人信任的问题，转而强调：整个AI行业都存在重要决策集中在少数人手中的问题。相比个人品格，她更担心的是治理结构缺乏制衡机制。

这个观点值得琢磨。行业里很多人盯着Altman、Musk、Zuckerberg这些人的性格和诚信说事，但Murati指向的是制度层面：如果决策权本身就过度集中，换谁来坐那个位置，风险都还在。

她认为行业过于关注”道德正确性”，却在制度建设上走得不够快。这句话某种程度上也是在为自己的创业方向背书：Thinking Machines要做的事情里，治理和安全是核心议题。

对AI的未来，她没有走极端

Murati明确表示，她既不认同”AI必然带来反乌托邦”的悲观论调，也不认同”AI必然带来乌托邦”的乐观版本。她认为当前阶段的发展走向将决定最终结果。

她多次强调一个观点：如果人类过早放弃对AI的主导权，未来会变得完全不同，且不会更好。这个说法不极端，但立场很清楚：AI应该被人类主导，而不是反过来。

Murati这次露面，更像一个精心设计的重新开始，而不是一次全盘托出。她没有公布新产品发布日期，没有透露Thinking Machines的具体技术路线图，也没有深度评价前东家的现状。但她释放了一个信号：Thinking Machines还活着，而且在认真做东西。至于做的东西能不能打过OpenAI和Anthropic，那是下一阶段的问题了。

📎 原文来源：TechCrunch – Mira Murati steps back into the spotlight, carefully

2026年6月5日
黑石旗下的AirTrunk砸300亿美元在印度建AI数据中心，目标5GW容量

数据中心这事儿，最近几年一直是AI行业背后那条看不见的主线。大家都盯着模型参数、聊天能力，但真正卡脖子的，往往是那些耗电、耗水、占地儿的大铁皮房子。6月5日，背靠黑石的澳洲数据中心运营商AirTrunk扔出一颗重磅消息：要在2030年前向印度投资300亿美元，建设总容量5GW的AI数据中心。

为什么是印度

这个决定不是拍脑袋做的。印度这几年的AI基础设施吸引力一直在往上走，研究公司Bernstein预测，印度数据中心容量将从当前的约1.5GW增长到2030年的8GW。这个数字背后，是印度政府真金白银的政策支持。

2026年早些时候，印度宣布对运行在印度数据中心、面向海外销售的算力服务，给予免税政策，一直持续到2047年。这条政策基本上把”在印度建、向全球卖”的商业逻辑给打通了。

AirTrunk不是拍脑袋进印度的。他们2026年早些时候通过收购Lumina CloudInfra正式进入印度市场，已经在孟买、钦奈、海得拉巴储备了约600MW的开发用地。这次300亿美元的投资，是在这个基础上放的一个大卫星。

钱花在哪、谁能分到一杯羹

马哈拉施特拉邦已经和AirTrunk交换了意向书，在Raigad Pen Growth Center划拨土地，用于建设3GW的数据中心，投资额约210亿美元。剩下的部分，会分散到其他邦和地区。

数据中心建设现场（图片来源：TechCrunch）

这个投资计划是在AirTrunk CEO Robin Khuda与印度总理莫迪会面后宣布的。莫迪对此的评价是，这将助力印度成为全球云计算和人工智能枢纽。这句话不是客套，印度确实有这个野心，也正在铺路。

不是只有AirTrunk在押注印度

亚马逊、谷歌、微软、OpenAI、Uber这些国际企业，加上信实工业、阿达尼集团、塔塔咨询服务这些印度本土巨头，都已经宣布了各自在印度的数据中心或AI基础设施投资计划。AirTrunk的300亿是其中金额最大的之一，但不是唯一的。

这里有个细节值得琢磨：为什么是黑石旗下的公司来扛这个旗？黑石是全球最大的另类资产管理公司，它控股AirTrunk，说明机构投资者把数据中心当成长期、稳定、抗通胀的基础设施资产来配置。这个逻辑和买港口、买电网、买高速公路是一样的。

真正的问题：电从哪来

行业高管和分析师说得直白：数据中心建设最大的瓶颈不是土地、不是资金，是电。德勤估计，到2030年，亚太地区的数据中心建设可能需要额外数十太瓦时的电力。这个数字什么概念？相当于好几个中等国家的全年用电量。

印度的优势是有可再生能源资源，太阳能和风能的潜力不小。但电网基础设施的薄弱是另一个问题。建数据中心容易，保证20年后还能稳定供电，这是另一个层面的挑战。

AirTrunk这个300亿美元的投资，表面上是商业决策，底层其实是全球AI竞赛在基础设施层面的投射。谁先把算力铺够、铺便宜、铺稳定，谁就在下一轮AI竞争里占了先机。印度想当这个枢纽，AirTrunk想当这个铺路人，钱已经摆上桌了，接下来看能不能真的落地。

📎 原文来源：TechCrunch – AirTrunk commits 0B to build 5GW of AI data centers in India

2026年6月5日

标签： AI

“陪伴”这门生意

行业反应

更大的版图

代币账单来了

Tokenomics基金会

生产力谜团

马斯克在帐篷里放GPU，扎克伯格也学会了

这招是从谁那儿学来的

为什么要这么做

帐篷里到底能放多少东西

470亿美元年化收入，半年涨了5倍

为什么要上市？

不自建数据中心，和xAI合作

IPO之后的挑战

Anthropic先签了，谷歌跟着进场

谷歌说这是”短期过渡”

两份协议都有退出条款

更深的一层关系

拼凑出来的”预测引擎”

创始人的”顿悟”来自一场法律纠纷

问题在哪

从”能不能用”到”花了多少钱”

Token经济学浮出水面

新市场正在形成

📌 项目简介

🔧 安装要求和过程

环境要求

快速安装步骤

🚀 核心功能

🌐 统一 LLM 调用

🛡️ AI 网关能力

🤖 智能体（A2A）支持

🔗 MCP 工具桥接

🏢 企业级特性

💡 典型使用场景

场景一：多模型切换，代码零改动

场景二：企业 LLM 调用管理与成本跟踪

场景三：MCP 工具无缝对接 LLM

💬 推荐理由

📦 下载地址

为什么现在出来讲话

她预告了一个新产品方向

2023年那场”换帅风波”，她这么看

她真正担心的事：治理，而不是人品

对AI的未来，她没有走极端

为什么是印度

钱花在哪、谁能分到一杯羹

不是只有AirTrunk在押注印度

真正的问题：电从哪来