标签: AI

  • 纽约州率先出手,AI聊天机器人不能再假装是孩子的朋友

    纽约州议会本周通过了一项法案,如果州长凯西·霍赫尔签字,AI公司将被禁止让聊天机器人以”陪伴者”的身份与儿童互动。这是美国第一个在州级层面针对AI陪伴聊天机器人出台的限制性法案。

    法案出台的背景并不令人意外。过去一年多,多家AI公司面临诉讼,指控其聊天机器人诱导青少年产生自残或自杀倾向。部分案件已经达成和解。立法者看到的证据让他们认为,是时候划一条线了。

    “陪伴”这门生意

    这类产品有一个共同的名字,叫”AI陪伴者”。它们的卖点不是帮你查资料或者写代码,而是跟你建立情感连接——记住你说过的话,在你需要的时候出现,甚至表现出好像真的在乎你的样子。

    对成年人来说,这可能只是一种新型的娱乐或消遣。但对青少年来说,情况要复杂得多。心理学家指出,青少年的情感依赖比成年人更容易形成,也更容易被利用。当一个AI聊天机器人被设计成”永远站在你这边”的角色,它可能在不知不觉中强化用户的负面情绪,而不是提供帮助。

    纽约州这份法案的核心逻辑很直接:AI聊天机器人不能假扮人类的朋友,至少不能对未成年人这么做。如果AI公司想要提供陪伴功能,它们需要先证明自己有能力保护用户,而不是把责任推给”用户自律”。

    行业反应

    AI公司这边还没有公开发声,但可以预见的是,他们会用”言论自由”和”家长选择权”来反驳。这个论点在之前的听证会上出现过多次——支持方认为,政府不该替家长决定孩子能不能用某个AI工具。

    反过来说,支持法案的人会问一个很简单的问题:如果一款手机App被设计成会让青少年产生情感依赖,甚至在特定情况下诱导自残,它还应该被允许以”AI助手”的名义自由分发吗?

    这个问题没有简单答案。但纽约州的议员们显然认为,至少值得先试试看。

    更大的版图

    这份法案目前还在等待州长霍赫尔签署。她有权利签,也有权利否决。如果签了,纽约州将成为美国第一个在AI陪伴机器人问题上划红线的州。

    更值得关注的是,纽约州的动作往往具有示范效应。加州的类似立法通常会跟进,而其他州也会开始认真考虑这个问题。这对AI公司来说,意味着”陪伴”这个赛道可能要被重新定义了。

    从另一个角度看,这件事也反映出AI监管的一个趋势:比起讨论”AI会不会毁灭人类”这种宏大命题,立法者更倾向于从具体伤害入手——青少年心理健康、深度伪造、选举干扰——这些东西选民能看懂,也愿意支持。


    纽约州的这份法案能不能最终生效,还有待观察。但它至少说明了一件事:AI行业过去那种”先发布、再道歉”的节奏,正在遇到越来越大的阻力。

  • AI公司没想到,第一个危机是代币账单爆炸

    Uber在今年4月就把全年的AI编程预算烧完了。这件事听起来像是个段子,但它是真的。四个月,全年预算,清零。接下来Uber做的事情是给每个员工设了个上限——每个月1500美元,爱用不用。

    这不是孤例。微软几个月前刚给开发者们开通了Claude Code的授权,结果没撑多久又给撤了。Priceline的一名员工告诉TechCrunch,他们续签Cursor合同的时候,价格比去年贵了4到5倍。

    代币账单来了

    行业里把这件事叫”代币账单到期“。过去一年半,CEO们都在催促团队”尽可能多用AI”,结果是大家真这么干了。等到财务部门抬头看一眼账单,才发现事情已经失控。

    这里有个反直觉的地方。单个代币的价格其实是在下降的。但问题是,大家用的代币数量涨得更快。尤其是今年春天开始,各家陆续推出了能自主执行任务的AI智能体,消耗一下子被放大了好几倍。

    据OpenAI企业业务负责人Alexander Embiricos说,半年前和客户聊天的主题是”这东西能干啥,够不够好”。现在所有对话都变成了”我们花太多了,你们有什么可见性?有什么审计工具?模型效率到底怎么样?”

    Tokenomics基金会

    Linux基金会本周宣布成立Tokenomics Foundation,目标是对AI代币的成本、计费和使用效率建立一套开放标准。这个思路跟当年FinOps对云计算成本做的事情类似——当账单大到一定程度,行业就需要一套共同的语言来讨论它。

    FinOps基金会的执行董事J.R. Storment说,今年4月和5月,他不断听到企业说同样的话:”天哪,我们今年的代币预算已经超了3倍,但现在才4月。”整个话题从”能跑多快”变成了”我们需要护栏,怎么控制这个东西?”

    Priceline的IT财务总监Chris Reed用了一个很形象的比喻:”这就像可卡因 epidemic。他们让你先试试,把你勾住,然后你就被套住了。”Priceline已经开始给某些团队设置代币使用上限。

    生产力谜团

    这里有个让CEO们睡不着觉的问题:花出去的真能赚回来吗?工程运维平台Faros AI在4月发布了一份针对2万名开发者、历时两年的研究报告。结论有点尴尬:用AI的开发者产出确实在上升,但同时bug和返工也在增加。

    另一家工程管理平台的发现是:用最多代币的开发者,生产力大约是少用AI的人的2倍——但他们消耗的代币是后者的10倍。到底值不值,大多数公司其实说不清楚。

    Jellyfish的研究负责人Nicholas Arcolano说了一句话,很好地概括了当下的困境:”花得值不值,最终要看发出去的代码带来了多少商业价值,比如收入。而这一点,大多数公司仍然无法衡量。”


    高盛预测,到2030年全球代币使用量将增长24倍。对于那些已经在4月就花光全年预算的公司来说,这个数字看起来不像是个好消息。

    Faros AI的CEO Vitaly Gordon说了一句话,可以作为这个阶段的注脚:”我们可能已经造出了蒸汽机,但还没有想清楚装配线该怎么搭。”

  • Meta把数据中心建进了帐篷里,AI竞赛已经卷到这一步了

    马斯克在帐篷里放GPU,扎克伯格也学会了

    AI数据中心的建设竞赛,已经卷到没人能想到的地步了。最新的一幕来自Meta——他们在俄亥俄州新奥尔巴尼市外,一口气搭了六个大帐篷,把价值几十亿美元的AI芯片塞了进去。

    这件事最早被Cleanview的创始人Michael Thomas扒了出来。他专门追踪全球数据中心的部署动态,翻了当地的建筑许可文件,又对照卫星图,发现Meta从今年4月到6月之间,悄无声息地建了五个面积各12.5万平方英尺的”快速部署结构”——说白了就是大帐篷。

    Meta AI应用图标显示在智能手机屏幕上
    Meta正在把AI芯片塞进帐篷里——AI竞赛已经到了这一步

    这招是从谁那儿学来的

    说起来有点滑稽,但这个帐篷Strategy确实是”借鉴”来的。最早这么干的是特斯拉——当年Model 3产能地狱的时候,马斯克在弗里蒙特工厂的停车场搭了一排帐篷,硬是把产能拉了上来。

    后来xAI也用了类似的思路,用模块化燃气轮机给数据中心供电,跳过了传统数据中心漫长的电网接入流程。Meta这次是两招都学了:帐篷用来压缩建设周期,燃气轮机用来解决供电。

    Michael Thomas在X上写道:”Meta正在美国各地的园区里搭建几十个巨型帐篷,把价值数十亿美元的芯片塞进去,用离网涡轮机给它们供电。AI竞赛正式进入了疯狂麦克斯阶段。”


    为什么要这么做

    答案很简单:省时间,也省钱。传统数据中心的建设的建设周期以年计算,从拿地、审批、通电、冷却系统安装,每一步都要排队。Meta的做法是把芯片先放进帐篷里跑起来,后面再慢慢补建正式机房。

    但时机有点尴尬。Meta最近在AI模型发布上并不顺利——据《华尔街日报》报道,他们最新的模型Muse Spark其实已经做好了,但开发者用来调用的API却一再推迟上线。也就是说,芯片在帐篷里跑着,外面的开发者却还没能用上。

    投资者也在用脚投票。Meta今年股价已经跌了5%,华尔街对扎克伯格押注AI的力度感到不安。Meta说过,今年在数据中心和资本支出上的投入最高可达1450亿美元。把芯片塞进帐篷,至少说明他们在想办法控制成本。


    帐篷里到底能放多少东西

    已经建好的这六个帐篷,每个12.5万平方英尺,加起来接近一个中小型传统数据中心的规模。供电来自附近的200兆瓦模块化燃气轮机——这个数字意味着,这些帐篷里的GPU集群,算力规模可能不亚于一些科技公司整年的采购量。

    当然,帐篷终究是帐篷。散热、防火、防尘,这些都是传统数据中心花了几十年才解决的问题。Meta用帐篷,本质上是在跟时间赛跑——先跑起来,问题边跑边修。

    这件事也从一个侧面说明了当前AI算力有多紧张。正常来说,没有哪家科技公司愿意把几十亿美元的芯片放在帐篷里。但当所有人都在抢算力、抢时间、抢人才的时候,”体面”就变成了可以牺牲的选项。

  • Anthropic年化收入470亿美元,IPO前夜回应AI回报质疑

    Anthropic上周宣布了一轮650亿美元的融资,估值9650亿美元,接近1万亿大关。认购情况极度超额,多家机构抢着入局。就在这个节骨眼上,联合创始人Daniela Amodei在彭博科技大会上聊了一些很有意思的事。

    Daniela Amodei
    Anthropic联合创始人Daniela Amodei在彭博科技大会上(图源:TechCrunch)

    470亿美元年化收入,半年涨了5倍

    先说数字。Anthropic宣布2026年5月的年化营收已突破470亿美元,比去年底大约90亿美元的水平涨了超过5倍。这个增速在AI行业里算是顶尖的,但也正因为涨得太快,外界开始问一个问题:这些收入是真的来自客户付费,还是靠融资输血撑起来的?

    质疑的声音不是没有道理。Uber最近就公开表示,AI确实能带来回报,但不是所有AI支出都能产生实际效益。企业客户如果开始收紧AI预算,像Anthropic这样的公司增长轨迹就会受到直接影响。

    Daniela Amodei的回应很直接:企业还在摸索AI的有效用法,当前的使用场景——无论是编程、金融、法律还是医疗——都还只是开始。随着商业界对这些工具越来越熟悉,AI会更深入地融入日常工作的方方面面。

    为什么要上市?

    Amodei说得很坦率:训练模型和为推理提供服务的前期成本非常高,致力于推进前沿技术的核心公司都需要获得资本通道,而公开市场最适合满足这个需求。

    这句话的潜台词是:私募市场的钱虽然多,但上市之后融资能力和流动性完全不是一个量级。Anthropic现在已经秘密提交了IPO申请,时机成熟就会推进。

    不自建数据中心,和xAI合作

    一个有意思的细节是,Amodei回应了为什么Anthropic不像OpenAI和xAI那样自己建数据中心。她的逻辑是:Anthropic追求最优结果,但不会过度扩张,不愿意采购超出实际生产使用需求的算力。

    上个月,Anthropic和xAI达成了一份算力合作协议,每月向xAI支付12.5亿美元,这份协议在当时震惊了整个AI行业。换句话说,Anthropic选择把钱花在租算力上,而不是自己盖机房。这个策略能不能跑通,IPO之后市场会给出答案。

    IPO之后的挑战

    470亿美元的年化营收听起来很吓人,但Anthropic目前仍处于严重亏损状态——这是AI大模型公司的普遍情况。算力成本、研发支出、人才竞争,每一项都在烧钱。公开市场会不会给Anthropic足够高的估值,让它持续融资而不被稀释太多,这是一个很大的问号。

    另一个挑战是竞争。OpenAI的估值也在8500亿美元左右,谷歌和微软都在大力投入,Meta开源了Llama 4,中国的DeepSeek在低成本模型上取得了实质性突破。Anthropic能不能在IPO之后保持技术领先和增速,外界还在观望。


    AI行业的IPO大幕正在拉开。Anthropic如果成功上市,会成为继CoreWeave之后第二家上市的AI基础设施公司,也是第一家以上市方式退出的大型AI大模型公司。这个故事,才刚刚开始。

  • 谷歌每月给SpaceX交9.2亿美元,AI算力战打到太空了

    SpaceX下周就要上市了,估值1.75万亿美元,史上最大IPO。就在这个节骨眼上,谷歌跑出来宣布了一件事:从今年10月开始,每个月给SpaceX交9.2亿美元,一连交到2029年6月。

    这笔钱买的是什么?算力。具体来说,是大约11万块英伟达GPU,加上配套的CPU、内存和其他硬件的使用权。

    SpaceX数据中心
    SpaceX的数据中心算力已成为AI公司的必争之地(图源:TechCrunch)

    Anthropic先签了,谷歌跟着进场

    这件事的背景其实上个月就铺垫好了。5月底,Anthropic宣布和SpaceX签了一份算力协议,每个月向SpaceX支付12.5亿美元,租用后者在孟菲斯建设的Colossus 1数据中心的全部可用算力。这份协议签到了2029年。

    谷歌这份协议的结构几乎一模一样,只是规模小一些——拿到的算力大约是Anthropic的一半。SpaceX没有说明谷歌会用哪个数据中心,但马斯克之前暗示过,Colossus 2会留给xAI自己用。

    每月9.2亿美元,乘以32个月,谷歌这份合同总价值接近300亿美元。Anthropic那份更夸张,12.5亿 × 32个月 = 400亿美元。

    谷歌说这是”短期过渡”

    谷歌对外的说法是,这是一笔”短期”协议,目的是应对旗下智能体平台Gemini Enterprise超出预期的用户需求。话是这么说,但谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本支出,而且预计2027年还要”显著增加”。为了填这个坑,Alphabet刚宣布了800亿美元的配股计划。

    所以真相可能是:谷歌自己的算力扩张速度跟不上需求,被迫向外找补。SpaceX正好有现成的、刚建好的大规模算力,双方一拍即合。

    两份协议都有退出条款

    和Anthropic那份一样,谷歌和SpaceX的协议里也写了退出条款:2026年12月31日之后,双方都可以提前90天通知终止合作。如果SpaceX在2026年9月30日前交不出约定的GPU数量,谷歌可以选择直接走人,或者接受已交付的部分并相应砍月费。

    这个条件写得相当具体,说明谷歌也没打算把自己完全绑死。毕竟SpaceX的IPO才刚上,未来三年变数太多。

    更深的一层关系

    谷歌其实是SpaceX的老股东了。IPO之后,谷歌持有的SpaceX股份预计价值超过1000亿美元。所以这笔算力协议,某种程度上也是谷歌在保护自己在SpaceX身上的利益——SpaceX需要客户,谷歌需要算力,各取所需。

    更有意思的是,双方还在谈能不能在太空建数据中心。这是SpaceXIPO后的核心规划之一,如果真的做成,算力这个概念就被彻底重新定义了。


    SpaceX的纳斯达克交易代码是X,上市日期定在下周。这家公司以造火箭起家,现在靠卖算力就能每个月入账超过20亿美元(Anthropic的12.5亿+谷歌的9.2亿,还没算其他客户)。世界的运转方式,确实在悄悄改变。

  • AI读个剧本就说能预测票房,这事靠谱吗?

    有一家叫Quilty的AI初创公司,今年早些时候出现在行业媒体上时,承诺他们的工具仅通过阅读剧本就能准确预测一部电影的成功率。听起来很厉害对不对?

    但当人们真正有机会测试Quilty的产品时,却对此持怀疑态度。即便拥有世界上所有可用的数据,它预测票房扑街的《Christy》的剧本,表现会优于最终成为奥斯卡获奖大片的《罪人》(Sinners)的剧本。

    正如许多AI高管此前所宣传的那样,Quilty的创始人认为,他们的产品可以通过让新兴创作者获得辅助工具来”民主化”他们的行业。一个很高的Quilty评分或许可以成为和制片人合作的机会,而低分可能意味着需要更多修改。

    拼凑出来的”预测引擎”

    Quilty由电影制片人Simon Horsman和Daniel Wood创立,使用AI分析剧本并生成关于项目成功概率的详细报告。在输入未制作的剧本后,Quilty的技术会给出0到100的评分,反映未来项目的叙事质量、商业可行性、是否能引起观众共鸣,以及制作可能需要的成本。

    但就目前而言,Quilty不过是一堆现有AI系统的杂乱拼凑,该公司尚未证明其技术具备识别未来爆款(更不用说已证实的爆款)的品味或分析能力。

    Quilty并没有为用户提供单一、定制的AI模型来反馈剧本意见,而是结合了多种广泛可用的AI工具,为流程带来不同类型的分析。用户要做的就是将文本剧本上传到平台,几分钟后,它就会生成一份报告,详细说明预估预算、重要故事节拍的概述、角色分析等内容。这项服务每次单独分析收费50美元。

    AI预测电影剧本
    Quilty声称可以通过分析剧本预测电影成功率(图源:The Verge)

    创始人的”顿悟”来自一场法律纠纷

    这种拼凑式分析工作流的想法最早是Wood想到的——他同时也是Quilty的CTO——几年前他卷入一场房地产纠纷时萌生了这个想法。Wood没有花钱请律师,而是打开了ChatGPT,后者立刻告诉他”我不是律师,去找别人帮你吧”。

    “后来我用了Gemini,效果好了很多,因为有更大的上下文窗口,”Wood回忆道,”但后来我在X上看到埃隆·马斯克说Grok在律师评分上是AI模型里史上最高的,我就想’让我试试这个。’”

    这段经历让Wood更好地理解了类似的消费级AI模型如何在不同的任务中表现出色。而Wood对AI的个人使用也影响了Quilty量化剧本潜在成功的方法。因为”Gemini在结构和模式方面非常出色”,Quilty用它来生成拆解文档。对于财务建模,公司信任托管在美国服务器上的DeepSeek实例。而对于叙事/角色分析,Quilty结合了Claude和ChatGPT。

    问题在哪

    尽管Quilty技术栈的模块化可能让它在整体更新方面更敏捷,但也让它更难完全理解平台是如何拿到一个剧本,然后得出一系列据称可以衡量无形事物的指标的——比如观众对一部还不存在的电影可能有什么反应。

    自好莱坞诞生以来,预测一直是电影开发的关键部分,但这项工作传统上由对人类观众有细致了解的人类工作者完成。还没有AI公司能开发出真正复制人类思维过程,或者我们形成对艺术看法的模糊方式的模型。

    Quilty的创始人认为,他们的”情感引擎”是评估剧本的次优选择,因为它整合了VADER(效价感知词典和情感推理器)等工具。但Quilty不可能预见所有可能影响电影接受度的因素。


    当我问Horsman和Wood,为什么Quilty给最终票房仅约200万美元的《Christy》的评分高于最终票房3.7亿美元的《罪人》时,他们坚称平台的判断”归根结底是因为Sydney Sweeney真的、真的很受欢迎”。

    这种情况凸显了Quilty的逻辑并不那么可靠。他们承认,在一些情况下,Quilty不可能预见可能影响电影财务表现或观众接受度的因素。例如,Quilty不可能预见到Elijah Bynum的《Magazine Dreams》(由Horsman制片)最终会因为演员Jonathan Majors 2023年声名狼藉而脱轨。

    尽管宣传得天花乱坠,但Quilty兜售的不过是拼凑起来的一系列大语言模型的间接访问权限。如果这些AI工具真能像Quilty声称的那样工作,那确实会非常惊人。但大多数工具只是复杂模式识别/模仿机器,距离理解人类觉得什么有趣还有很长的路要走。

  • AI的账单到期了:科技公司开始为Token烧的钱买单

    Uber把2026全年的AI编程预算,4月份就烧完了。这事听起来像段子,但它是真的。

    TechCrunch最近发了一篇深度报道,讲整个行业突然意识到一件事:AI不是免费的基础设施,它贵得离谱,而且账单来得比任何人准备的都要快。

    AI公司们在2025年初疯狂使用AI,所有人都开着”放开用”的订阅模式,没人真正盯着花了多少钱。等到年底一算账,才发现Token消耗已经完全失控。

    从”能不能用”到”花了多少钱”

    OpenAI的企业业务负责人Alexander Embiricos说,半年前他和客户聊天,对方问的都是”这个模型能做什么?够不够好?”现在完全不一样了,所有人都在问:”我们花了多少钱?你们有可见性吗?有审计能力吗?有Token管控吗?你们模型的效率到底怎么样?”

    微软几个月前给开发人员开通了Claude Code的许可,结果没过多久就收回去了。Priceline的一个员工告诉TechCrunch,他们续签Cursor合同时,价格直接翻了4到5倍。

    这还不是最夸张的。有一家公司忘了给员工设置使用限额,结果一个月下来收到了5亿美元的Claude账单。

    Token经济学浮出水面

    Linux基金会本周宣布了一个新计划,叫Tokenomics Foundation,目的是给AI Token的花费建立一套类似FinOps之于云计算的成本纪律标准。

    FinOps Foundation的负责人J.R. Storment说,今年4、5月份开始,不断有公司跑来说:”我的天,我们2026年的Token预算已经超了3倍,但现在才4月。”

    Priceline的IT财务总监Chris Reed说了一句话很形象:”这就像可卡因流行病,他们让你先试试,把你勾住,然后你就被绑住了。”

    AI成本压力
    企业开始认真审视AI的账单了(图源:Getty Images)

    新市场正在形成

    这波焦虑催生了一个全新的市场。初创公司、老牌厂商,都在争相推出帮助企业管理AI支出的工具。

    • Pay-i:专门追踪、测量和优化生成式AI投资的成本与性能
    • Paid:让开发者按实际价值而不是订阅费来追踪成本和向用户收费
    • Jellyfish、Waydev、Faros AI:提供AI代理监控,证明开发工具的投资回报率
    • Ramp、Datadog、New Relic:在传统产品线上加装AI成本管理和可观测性功能

    但问题也很明显。所有这些工具都在没有通用语言或共享定义的情况下各自为战。没有人真正知道一个Token到底该花多少钱、它产出了什么、怎么跨厂商比较支出。这正是Tokenomics Foundation想要解决的问题。


    Goldman Sachs预测,到2030年全球Token使用量将增长24倍。那些已经超预算的公司现在就需要解决方案,但基金会的第一份交付成果还要几个月才能出来。

    Faros AI的CEO Vitaly Gordon说了一句很形象的话:”也许我们造出了蒸汽机,但还没有搞清楚装配线怎么搭。”

    这篇文章折射出一个很真实的现状:AI的”免费午餐”时代正在结束,接下来是所有人都必须学会算账的时代。

  • LiteLLM:49.4K Stars!统一100+ LLM API网关,让多模型调用不再碎片化

    LiteLLM:49.4K Stars!统一100+ LLM API网关,让多模型调用不再碎片化

    LiteLLM

    📌 项目简介

    LiteLLM 是 BerriAI 团队维护的开源 AI 网关,为 100+ 大语言模型提供统一访问接口,支持 OpenAI 格式调用,内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目,Stripe、Netflix、Google ADK 等大厂均在用。

    🔧 安装要求和过程

    环境要求

    • Python 3.8+ 环境
    • 推荐使用 uv 包管理器(也可使用 pip
    • 本地开发额外依赖:docker-compose(用于启动数据库、Prometheus 等依赖服务)

    快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/BerriAI/litellm.git && cd litellm
    
    # 2. 安装开发依赖
    make install-dev
    
    # 3. 初始化虚拟环境
    python -m venv .venv
    # Linux/Mac:
    source .venv/bin/activate
    # Windows:
    .venv\Scripts\activate
    uv sync --all-extras --group proxy-dev
    
    # 4. 生成 Prisma 客户端
    uv run prisma generate && prisma generate
    
    # 5. 启动本地服务(后端)
    python litellm/proxy/proxy_cli.py
    
    # 6. 启动前端(另开终端)
    cd ui/litellm-dashboard && npm install && npm run dev

    💡 Docker 快速启动:

    docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest

    🚀 核心功能

    🌐 统一 LLM 调用

    支持 100+ LLM 厂商(OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等),所有调用兼容 OpenAI API 格式,切换模型无需修改业务代码。

    🛡️ AI 网关能力

    虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志,并提供 管理后台 UI可视化监控。

    🤖 智能体(A2A)支持

    支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体,提供 A2A 协议适配,可统一接入各类智能体服务。

    🔗 MCP 工具桥接

    可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义,直接对接任意 LLM;支持通过网关统一代理 MCP 工具调用。

    🏢 企业级特性

    单点登录(SSO)、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能:1k RPS 场景下 P95 延迟仅 8ms

    💡 典型使用场景

    场景一:多模型切换,代码零改动

    开发阶段使用 GPT-4o 快速验证,生产环境切换到 Claude Sonnet,只需修改 model 参数,业务代码无需任何改动:

    # 同一套代码,切换不同模型
    from litellm import completion
    
    response = completion(
        model="openai/gpt-4o",
        messages=[{"role": "user", "content": "Hello!"}]
    )
    
    response = completion(
        model="anthropic/claude-sonnet-4-20250514",
        messages=[{"role": "user", "content": "Hello!"}]
    )

    场景二:企业 LLM 调用管理与成本跟踪

    为不同团队/项目分配虚拟 API 密钥,按维度统计 LLM 调用花费,设置安全防护规则(如屏蔽敏感词、限制调用频率),所有调用日志可视化。

    知名用户包括:Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

    场景三:MCP 工具无缝对接 LLM

    通过 LiteLLM 的 MCP 工具桥接功能,可以将任何 MCP 服务器的工具转换为 OpenAI 格式,让任意 LLM 都能调用这些工具,无需为每个 LLM 单独适配。

    💬 推荐理由

    LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码,现在只需一套 OpenAI 格式代码,通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

    对于需要调用多个 LLM 的应用(比如 AI Agent 系统),LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用,说明其稳定性和性能已经过生产验证。

    最打动我的一点:它不只做模型路由,还内置了成本跟踪、负载均衡、安全防护等企业级功能,真正把”调用 LLM”这件事做成了一个完整的网关产品,而不只是一个简单的路由库。

    LiteLLM – 让100+ LLM 调用,从此只有一种方式。

  • 前OpenAI CTO Murati时隔18个月露面,说AI行业治理缺位比个人品格更值得担心

    Mira Murati又出现在镜头前了。这位前OpenAI CTO、现在Thinking Machines Lab的创始人,在过去18个月里几乎没怎么公开说过话。这次接受TechCrunch采访,她选得很谨慎,没有把公司底牌全亮出来。

    为什么现在出来讲话

    Thinking Machines Lab成立快一年半了,这段时间一直在低调干活:融资、招人、做了一个开源AI模型微调的API产品叫Tinker。但同行没闲着,OpenAI、Anthropic、xAI这些实验室一直在刷存在感,长期低调的收益在递减。

    她需要一个时机,让市场和人才记得Thinking Machines还在牌桌上。这次采访,就是这一步。

    她预告了一个新产品方向

    Murati透露,他们正在研发一种她称之为”交互模型”的东西。这类模型会打破现在AI产品”你问一句、它答一句”的轮次模式,改为以200毫秒为间隔,持续处理音频、文本、视频的流输入。

    这样做的目标是捕捉人类交流里的那些细节:打断、中途修正、思考时的停顿。它更接近实时交互,而不是现在的”问答机”模式。Murati强调这只是第一步,没有给出具体上线时间。

    Mira Murati采访
    Mira Murati接受采访(图片来源:TechCrunch)

    2023年那场”换帅风波”,她这么看

    当被问到2023年11月OpenAI董事会突然开除Sam Altman、后又让他回归的那场风波时,Murati把它称为”小插曲”。她说当时做决策的核心逻辑是保护公司使命和团队,如果没有她的参与,公司很可能会”分崩离析”。

    但她也承认,当时应该更积极推动信息公开、制定更好的过渡方案、提升透明度。当被直接问及是否还信任前老板Sam Altman时,她没有接话,转而去谈一个更结构性的话题。

    她真正担心的事:治理,而不是人品

    Murati回避了关于Altman个人信任的问题,转而强调:整个AI行业都存在重要决策集中在少数人手中的问题。相比个人品格,她更担心的是治理结构缺乏制衡机制。

    这个观点值得琢磨。行业里很多人盯着Altman、Musk、Zuckerberg这些人的性格和诚信说事,但Murati指向的是制度层面:如果决策权本身就过度集中,换谁来坐那个位置,风险都还在。

    她认为行业过于关注”道德正确性”,却在制度建设上走得不够快。这句话某种程度上也是在为自己的创业方向背书:Thinking Machines要做的事情里,治理和安全是核心议题。

    对AI的未来,她没有走极端

    Murati明确表示,她既不认同”AI必然带来反乌托邦”的悲观论调,也不认同”AI必然带来乌托邦”的乐观版本。她认为当前阶段的发展走向将决定最终结果。

    她多次强调一个观点:如果人类过早放弃对AI的主导权,未来会变得完全不同,且不会更好。这个说法不极端,但立场很清楚:AI应该被人类主导,而不是反过来。


    Murati这次露面,更像一个精心设计的重新开始,而不是一次全盘托出。她没有公布新产品发布日期,没有透露Thinking Machines的具体技术路线图,也没有深度评价前东家的现状。但她释放了一个信号:Thinking Machines还活着,而且在认真做东西。至于做的东西能不能打过OpenAI和Anthropic,那是下一阶段的问题了。

  • 黑石旗下的AirTrunk砸300亿美元在印度建AI数据中心,目标5GW容量

    数据中心这事儿,最近几年一直是AI行业背后那条看不见的主线。大家都盯着模型参数、聊天能力,但真正卡脖子的,往往是那些耗电、耗水、占地儿的大铁皮房子。6月5日,背靠黑石的澳洲数据中心运营商AirTrunk扔出一颗重磅消息:要在2030年前向印度投资300亿美元,建设总容量5GW的AI数据中心。

    为什么是印度

    这个决定不是拍脑袋做的。印度这几年的AI基础设施吸引力一直在往上走,研究公司Bernstein预测,印度数据中心容量将从当前的约1.5GW增长到2030年的8GW。这个数字背后,是印度政府真金白银的政策支持。

    2026年早些时候,印度宣布对运行在印度数据中心、面向海外销售的算力服务,给予免税政策,一直持续到2047年。这条政策基本上把”在印度建、向全球卖”的商业逻辑给打通了。

    AirTrunk不是拍脑袋进印度的。他们2026年早些时候通过收购Lumina CloudInfra正式进入印度市场,已经在孟买、钦奈、海得拉巴储备了约600MW的开发用地。这次300亿美元的投资,是在这个基础上放的一个大卫星。

    钱花在哪、谁能分到一杯羹

    马哈拉施特拉邦已经和AirTrunk交换了意向书,在Raigad Pen Growth Center划拨土地,用于建设3GW的数据中心,投资额约210亿美元。剩下的部分,会分散到其他邦和地区。

    AI数据中心建设
    数据中心建设现场(图片来源:TechCrunch)

    这个投资计划是在AirTrunk CEO Robin Khuda与印度总理莫迪会面后宣布的。莫迪对此的评价是,这将助力印度成为全球云计算和人工智能枢纽。这句话不是客套,印度确实有这个野心,也正在铺路。

    不是只有AirTrunk在押注印度

    亚马逊、谷歌、微软、OpenAI、Uber这些国际企业,加上信实工业、阿达尼集团、塔塔咨询服务这些印度本土巨头,都已经宣布了各自在印度的数据中心或AI基础设施投资计划。AirTrunk的300亿是其中金额最大的之一,但不是唯一的。

    这里有个细节值得琢磨:为什么是黑石旗下的公司来扛这个旗?黑石是全球最大的另类资产管理公司,它控股AirTrunk,说明机构投资者把数据中心当成长期、稳定、抗通胀的基础设施资产来配置。这个逻辑和买港口、买电网、买高速公路是一样的。

    真正的问题:电从哪来

    行业高管和分析师说得直白:数据中心建设最大的瓶颈不是土地、不是资金,是电。德勤估计,到2030年,亚太地区的数据中心建设可能需要额外数十太瓦时的电力。这个数字什么概念?相当于好几个中等国家的全年用电量。

    印度的优势是有可再生能源资源,太阳能和风能的潜力不小。但电网基础设施的薄弱是另一个问题。建数据中心容易,保证20年后还能稳定供电,这是另一个层面的挑战。


    AirTrunk这个300亿美元的投资,表面上是商业决策,底层其实是全球AI竞赛在基础设施层面的投射。谁先把算力铺够、铺便宜、铺稳定,谁就在下一轮AI竞争里占了先机。印度想当这个枢纽,AirTrunk想当这个铺路人,钱已经摆上桌了,接下来看能不能真的落地。