博客

  • AI精神病:当科技CEO们沉迷于自己造的梦

    Box创始人Aaron Levie本周在社交媒体上发了一条挺有意思的帖子,说科技公司的CEO们”特别容易患上AI精神病(AI psychosis)”。这话一出,科技圈炸了锅。

    我和同事们在TechCrunch的Equity播客里专门聊了这事儿。Levie并不是在否定AI工具,他的核心意思是:CEO们需要真正这些工具,才能理解它们到底值不值。

    “如果你根本没有接触过最终的实际工作,你怎么会知道这些工具的价值呢?你不能只看一张幻灯片就说’对,效率太惊人了,就这么干’。”

    —— Aaron Levie,Box CEO

    反AI情绪正在蔓延

    你可能也注意到了,现在有两种完全相反的声音同时存在:一边是”AI太棒了,所有人都在用”;另一边是”AI毁了一切,所有人都讨厌它”。

    最近有一些挺有意思的信号:

    • 大学毕业生在毕业典礼上听到AI相关内容就发出嘘声
    • 科技行业裁员潮带来的负面情绪持续发酵
    • 谷歌宣布给搜索增加更多AI功能后,DuckDuckGo的下载量直接涨了30%

    DuckDuckGo的CEO说他们的安装量增长了30%——当然,DuckDuckGo的体量比谷歌小得多,我不认为谷歌会立刻遇到麻烦,但这至少说明:有相当多的用户并不买账现在AI渗透一切的方向。

    谷歌的两难困境

    我的同事Kirsten提出了一个挺尖锐的观察:它正在追逐自己认为必须做的事来保持竞争力,但它正在破坏用户和品牌关联度最高的核心体验,而且也没有改善这个体验。

    AI精神病争议
    AI工具正在重塑人们对技术的信任边界(图源:TechCrunch)

    她在想,这个反AI的节点,是不是初创公司或者其他商业领域的机会?已经有早期迹象表明,人们正在用行动投票,直接转去用其他服务。

    更有意思的是,连DuckDuckGo自己也在一年前还在尝试往搜索里加AI功能,因为觉得”必须这么做”。而现在他们发现,其实有一条路可以走:”不,我们完全不感兴趣这些AI功能。哪怕我们要做,也会把它放在单独的沙箱里,完全不会影响你的核心搜索体验。”

    CEO们的”AI精神病”到底是什么

    Levie说的”AI精神病”,指的是很多CEO对AI有一种不切实际的幻想——他们和生成式AI真正能创造价值的”最后一步工作”足够脱节,所以容易被PPT上的演示迷惑。

    这不是说AI没有用。恰恰相反,问题是:谁在用?怎么用?那些真正在一线写代码、做设计、写文档的人,和那些只在董事会上谈AI战略的CEO,对AI价值的感知是完全不同的。

    现在很多公司的AI采用,是一种自上而下的推动。高管们相信”AI会带来生产力提升”,风投们也喜欢”你只需要一个非常小的团队,就能和规模大得多的公司一样高效”的梦想。但这个梦想和现实之间的鸿沟,可能比很多人愿意承认的要大得多。


    不管你是不是赞同Levie的观点,有一件事是确定的:AI现在极具争议性,而且这种争议不会很快消失。对于做产品的公司来说,如何在”跟上AI潮流”和”不惹毛用户”之间找平衡,会是一个越来越 tricky 的问题。

  • AI公司想免费帮你打扫卫生,条件是拍下你家的全过程

    一家叫Shift的AI创业公司最近在纽约搞活动:免费帮你打扫家,但条件是——他们要拍下整个清洁过程。

    这听起来像是那种”条件优厚到让人起疑”的买卖,实际上背后有个非常具体的目的:收集人类做家务的视频数据,用来训练未来的家用机器人。

    训练机器人比训练ChatGPT难多了

    文字和图像可以从互联网上大规模抓取,但物理世界的动作数据没那么好弄。教一个机器人叠毛巾、捡苹果、倒水,这些对人类来说轻而易举的事情,对机器人来说极其难编码。

    机器人要理解的不是文字,而是空间、力度、摩擦力、物体形状、光线变化——这些东西人类本能就会,但要把它们变成机器能读懂的数据,成本高得吓人。

    不止一家公司在这么做

    印度有个家政平台叫Pronto,也被曝出在客户授权后采集烹饪、清洁、洗衣等场景的视频,用来训练AI。这件事在印度市场引发了不少争议,竞争对手赶紧出来表态说自己绝对没在客户家里装摄像头。

    还有更”刻意”的做法:一些公司在专门搭建的场地里,让工人一遍又一遍地重复同样的动作,摄像头全方位记录。这种”数据农场”产出的素材质量高、场景可控,缺点是很贵。


    数据瓶颈倒逼出各种创意

    高质量的物理世界数据是开发物理AI的最大瓶颈。文本、图片、视频可以从网上爬,但要让机器人学会在真实人家环境中干活,就得有真实家庭环境的数据。

    所以出现了各种”用服务换数据”的模式:Shift免费清洁换视频、Human Archive给零工发相机帽采集第一视角数据、一些公司直接把产品先卖出去,再从用户使用中收集数据迭代算法。

    隐私问题迟早要爆发

    用免费服务换数据这件事本身并不新鲜——会员卡、cookies、行车记录仪、保险APP都在做。但家务场景涉及的是你家里面最私密的空间,摄像头拍到的不只是”清洁动作”,还有你的生活方式、家庭布局、个人隐私。

    目前这类公司的做法是让用户”选择加入”,但问题是:有多少人真的仔细读了那份授权协议?等家用机器人真正上市的时候,这些数据是怎么被使用、会不会被转卖,都会成为大问题。

  • OpenAI把Codex搬上Windows了,AI智能体直接帮你操作电脑

    OpenAI的Codex之前已经在Mac上能用”计算机控制”功能了,现在Windows用户也等到了。简单说,就是让AI直接”看”你的屏幕,然后在你的设备上帮你干活。

    这个功能的名字叫”computer use”,技术上跟Anthropic的Claude电脑控制是同一类东西——让AI理解屏幕内容,然后模拟人类操作:点按钮、输文字、开软件,整套流程自动化。

    不在电脑旁边也能管

    有个细节挺实用:你不在电脑跟前的时候,也可以通过ChatGPT手机应用查看Codex正在执行的任务,顺便管一管进度。对需要跑长任务的场景来说,不用守在电脑前了。

    Codex的”computer use”本质上是在模仿人类使用电脑的方式。它看屏幕、找按钮、点鼠标、敲键盘——只不过速度比人快得多,也不会累。

    OpenAI在抢智能体入口

    把Codex做成一个能操作你整个系统的智能体,这个方向不止OpenAI在走。Anthropic的Claude已经可以先用到电脑控制能力,微软也在把Copilot往这个方向推。大家的判断是一样的:未来的AI不只是回答问题,而是要能替你把事情做完。

    Windows这块市场OpenAI肯定不想让给别人。Mac版先上,现在补上Windows,基本覆盖大部分开发者群体了。


    安全和权限怎么算

    AI能操作你的电脑,这件事的便利性和风险是并存的。目前Codex需要用户主动授权才会开启这个功能,但往后这类能力的权限边界会是个持续的议题——毕竟,让AI”看见”屏幕内容,意味着它能接触到的信息范围相当大。

  • Meta 悄悄做了一款 AI 吊坠,想让 Reality Labs 不再每个季度亏 40 亿美元

    Meta 正在开发一款 AI 吊坠设备,计划明年开始测试。这个消息来自 The Information 看到的一份内部备忘录。简单来说,这就是一个可以别在衬衫上、或者当项链戴的小装置,核心功能是记录你的对话,然后由 AI 进行处理和回应。

    Meta AI 概念图
    Meta 的 AI 硬件野心不止于眼镜(图源:TechCrunch)

    这个设备的技术底子来自 Meta 在 2025 年底收购的 AI 可穿戴初创公司 Limitless。那家公司之前就在做几乎一样的东西——一个挂在脖子上的 AI 吊坠,持续录音,然后帮你整理记忆、提取待办、总结对话。Meta 当时说这笔收购是为了”加速 AI 可穿戴设备的开发”,现在看来,吊坠形态确实是他们想推的方向之一。

    AI 吊坠这个品类之前已经有很多公司试过,基本都没掀起什么水花。隐私顾虑、营销不走心,或者产品本身就没那么有用——原因可能是其中任何一个。

    Meta 的真实算盘

    这份备忘录还透露了两个配套动作:Meta 计划扩展 AI 眼镜产品线,同时推出一个名为 Wearables for Work 的企业订阅服务。把这几件事放在一起看,Meta 的意图相当明确——用硬件矩阵把 Reality Labs 从每个季度亏 40 亿美元的泥潭里拉出来。

    2026 年第一季度,Reality Labs 亏了 40 亿美元。这个数字已经不是新闻,而是某种常态。Meta 在 VR/AR 硬件上砸了超过 10 年,到现在还没看到真正的规模化盈利。AI 吊坠能不能改变这个局面?说实话,机会不大,但 Meta 也没有更好的选择了。


    AI 可穿戴这个赛道到底行不行

    吊坠形态有个天然优势:比眼镜门槛低。眼镜需要度数适配、外形接受度、社交压力,吊坠只要别在衣服上就行。但劣势也很明显——存在感太弱反而可能是个问题,用户凭什么要一直戴着它?

    OpenAI 也没放弃这个方向,说明大厂们普遍觉得”贴身 AI”是个值得押注的交互入口。只不过从产品史来看,记录一切对话这个卖点最容易卡在隐私上——你愿意让一个随时在录音的设备贴身戴着吗?这个问题 Limitless 没答对,Meta 也不一定行。

    • 设备形态:AI 吊坠,可别在衬衫或当项链佩戴
    • 技术来源:基于 2025 年收购的 Limitless 团队
    • 测试时间:最早 2027 年开始内部测试
    • 配套计划:扩展 AI 眼镜产品线 + Wearables for Work 企业订阅
    • 战略目标:扭转 Reality Labs 每季度 40 亿美元亏损
  • SoftBank 砸 750 亿欧元在法国建数据中心,AI 基础设施军备竞赛打到欧洲

    孙正义又出大手笔了。SoftBank 刚刚宣布,计划砸最多 750 亿欧元(约 870 亿美元)扩建法国数据中心容量。这不是普通的数据中心投资——目标是开发运营最高 5GW 的额外数据中心容量,这个数字已经接近许多国家全国的发电装机量。

    第一阶段已经在路上:SoftBank 要在法国的 Dunkirk(洛恩-普拉日)、Bosquel 和 Bouchain 三地开建,到 2031 年向法国上法兰西大区交付 3.1GW 的容量。这是 SoftBank 迄今为止在欧洲最大的一笔 AI 基础设施押注。

    SoftBank 既是 OpenAI 的投资者,也是其客户。这家公司在 AI 基础设施上的每一步布局,都跟 OpenAI 的扩张节奏深度绑定。

    法国为什么愿意接这个盘

    法国经济部长 Roland Lescure 在声明里说得很直白:这证明了马克龙想把法国打造成 AI 全产业链重要目的地的雄心。从算力到应用层,法国想在这一波 AI 浪潮里分一杯羹,而数据中心是最底层的入场券。

    但这块饼没那么好啃。在美国,数据中心建设已经引发越来越强的反对声浪——环保团体担心能耗和用水,电网运营商警告变电站扩容跟不上,居民则抱怨电费上涨。SoftBank 此前宣布在俄亥俄州建数据中心,配套一座 9.2GW 天然气电厂,这种”算力+能源”打包模式在欧洲能不能跑通,还是个很大的问号。


    750 亿欧元到底花在哪

    这个数字听起来吓人,但拆开看其实有迹可循。5GW 的数据中心容量,按当前 AI 训练集群的功耗水平,大约能支撑几十个超大规模 GPU 集群同时运转。法国电价在欧洲相对便宜,核电比例高,对算力密集型企业有一定吸引力。

    问题是,AI 基础设施的投资回报周期极长,而技术迭代极快。今天花 750 亿欧元建的机房,五年后会不会因为芯片架构升级而大面积闲置?SoftBank 这次赌的,是 AI 算力需求会在未来十年持续指数级增长——这个假设一旦失效,这笔钱就打了水漂。

    • 目标容量:最高 5GW,第一阶段 3.1GW(2031 年交付)
    • 投资规模:最高 750 亿欧元(约 870 亿美元)
    • 地点:法国上法兰西大区(敦刻尔克等地)
    • 定位:SoftBank 在欧洲最大 AI 基础设施投资
  • 你家打扫卫生的画面,正在被AI公司花钱买走

    本周有一家叫Shift的AI训练初创公司宣布,要免费帮纽约人打扫房子,后续还打算把这项服务推广到伦敦等其他城市。我看着自己乱糟糟的公寓,完全能理解这个服务的吸引力。

    但天下没有免费的午餐,总有条件。

    AI机器人训练数据收集
    AI公司正在想方设法收集真实世界的物理数据丨The Verge

    你家的清洁过程,就是机器人的”教科书”

    作为免费打扫的交换,Shift要求获得清洁人员工作时的全部录像:刷碗、擦台面、擦桌子、拖地——所有我们愿意外包的琐碎家务都要拍下来。而这些录像,正是机器人公司竞相训练机器完成家务、最终向消费者售卖家用机器人的核心数据。

    这比听起来要难得多。和近年来爆发式增长的聊天机器人、图像生成器这些纯数字AI工具不同,机器人需要跟物理世界打交道:要理解空间、运动、力量、摩擦力,还要应对奇怪的形状和材质、尴尬的灯光条件,以及人类本能就能掌握的其他所有物理常识。这就是为什么叠衣服、拿苹果、倒水这些对人类来说很简单的事,对机器人专家来说却一直难以实现。

    “不像聊天机器人、图像生成器和其他近年来爆发式增长的AI工具,机器人必须和物理世界打交道。这意味着要理解空间、运动、力、摩擦力、奇怪的形状和材质、糟糕的照明,以及人类本能就能掌握的所有其他东西。”

    不止Shift一家在这么做

    在印度,近期有报道披露,家政服务平台Pronto一直把客户的家作为AI训练素材的来源,拍摄做饭、打扫、洗衣服等家务场景。Pronto表示只有在客户明确同意的情况下才会拍摄,目前还不清楚客户能获得什么回报(除了拍摄的素材副本之外)。但这一做法还是在市场上引发了强烈反对,竞争对手的初创公司纷纷表态,称自己从未在客户家中拍摄用于训练AI的素材,也没有相关计划。

    其他公司则专注于扩大数据收集的规模。比如硅谷的Human Archive公司,希望和Pronto这类企业合作,让零工工作者戴上并不时尚的摄像头帽子记录自己的活动。这种帽子可以从佩戴者的视角收集素材,正是机器人公司需要的”自我中心”视角数据,用来训练机器理解人类如何在物理空间中活动。

    而Shift也直接面向消费者,声称已经向15个国家的数万人支付报酬,让他们通过自己的应用记录日常活动。


    “数据农场”正在兴起

    还有一些公司完全跳过”有用的工作”,直接付费让工人反复完成相同的物理任务,同时用摄像头和传感器捕捉每一个动作。这类”staged data farms”(模拟数据农场)专门把叠毛巾、拿杯子、搬箱子等重复体力劳动转化为有价值的AI训练素材——其价值高到足以支撑公司付费生产这些内容。

    还有一部分数据来自已经在现实世界部署的机器人。尽管宣传得天花乱坠,但真正的全自动化还遥遥无期(这也是需要大量数据的原因),企业还是急于把产品推向市场。他们会用客户家中的使用数据来优化产品,很多公司还会在机器人卡住的时候安排远程工作人员介入,这些介入过程的数据也会被用于训练。

    用数据换免费服务,这个交易并不新鲜

    当然,用有价值的东西交换数据的做法早就不是新鲜事了。多年来企业一直用折扣、便利、免费服务换取用户数据,从会员积分卡、浏览器Cookie,到行车记录仪、监测驾驶行为的保险APP,还有永远在播广告的智能电视,都是如此。

    现在的新变化是企业愿意付费收集的数据类型。目前来看,这意味着你可能会让一个戴着摄像帽的人免费帮你打扫家里,最终目的是让企业未来能卖给你一个机器人,代替人类做这些家务。

    • Shift:免费清洁换录像,已覆盖15个国家
    • Pronto(印度):家政服务中拍摄家务场景,引发争议
    • Human Archive:给零工戴摄像帽,收集第一人称视角数据
    • 模拟数据农场:付费让工人重复完成叠毛巾、搬箱子等动作
  • 软银豪掷750亿欧元在法国建数据中心,欧洲AI基础设施大战打响

    这两天软银扔出了一个重磅消息:计划最高投入750亿欧元(约870亿美元)在法国建设数据中心。这个数字什么概念?比很多国家的全年GDP还高。孙正义这次是真的把筹码全压在AI基础设施上了。

    5吉瓦,不只是个抽象数字

    软银的说法是,这笔钱要用来开发并运营最高5吉瓦的额外数据中心容量。第一阶段落在法国上法兰西大区,具体地点包括敦刻尔克(Loon-Plage)、Bosquel和Bouchain,到2031年先交付3.1吉瓦的容量。

    3.1吉瓦是什么概念?大约相当于3座大型核电站的发电功率,或者够支撑一个中型城市的全部用电——只不过这些电全都要用来跑AI。

    数据中心建设概念图
    AI数据中心建设已成为全球科技巨头的核心战场丨Getty Images

    软银既是OpenAI的投资者,也是OpenAI的客户,这次在法国的投资被定位为其在欧洲规模最大的AI基础设施布局。法国经济部长Roland Lescure在声明里说,这证明了马克龙要让法国成为”AI价值链全环节领先目的地”的雄心。

    “这一公告证明了埃马纽埃尔·马克龙总统的雄心,即让法国成为AI价值链全环节的领先目的地。”
    ——法国经济部长 Rolland Lescure

    美国那边却在闹

    有意思的是,软银在美国那边也在大举建设数据中心,配套的是一座9.2吉瓦的天然气发电厂。但在美国国内,反对数据中心建设的声音正在升温——居民担心能耗、水资源消耗,还有对电网和公用事业价格的影响。

    法国这边为什么能推进这么快?一方面马克龙政府一直在积极吸引AI投资,另一方面欧洲的数据中心监管环境和美国有些不同,社区阻力相对小一些。但长远来看,欧洲的能源成本和环保压力也不会比美国轻松。


    全球AI基础设施竞赛才刚开始

    把这件事放在更大的背景里看:微软、谷歌、亚马逊、Meta都在疯狂建数据中心,现在软银以750亿欧元的规模杀入欧洲,说明这场基础设施竞赛已经进入了一个全新阶段。

    值得关注的是,软银并不是在孤军奋战——它和OpenAI的绑定关系意味着,这些数据中心很可能会优先服务于OpenAI的计算需求,再加上软银日本合资企业的布局,孙正义某种程度上在搭建一个横跨美国、欧洲、亚洲的AI基础设施网络。

    • 投资总额:最高750亿欧元(约870亿美元)
    • 目标总容量:最高5吉瓦额外数据中心容量
    • 第一阶段交付:2031年,3.1吉瓦(法国上法兰西大区)
    • 定位:软银在欧洲规模最大的AI基础设施投资
  • MIT TR 盘点:2026 年 AI 领域最值得关注的 10 件事

    MIT Technology Review 最近做了一件有意思的事——他们第一次把”当下 AI 领域最重要的事”整理成了一份清单。不是那种泛泛而谈的趋势预测,而是编辑团队基于多年追踪,认真挑出来的 10 个方向。

    这份清单里有些内容你可能已经耳熟能详,但也有几个方向,连很多业内人士都还没认真想过。挑几个最有意思的聊聊。

    人形机器人的”数据饥渴”

    训练大语言模型需要海量文本,那训练人形机器人需要什么?答案是:海量”人类动作视频”。现在已经有公司在专门搭建巨型”训练中心”,让工人重复完成各种任务,用摄像头把整个过程录下来。更夸张的是”提线木偶”模式——让海外陌生人通过远程操控的方式,实时”驾驶”机器人做各种动作,以此收集训练数据。

    这套打法有没有用,现在还不好说。但逻辑是通的:想让机器人学会”把杯子拿起来”,先得让它看几万遍人类是怎么拿杯子的。

    “世界模型”可能是下一个大突破

    大语言模型擅长处理文字,但要让 AI 真正理解物理世界,还需要别的东西。这就是”世界模型”(World Models)的由来——AI 公司希望构建能够理解外部物理世界的系统,而不只是预测下一个 token。

    如果世界模型取得成功,AI 将克服大语言模型的局限性,真正进入物理环境——而不只是停留在屏幕里和你聊天。

    AI 智能体开始”组队协作”了

    第一波 AI 智能体只能做单件任务——运行一个浏览器、写几行代码,而且各自为战。下一阶段的智能体将能够”组队”,多个代理协作完成复杂得多的目标。这就像从”单打独斗”进化到”团队协作”,能力上限会完全不一样。

    中国的开源赌注,全球已经在用

    中国实验室把前沿模型免费开放,这件事在全球范围内获得了大量开发者的好感。现在的问题是:这种模式财务上是否可持续?没人能给出确定答案。但一个事实已经形成——全球开发者已经在基于中国的开源基础模型构建应用了。


    这份清单里还有几个方向也值得关注:AI 加持下的诈骗正在升级、武器化的深度伪造已经成为现实、全球范围内对 AI 的抵制浪潮正在形成。MIT Technology Review 这份清单的价值不在于”预测”,而在于它把那些真正在发生的、会被写进历史的变化挑了出来。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施根本没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。