标签: AI基础设施

  • Alphabet要融800亿美元搞AI基建,伯克希尔先认购100亿

    谷歌母公司Alphabet周一宣布,计划通过发行股票融资800亿美元,用于扩充AI基础设施。这是今年以来科技巨头在AI军备竞赛中最大的一笔融资动作之一。

    Alphabet CEO Sundar Pichai
    Alphabet CEO Sundar Pichai(图片来源:Jeenah Moon/Bloomberg / Getty Images)

    800亿美元里,有100亿是定向卖给伯克希尔·哈撒韦的。这家由沃伦·巴菲特缔造、现在由格雷格·阿贝尔接掌的控股公司,相当于给这笔融资吃了一颗定心丸——有伯克希尔背书,其他投资者进场时心里会踏实很多。

    “企业对本公司AI解决方案与服务的需求十分强劲,当前供应水平已无法满足需求。”——Alphabet官方声明

    钱花在哪里

    Alphabet的说法是”扩大AI基础设施和全球算力”。这句话翻译过来就是:建更多数据中心、买更多英伟达GPU、拉更多光纤、消耗更多电力。

    谷歌今年在I/O开发者大会上透露,2026年的资本支出预计达到1800亿至1900亿美元。这个数字比很多国家的GDP还高,但谷歌说这是”需求驱动的”——企业客户和个人用户对AI服务的需求增长太快,现有的算力不够用了。

    彭博社的估算更夸张:美国科技巨头们2026年在AI资本支出上的总投入将达到7000亿美元。谷歌、微软、亚马逊、Meta,每家都在拼命砸钱,没有人敢停下来喘口气——谁停下,谁就可能在新一轮AI竞赛中掉队。

    为什么是现在

    选在现在融资,有三个原因值得琢磨。

    第一,利率环境。虽然美联储还没有大幅降息,但市场普遍预期2026年下半年会宽松。现在融资,资金成本还算可控。

    第二,竞争格局。微软跟Anthropic绑得很深,亚马逊在自研芯片上砸了重金,Meta在开源模型上走激进路线。谷歌必须在基础设施上建立足够深的护城河,才能守住搜索和云服务的优势。

    第三,AI服务的商业化正在加速。Gemini接入Google Workspace、Cloud AI服务给企业客户用、YouTube用AI做内容推荐和广告投放——这些业务的营收增长是看得见的,融资扩建基础设施的回报周期比以前短了。


    伯克希尔为什么买

    伯克希尔认购100亿美元,这件事本身比融资总额还值得关注。巴菲特还在任的时候,伯克希尔很少参与科技公司的大额融资。现在管理层换了,打法也在变。

    一种解读是:伯克希尔把这笔投资当成”基础设施押注”而不是”科技股押注”。AI基础设施跟铁路、能源、通信网络有相似之处——都是重资产、长期回报、护城河深。对伯克希尔来说,这种资产比单纯的AI概念股更对胃口。

    800亿美元融完之后,谷歌在AI基础设施上的投入规模将超过大多数国家的年度科技预算。这场军备竞赛没有终点,至少目前看不到。Alphabet愿意把自己的资产负债表压上去,说明它对AI这件事的判断比外界想象的更坚决。

  • COMPUTEX 2026今天开幕:英伟达黄仁勋打头阵,AI PC元年正式打响

    6月2日,台北南港展览馆,全球第二大电脑科技展COMPUTEX 2026正式开幕。这届展会的主题只有两个词——”AI Together”。但这两个词背后,是整条AI产业链从云端算力到终端硬件的全面摊牌。

    黄仁勋昨天已经开讲,英伟达的算盘不止是显卡

    英伟达CEO黄仁勋选在6月1日(展会前一天)提前开讲。演讲地点在台北流行音乐中心,同步举办GTC Taipei。黄仁勋的核心信息是两条线:AI算力继续往上堆,实体AI(机器人、边缘设备)往下扎。

    面向数据中心的下一代加速平台是重头戏,但更值得关注的是英伟达在PC端的布局——传闻中的ARM架构PC处理器(代号N1/N1X),20核CPU、RTX 5070级别的GPU性能、128GB LPDDR5X统一内存。如果这个产品落地,直接对标苹果M4 Ultra,同时英伟达的GPU生态优势是苹果没有的。

    “AI Together”不是口号。黄仁勋想说的是:AI不再是某一家公司的游戏,而是整条产业链一起重新定义电脑是什么。

    英特尔亮出18A制程,AMD守着AM5等Zen 6

    英特尔6月2日的主题演讲,重点是代号Nova Lake的新一代桌面平台。18A制程(1.8纳米等效)首次在消费级产品上亮相,最高配置16个P核加32个E核,合计48核。新插槽LGA 1954,支持Thunderbolt 5和Wi-Fi 7。这款产品今年晚些时候零售,今天是官方预览。

    AMD这边没有新显卡发布计划,RX 9060 XT和RTX 50系列还在铺货。但AMD准备了面向AM5主板的全新芯片组,可能支持CUDIMM内存冲击更高频率。Zen 6架构的预热大概率也会出现,目前兼容主板信息已经开始泄露。笔记本端继续推锐龙AI Max 400系列APU,128GB统一内存可在CPU和GPU之间共享,直接对标苹果M系列。


    AI PC不是概念了,今年真的有货

    2026年被各家分析机构公认为AI PC大爆发元年。COMPUTEX这届展会上,华硕、宏碁、微星都会拿出搭载新一代处理器的AI PC样机。英特尔发力AI PC,意图很直接——把被高通和AMD蚕食的PC市场份额抢回来。

    高通6月1日下午的演讲聚焦AI PC和边缘运算,骁龙X系列继续往Windows on ARM生态里塞。NXP(恩智浦)则切入车用电子和实体AI,这条线跟英伟达的机器人布局是对得上的。

    • 1500家海内外企业参展,6000个展位,规模是亚洲第一
    • 首度新增「机器人&智慧移动」展区,AI从云端算力延伸到实体硬件
    • 南港两馆分别主打硬件零组件和AI运算次世代科技
    • 十铨科技展出PCIe Gen6 SSD,顺序读取28GB/s,直指AI训练场景

    掌机市场意外成为AI PC的试验田

    英特尔基于Panther Lake架构推出Arc G3处理器,分G3和G3 Extreme两个版本,均为14核设计。Extreme版最高12个Xe3核心,搭配LPDDR5X-8533内存,CPU频率下调到4.7GHz以兼顾续航和散热。宏碁、仁宝、富士康、GPD、微星等厂商将推出搭载该处理器的掌机产品。

    这条产品线某种程度上是AI PC技术的提前试水——低功耗、高能效、集成GPU AI算力,这些要求跟未来AI PC的核心是同一套逻辑。

  • Erin Brockovich当年告倒了电力公司,现在她盯上了数据中心的黑箱操作

    Erin Brockovich 这个名字美国人都不陌生——朱莉娅·罗伯茨在电影里演的就是她。当年她把太平洋煤气电力公司(PG&E)告到赔了3.33亿美元,这次她把目光转向了另一个正在疯狂扩张的行业:数据中心。

    田纳西州孟菲斯xAI数据中心的燃气轮机
    2025年4月,田纳西州孟菲斯河港的xAI数据中心,燃气轮机清晰可见。这类设施的环评信息往往不透明。| 图片来源:Washington Post / Getty Images

    她新上线的网站做了一个全美数据中心分布地图,数据来源很接地气——全是周边居民主动爆料的。今年4月她公开征集线索,第一个月就收到了近4000份提交。

    “反馈里最普遍的问题——比噪音、比用水量、比电费上涨更常见的,是每一个提交里都反复出现同一个词:透明度。”她在Substack上写道。

    保密协议、事后公布,居民被蒙在鼓里

    Brockovich 在文章里说得很直白:她不是反对数据中心,也不是反对AI。她反对的是一种模式——项目许可都批下来了才对外公布,开发商不搭理居民的问询,而当地官员在周边居民还不知道有这么个事儿的时候,就已经签署了保密协议(NDA)。

    这种现象在全美都在发生。数据中心为了赶工期,往往和地方政府签了保密协议,等周边社区知道的时候,环评、用地、用电审批都走完了。用水和用电的压力最后由当地居民买单,但决策过程他们全程被排除在外。

    环保活动家盯上AI基础设施,监管压力只会越来越大

    这件事值得关注的地方在于:Brockovich 不是普通的自媒体博主,她有真实的动员能力和媒体影响力。她把这个议题带到公众视野里,意味着数据中心的环保合规和运营透明度,会从行业内部讨论变成更广泛的公共政策议题。

    对AI公司来说,算力扩张的阻力正在从”芯片够不够”转向”地方社区让不让建”。Meta、Google、Microsoft、Amazon 这几年都在数据中心扩建上遇到过地方阻力,Brockovich 这个动作相当于是把各地分散的反对声音整合到了一起。


    • Erin Brockovich 曾因起诉太平洋煤气电力公司被改编为电影,由朱莉娅·罗伯茨主演
    • 新网站收录全美数据中心分布,数据来自周边居民主动爆料
    • 征集令发布第一个月收到近4000份提交,透明度是最普遍的投诉点
    • 核心指控:项目获批后才公布、NDA封锁信息、居民被排除在决策之外
  • Erin Brockovich当年告倒了电力公司,现在她盯上了数据中心的黑箱操作

    Erin Brockovich 这个名字美国人都不陌生——朱莉娅·罗伯茨在电影里演的就是她。当年她把太平洋煤气电力公司(PG&E)告到赔了3.33亿美元,这次她把目光转向了另一个正在疯狂扩张的行业:数据中心。

    田纳西州孟菲斯xAI数据中心的燃气轮机
    2025年4月,田纳西州孟菲斯河港的xAI数据中心,燃气轮机清晰可见。这类设施的环评信息往往不透明。| 图片来源:Washington Post / Getty Images

    她新上线的网站做了一个全美数据中心分布地图,数据来源很接地气——全是周边居民主动爆料的。今年4月她公开征集线索,第一个月就收到了近4000份提交。

    “反馈里最普遍的问题——比噪音、比用水量、比电费上涨更常见的,是每一个提交里都反复出现同一个词:透明度。”她在Substack上写道。

    保密协议、事后公布,居民被蒙在鼓里

    Brockovich 在文章里说得很直白:她不是反对数据中心,也不是反对AI。她反对的是一种模式——项目许可都批下来了才对外公布,开发商不搭理居民的问询,而当地官员在周边居民还不知道有这么个事儿的时候,就已经签署了保密协议(NDA)。

    这种现象在全美都在发生。数据中心为了赶工期,往往和地方政府签了保密协议,等周边社区知道的时候,环评、用地、用电审批都走完了。用水和用电的压力最后由当地居民买单,但决策过程他们全程被排除在外。

    环保活动家盯上AI基础设施,监管压力只会越来越大

    这件事值得关注的地方在于:Brockovich 不是普通的自媒体博主,她有真实的动员能力和媒体影响力。她把这个议题带到公众视野里,意味着数据中心的环保合规和运营透明度,会从行业内部讨论变成更广泛的公共政策议题。

    对AI公司来说,算力扩张的阻力正在从”芯片够不够”转向”地方社区让不让建”。Meta、Google、Microsoft、Amazon 这几年都在数据中心扩建上遇到过地方阻力,Brockovich 这个动作相当于是把各地分散的反对声音整合到了一起。


    • Erin Brockovich 曾因起诉太平洋煤气电力公司被改编为电影,由朱莉娅·罗伯茨主演
    • 新网站收录全美数据中心分布,数据来自周边居民主动爆料
    • 征集令发布第一个月收到近4000份提交,透明度是最普遍的投诉点
    • 核心指控:项目获批后才公布、NDA封锁信息、居民被排除在决策之外
  • 艾琳·布罗克维奇盯上了数据中心:AI基建热潮背后的不透明困局

    艾琳·布罗克维奇盯上了数据中心:AI基建热潮背后的不透明困局

    艾琳·布罗克维奇(Erin Brockovich)这个名字,大多数人是通过朱莉娅·罗伯茨主演的同名电影认识的——当年她硬刚太平洋煤气电力公司(PG&E)污染水源的案子,成了美国环保史上的标志性事件。而现在,这位环保活动家把目光投向了一个正在全美疯狂扩张的领域:数据中心。

    她最近上线了一个地图网站,专门标注全美各地正在建设或已建成的数据中心位置。这个地图被描述为”进行中的工作”,里面的数据点主要来自周边社区居民的主动上报。更夸张的是,布罗克维奇在五月初公开征集数据中心相关问题的线索,结果第一个月就收到了接近4000份提交。

    “提交内容里出现频率最高的担忧——比噪音、比用水量、比电费上涨都要高的——其实就一个词:透明度。”布罗克维奇在 Substack 上这样写道。

    先斩后奏的建设项目

    布罗克维奇说得很清楚:她不是在笼统地反对数据中心,也不是反对AI。她反对的是她地图上记录下来的那种模式——项目在许可已经拿到之后才对外公布,开发商不接当地居民的电话,而地方官员在邻居们还完全不知道有这回事的时候,就已经签了保密协议(NDA)。

    这套玩法在国内可能也不陌生。一个动辄消耗相当于几万个家庭的用电量和用水量的项目,决策过程却对受影响的社区完全不透明,等到大家知道的时候,许可已经批了,反对的窗口期基本过去了。

    田纳西州孟菲斯xAI数据中心内的燃气轮机
    燃气轮机——xAI数据中心,田纳西州孟菲斯,2025年4月。来源:Brandon Dill / The Washington Post / Getty Images

    AI热潮下的基础设施焦虑

    这件事的背景其实是:全美(乃至全球)正在经历一轮前所未有的数据中心建设热潮。AI大模型的训练和推理需要海量算力,算力背后就是服务器、冷却系统和——最要命的——电力。微软、谷歌、亚马逊、Meta,还有刚入局的SoftBank,都在疯狂找地方建数据中心。

    但问题是,这些项目对当地社区的影响是实实在在的:用电用水规模巨大,有的项目甚至要配套新建天然气发电厂;冷却系统的噪音污染让周边居民苦不堪言;而数据中心的税收贡献是否足以弥补这些外部成本,各地争议很大。

    更核心的矛盾在于:这些项目往往打着”经济发展”和”AI未来”的旗号,走快速审批通道,而当地居民的知情权和参与权在这个过程中被系统性地弱化了。布罗克维奇的地图项目,本质上是试图用信息公开来对抗这种不透明的决策模式。


    • 布罗克维奇数据中心地图:brockovichdatacenter.com
    • 她同时在 Substack 持续更新相关调查进展
    • 热点地区:弗吉尼亚州”数据中心走廊”、得克萨斯州、爱荷华州等
  • SoftBank 砸 750 亿欧元在法国建数据中心,AI 基础设施军备竞赛打到欧洲

    孙正义又出大手笔了。SoftBank 刚刚宣布,计划砸最多 750 亿欧元(约 870 亿美元)扩建法国数据中心容量。这不是普通的数据中心投资——目标是开发运营最高 5GW 的额外数据中心容量,这个数字已经接近许多国家全国的发电装机量。

    第一阶段已经在路上:SoftBank 要在法国的 Dunkirk(洛恩-普拉日)、Bosquel 和 Bouchain 三地开建,到 2031 年向法国上法兰西大区交付 3.1GW 的容量。这是 SoftBank 迄今为止在欧洲最大的一笔 AI 基础设施押注。

    SoftBank 既是 OpenAI 的投资者,也是其客户。这家公司在 AI 基础设施上的每一步布局,都跟 OpenAI 的扩张节奏深度绑定。

    法国为什么愿意接这个盘

    法国经济部长 Roland Lescure 在声明里说得很直白:这证明了马克龙想把法国打造成 AI 全产业链重要目的地的雄心。从算力到应用层,法国想在这一波 AI 浪潮里分一杯羹,而数据中心是最底层的入场券。

    但这块饼没那么好啃。在美国,数据中心建设已经引发越来越强的反对声浪——环保团体担心能耗和用水,电网运营商警告变电站扩容跟不上,居民则抱怨电费上涨。SoftBank 此前宣布在俄亥俄州建数据中心,配套一座 9.2GW 天然气电厂,这种”算力+能源”打包模式在欧洲能不能跑通,还是个很大的问号。


    750 亿欧元到底花在哪

    这个数字听起来吓人,但拆开看其实有迹可循。5GW 的数据中心容量,按当前 AI 训练集群的功耗水平,大约能支撑几十个超大规模 GPU 集群同时运转。法国电价在欧洲相对便宜,核电比例高,对算力密集型企业有一定吸引力。

    问题是,AI 基础设施的投资回报周期极长,而技术迭代极快。今天花 750 亿欧元建的机房,五年后会不会因为芯片架构升级而大面积闲置?SoftBank 这次赌的,是 AI 算力需求会在未来十年持续指数级增长——这个假设一旦失效,这笔钱就打了水漂。

    • 目标容量:最高 5GW,第一阶段 3.1GW(2031 年交付)
    • 投资规模:最高 750 亿欧元(约 870 亿美元)
    • 地点:法国上法兰西大区(敦刻尔克等地)
    • 定位:SoftBank 在欧洲最大 AI 基础设施投资
  • 软银豪掷750亿欧元在法国建数据中心,欧洲AI基础设施大战打响

    这两天软银扔出了一个重磅消息:计划最高投入750亿欧元(约870亿美元)在法国建设数据中心。这个数字什么概念?比很多国家的全年GDP还高。孙正义这次是真的把筹码全压在AI基础设施上了。

    5吉瓦,不只是个抽象数字

    软银的说法是,这笔钱要用来开发并运营最高5吉瓦的额外数据中心容量。第一阶段落在法国上法兰西大区,具体地点包括敦刻尔克(Loon-Plage)、Bosquel和Bouchain,到2031年先交付3.1吉瓦的容量。

    3.1吉瓦是什么概念?大约相当于3座大型核电站的发电功率,或者够支撑一个中型城市的全部用电——只不过这些电全都要用来跑AI。

    数据中心建设概念图
    AI数据中心建设已成为全球科技巨头的核心战场丨Getty Images

    软银既是OpenAI的投资者,也是OpenAI的客户,这次在法国的投资被定位为其在欧洲规模最大的AI基础设施布局。法国经济部长Roland Lescure在声明里说,这证明了马克龙要让法国成为”AI价值链全环节领先目的地”的雄心。

    “这一公告证明了埃马纽埃尔·马克龙总统的雄心,即让法国成为AI价值链全环节的领先目的地。”
    ——法国经济部长 Rolland Lescure

    美国那边却在闹

    有意思的是,软银在美国那边也在大举建设数据中心,配套的是一座9.2吉瓦的天然气发电厂。但在美国国内,反对数据中心建设的声音正在升温——居民担心能耗、水资源消耗,还有对电网和公用事业价格的影响。

    法国这边为什么能推进这么快?一方面马克龙政府一直在积极吸引AI投资,另一方面欧洲的数据中心监管环境和美国有些不同,社区阻力相对小一些。但长远来看,欧洲的能源成本和环保压力也不会比美国轻松。


    全球AI基础设施竞赛才刚开始

    把这件事放在更大的背景里看:微软、谷歌、亚马逊、Meta都在疯狂建数据中心,现在软银以750亿欧元的规模杀入欧洲,说明这场基础设施竞赛已经进入了一个全新阶段。

    值得关注的是,软银并不是在孤军奋战——它和OpenAI的绑定关系意味着,这些数据中心很可能会优先服务于OpenAI的计算需求,再加上软银日本合资企业的布局,孙正义某种程度上在搭建一个横跨美国、欧洲、亚洲的AI基础设施网络。

    • 投资总额:最高750亿欧元(约870亿美元)
    • 目标总容量:最高5吉瓦额外数据中心容量
    • 第一阶段交付:2031年,3.1吉瓦(法国上法兰西大区)
    • 定位:软银在欧洲规模最大的AI基础设施投资
  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施根本没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • 互联网正在为机器重构,人类流量迟早被反超




    互联网正在为机器重构,人类流量迟早被反超

    过去几十年,云计算基础设施都是围绕「人类行为」设计的:人搜索、点击、滚动、播放,节奏稳定且可预测。但AI代理的行为完全不同——它们能在几秒钟内同时启动多个子代理,查询数百个数据库、搜索文档、调用API,然后像出现时一样迅速消失。

    在这种认知下,亚马逊正在重新设计其核心云基础设施的一块关键拼图。

    AI agents conceptual illustration
    AI代理正在重塑互联网基础设施的设计逻辑。图片来源:akinbostanci / Getty Images

    AWS悄悄上线了一件大事

    本周四,AWS发布了新一代OpenSearch Serverless——这是一个完全托管的搜索和向量数据库,本质是一个大规模存储和检索信息的系统——而它的设计目标非常明确:专门为AI代理工作负载打造。

    AWS表示,这个新系统能在代理触发任务时瞬间扩展,在代理闲置时缩回到零。这套逻辑听起来简单,但对原本为人类设计的架构来说,是一次根本性重构。

    「代理正从实验阶段走向生产环境,它们产生的流量模式是此前的基础设施根本没有为之设计过的。」——Tia White,Amazon OpenSearch Service 总经理

    人类的互联网,机器的用法

    这个发布背后,是整个科技行业逐渐意识到一个问题:为人类驱动的互联网而设计的基础设施,在越来越多代理存在的世界里,其实并不好用。

    目前AI代理在互联网活动中的占比还相对较小,但机器生成的流量已经相当可观,而且还在持续增长。Cloudflare的数据显示,过去六个月里,机器人流量占整体HTTP流量的31%。其中,AI爬虫、搜索引擎和助手约占所有机器人请求的四分之一。

    Cloudflare高级产品经理Lai Yi Ohlsen对TechCrunch说了一句很直接的话:

    「非人类流量将在2027年上半年某个时间点超过人类流量。」


    谷歌也押注了代理

    上周的谷歌I/O开发者大会上,谷歌宣布用户将能够把购物研究、行程预订、网页浏览、应用交互等任务委托给AI系统。但这件事的影响远不止消费级AI助手。

    企业正在越来越多地内部部署代理,同时也让代理面向自己的客户运行,在幕后创造出全新类型的机器生成流量。

    结果是,云服务商和基础设施公司一直在思考一个问题:如何把为人类设计的系统,改造为能够适应代理持续自主检索信息、调用工具、生成机器对机器流量的世界。

    这正是AWS新版OpenSearch Serverless想要解决的问题。

    技术关键:把计算和存储拆开

    这一代产品最核心的技术变化,是把计算层与存储层解耦。计算资源可以在几秒钟内扩展,以容纳代理流量的突发高峰,也可以缩回到零,这样客户在代理闲置时就不用付钱。

    White用一个比喻来解释之前的困境:就像你一直为一个停车位付钱,哪怕你根本没在用它。而升级后的Serverless版本更像是按计时器付费的停车位。

    「之前,哪怕是我们上一代的Serverless版本,你也至少得让一个实例在运行,因为存储和计算是耦合在一起的。你没法按照你需要的速率自动启动(计算),所以你总是要为你的工作负载预留闲置的计算资源,不管你用没用。」White说。


    整个云行业都在跟进

    这种转变正在整个云计算行业同步发生。Databricks和Snowflake正在把自己重新定位为企业数据的AI记忆和检索系统。微软已经推出了针对Azure的更新,专门用来处理AI代理的流量突发,并在代理之间共享记忆。Cloudflare在类似的逻辑下,上个月也推出了旨在为代理提供持久化环境和即时扩展能力的基础设施。

    公司部署的AI代理越多,围绕机器生成的工作负载重新设计基础设施的压力就越大,这反过来又可能让代理在更大规模上的部署变得更便宜、更容易。

    发布时,OpenSearch Serverless将原生集成Vercel和Kiro等AI开发平台,这样开发者就可以为代理部署生产就绪的搜索和向量后端,而无需管理基础设施。

    这对开发者来说是个好消息——至少从理论上讲,代理驱动的应用的运维成本应该会降下来。但更大尺度上看,这件事的真正意义是:互联网的基础设施,正在从「为人类设计」转向「为机器设计」。人类仍然是使用者,但底层管道的优先级已经变了。