标签: AI基础设施

  • 软银砸下750亿欧元在法国建数据中心,欧洲AI基础设施迎来最大单笔投资

    孙正义的软银这次把赌注压在了法国。5月31日,软银集团宣布将在法国投资最高750亿欧元(约合870亿美元),建设总容量最高5吉瓦的新一代数据中心。这是软银迄今为止在欧洲最大的一笔AI基础设施投入。

    为什么是法国?

    法国经济部长罗兰·莱斯库尔在一份声明中把这笔投资称为”法国总统马克龙要把本国打造成AI全产业链重镇”的有力证明。软银的这笔钱不是撒胡椒面——第一阶段就会在敦刻尔克(洛恩-普拉日)、博斯凯和布尚三地动工,到2031年先交付3.1吉瓦的容量给上法兰西大区。

    5吉瓦是什么概念?大约相当于500万户欧洲家庭同时满负荷用电的功率。把这些算力全部用来跑大模型,能同时支撑数十个千亿参数级别的模型训练任务。

    数据中心建设概念图
    软银此次投资将用于建设大规模AI数据中心集群(图源:Getty Images)

    美国那边还在吵,欧洲直接开干

    有意思的是,数据中心建设在美国正遭遇越来越大的阻力。环保团体在起诉,电网运营商警告超负荷,公用事业公司则在抬价——今年2月TechCrunch还专门写过一篇讲美国公众对AI基础设施的反对声浪在升温的文章。

    但软银显然没被吓退。就在今年2月,软银还宣布要在俄亥俄州建一个由9.2吉瓦天然气电厂专门供电的数据中心,那笔投入已经高达330亿美元。欧洲这边选择法国,除了马克龙政府的政策吸引力,还有一个重要原因:法国的核能发电占比超过70%,低碳电力对承诺ESG目标的科技巨头来说是一张好牌。


    OpenAI关系户的身份,让这笔投资更值得玩味

    软银既是OpenAI的投资方,也是OpenAI最大的企业客户之一——去年11月两家公司还在日本宣布成立合资公司,那笔交易的逻辑就是软银帮OpenAI落地亚洲市场。现在欧洲这5吉瓦的算力如果最终投产,OpenAI很可能是头号租户。

    换个角度看,这也说明算力基础设施的军备竞赛已经不局限于美中两个超级市场了。欧洲正在用政策+清洁能源的组合拳抢跑,法国能不能借这波投资真正成为”欧洲的AI高地”,接下来几年就看马克龙政府的后续动作了。

    • 投资规模:最高750亿欧元(约870亿美元)
    • 总容量:最高5吉瓦数据中心用电容量
    • 首批落地:敦刻尔克、博斯凯、布尚(2031年前交付3.1吉瓦)
    • 战略意义:软银在欧洲最大单笔AI基础设施投资
  • 互联网正在为机器重构——AI智能体正在改写整个网络基础设施

    过去二十年,互联网一直是围绕人类行为设计的。人们搜索、点击、滚动、串流,这些动作有规律、可预测。但AI智能体不这么干活。它们能在几秒钟内发起一连串突发请求,同时调出十几个子智能体,疯狂查询数据库、检索文档、调用API,然后突然全部消失。这种流量模式,人类的网络基础设施从来没为它设计过。

    AWS悄悄改写了搜索数据库的底层的

    本周,亚马逊云科技(AWS)发布新一代OpenSearch Serverless——一个专门面向AI智能体负载设计的托管搜索和向量数据库。最核心的变化是:计算和存储解耦了。智能体发起任务时,算力可以在几秒内弹性扩容;智能体 idle 时,算力可以缩到零。客户不用再为空闲的计算资源付费。

    “智能体正从实验阶段走向生产环境,它们产生的流量模式,是之前的基础设施根本没考虑过的。”
    ——Tia White,亚马逊OpenSearch服务总经理

    之前的Serverless版本也有弹性,但存储和计算是绑定的,你至少得保留一个运行中的实例。说白了就是:哪怕你没在用,也得一直付停车费。新一代相当于改成了计时停车位——来了才计费,走了就归零。

    AI智能体概念图
    AI智能体正在改变互联网流量结构(图片来源:Getty Images)

    机器流量已经超过你想象

    Cloudflare的数据很说明问题:过去六个月, bots 流量已经占到整体HTTP流量的31%。其中AI爬虫、搜索引擎和AI助手加起来,约占所有bot请求的25%。Cloudflare高级产品经理Lai Yi Ohlsen预计,2027年上半年,非人类流量就会超过人类流量。

    这不只是在抢带宽。智能体的检索模式跟人类完全不一样——它们会并发查询数百个数据源,对延迟极度敏感,而且流量峰值毫无规律。传统的基础设施假设用户是”逐步浏览”的,但智能体是”瞬间爆发”的。

    整个行业都在跟

    AWS不是唯一一个在干这件事的。Databricks和Snowflake正在把自己重新定位为企业AI内存和检索系统;微软Azure最近也推出了针对AI智能体突发流量和多智能体共享内存的更新;Cloudflare上个月发布了面向智能体的持久化环境和即时扩展基础设施。

    Google I/O上周也释放了信号:用户很快就能把购物研究、行程预订、网页浏览等任务委派给AI系统。不管是面向消费者的AI智能体,还是企业内外部部署的智能体,机器对机器的流量正在指数级增长。


    这场基础设施的重构,本质上是为下一个十年做准备。当智能体成为互联网的主要”用户”,整个堆栈——从数据库到CDN,从API网关到身份认证——都得重新思考。目前看,大的云厂商已经跑起来了,但这一步才刚刚开始。

  • 这家芯片初创把计算搬进内存,1.35亿美元融资到手

    每次你向ChatGPT提问,你的请求都会触发一场数据接力赛。信息离开内存,经过CPU预处理,传输到GPU进行繁重计算,然后再返回——而AI生成的每一个字,整个流程都会重复一遍。

    瓶颈是结构性的。这意味着每一个请求中,数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司,刚刚在B轮融资中筹集了1.35亿美元,估值达5.7亿美元。

    “几十年来,CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim

    把计算搬进内存

    XCENA的芯片MX1通过CXL(计算快速链接)连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近,而不是反过来。

    该公司声称,以前需要10台服务器完成的工作,现在可能只需要1台就可以完成。

    XCENA MX1芯片原型
    XCENA MX1芯片原型(图源:TechCrunch)

    为什么是内存,不是算力?

    XCENA的业务押注于一个论点,即”推理不仅是计算问题;它越来越是一个内存扩展问题。”

    虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排,包括预处理、KV缓存管理(存储之前的对话上下文的系统,这样模型就不需要重新处理它)、数据缓存,仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。


    创始团队来自三星和SK海力士

    XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司,三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。

    本月,主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是,AI基础设施正朝着以内存为中心的架构更广泛地转变。

    竞争对手和差异化

    XCENA最接近的竞争对手包括Astera LabsMarvell,这两家纳斯达克上市公司都在研发下一代内存连接技术。

    差异化因素在于知识产权。XCENA有数千个核心,每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下,Marvell的方法依赖少数几个通用核心。


    时间表和挑战

    MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线,该公司预计从2027年开始产生收入。

    XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业,即使内存效率有微小的提升,也可能意味着数亿美元的节省。

    • B轮融资1.35亿美元,估值5.7亿美元
    • 累计融资总额达1.85亿美元
    • MX1芯片基于RISC-V开源架构
    • 目标客户:超大规模AI基础设施运营商
    • 量产时间:2026年底;收入预期:2027年
  • DeepSeek V4-Pro永久降价75%,输出token不到1美元

    上个月DeepSeek推出V4-Pro的时候,给了一个75%折扣的促销价,截止日期写在5月31日。业内普遍以为这只是新模型上线的拉新手段,到期后会涨回原价。结果5月22日,DeepSeek直接在官方文档里把折扣价改成了永久定价——没有任何预告,就是悄悄把数字改了。

    新价格出来之后,输出token的成本是每百万0.87美元。作为对比,OpenAI的GPT-5.5输出token定价大概是其34倍。Anthropic的Claude Opus 4.7、谷歌的Gemini 3.5 Flash,在同级别推理能力下,每token价格都比这家中国公司贵出一截。

    DeepSeek-V4-Pro永久降价后,在全球”性价比”排名中直接登顶。输出定价低于1美元/百万token的前沿模型,目前只有这一家。

    为什么敢这么定价?

    背后的技术原因挺直接:V4系列从设计之初就针对华为昇腾950 AI加速器做了优化,不依赖英伟达GPU。DeepSeek在发布V4时就说过,一旦昇腾950超级节点大规模可用,API定价会大幅下降,当时预计是2026年下半年。结果他们提前动了刀,说明对基础设施成本已经看得足够清楚了。

    具体价格表:缓存命中输入0.003625美元/百万token,缓存未命中输入0.435美元/百万token,输出0.87美元/百万token。人民币计价的话,大概是0.025元到6元/百万token的区间。

    行业反应

    彭博社把这件事定义为AI价格战的升级信号。开发者社区的反应更直接——之前犹豫要不要把DeepSeek纳入生产系统的团队,现在可以放心规划了,因为价格的不确定性消除了。

    这件事的另一个影响是:如果每百万token低于1美元的高性能推理成为常态,那么教育、工具类SaaS、小型创业公司这些对成本敏感的场景,AI接入的门槛就彻底打开了。


  • 埃琳·布罗克维奇新活:给美国AI数据中心画地图,把争议摊在阳光下

    埃琳·布罗克维奇这个名字,看过那部2000年同名电影的人都不会陌生。朱莉娅·罗伯茨演的那个倔强的环保活动家,靠一己之力掰倒了太平洋煤气电力公司。现在,她把目光转向了AI。

    不是AI本身有什么问题——是支撑AI的那些数据中心。布罗克维奇最近上线了一个网站,专门收集全美各地社区对本地数据中心项目的投诉,还做了一张互动地图,把这场”AI基础设施竞赛”的真实足迹摊开在阳光下。

    “建设AI基础设施的竞赛正在美国一个个城镇中展开。在一些地方,数据中心受到了欢迎。而在另一些地方,它们被推迟、遭到反对,或者干脆被彻底放弃。这张地图记录了这场竞赛的真实足迹——揭示了增长、冲突和不确定的模式。”

    数据中心到底惹了谁

    表面上,数据中心是”数字经济基础设施”,地方政府也乐意看到投资落地。但住得近的人想法不一样——数据中心耗电量惊人,冷却系统吃掉大量水资源,还有噪音问题。更别说那些动辄占地几十英亩的巨型建筑,对周边社区的空间压迫感很强。

    布罗克维奇的地图不是那种冷冰冰的基建统计,而是把每个争议项目的社区反馈都记录了进去。哪些项目被推迟了、哪些遭到了居民集体反对、哪些已经悄悄下马——这些信息散落在各地新闻和市政会议记录里,普通人根本没渠道汇总来看,现在有了这张地图,情况不一样了。

    AI热潮背后的基础设施焦虑

    这件事的背景其实挺大的。各大科技公司为了跑AI模型,正在全美疯狂建数据中心。微软、谷歌、亚马逊、Meta,每家都有自己的超大算力基地扩建计划。这股浪潮涌到哪儿,哪儿的电力和水资源压力就跟着上来。

    有些州(比如弗吉尼亚和得克萨斯)因为电网容量问题,已经开始重新审视数据中心的审批流程。社区居民也越来越多地出现在市政听证会上,拿着电费账单问官员:为什么数据中心来了以后,我的电费涨了?


    布罗克维奇的玩法

    她的网站(brockovichdatacenter.com)不只是放一张静态地图。访客可以提交自己社区的数据中心相关投诉,相当于一个众包式的数据收集平台。这种方式和她早年调查水污染事件的路径其实是一脉相承的——靠普通人提供的线索,拼出大公司不愿意让你看到的全貌。

    目前这张地图已经覆盖了数十个活跃争议地点,集中在弗吉尼亚州(那里是全球最大的数据中心集群之一),以及俄勒冈、得克萨斯、亚利桑那等州。随着AI算力需求继续膨胀,这张地图上的红点只会越来越多。

    布罗克维奇这次盯上的,是AI时代最容易被忽视的那层东西——不是算法,不是模型,是那些24小时嗡嗡响的机房,以及它们和周边社区之间越来越紧张的关系。

  • OpenRouter估值翻倍至13亿美元,AI中间件赛道彻底火了

    OpenRouter估值一年翻倍以上,AI中间件成了最热门赛道

    如果你最近在关注AI行业的融资动态,OpenRouter这笔B轮融资绝对值得拿出来聊聊。这家做AI模型网关的公司,刚拿了1.13亿美元,领投方是谷歌母公司Alphabet旗下的CapitalG——也就是谷歌自己的成长型基金。

    《纽约时报》的报道给出了一个关键数字:这轮融资过后,OpenRouter的投后估值大约在13亿美元左右。要知道,就在一年前(2025年6月),他们刚完成4000万美元的A轮,当时投后估值才5.47亿美元。一年时间,估值涨了不止一倍。

    OpenRouter提供超过400个模型的访问权限,涵盖Anthropic、谷歌、OpenAI、xAI和DeepSeek等主流厂商的产品。平台目前拥有800万全球用户,每月处理100万亿个token。

    AI的玩法变了

    到底发生了什么?答案其实挺直观:AI的玩法变了。一年前,大家还在卷模型训练,比的是谁的模型更准、更大。后来进入了推理阶段,各家开始优化成本和响应速度。而现在,AI智能体(Agent)成了新的主战场。

    企业不再只用一个模型搞定所有事情,而是针对不同任务选不同的模型——写代码可能用Claude,搜信息用Perplexity,数据处理用GPT。这就是OpenRouter存在的意义:它相当于一个”AI模型超市”,企业用户可以在一个平台上按需切换,既控制成本,又提升特定任务的准确率。

    AI模型与云计算概念图
    AI模型正成为可替换的隐形基础设施(图源:TechCrunch)

    多模型并存的时代来了

    用户增长数据也很能说明问题。OpenRouter目前每周处理的token规模已达到25万亿个,而6个月前这个数字是5万亿——相当于5倍增长。这个增速比很多人的预期都要快。

    换个角度看,OpenRouter的成功其实揭示了一个重要趋势:AI模型正在变成一种”隐形基础设施”。企业不希望被某一家模型厂商锁定,就像当年大家不愿意被某一家SaaS供应商绑定一样。多模型并存的时代已经到了,而OpenRouter正好站在了这个趋势的风口上。


    谷歌为什么押注”模型中间件”

    硅谷的投资人们显然也看到了这一点。除了CapitalG领投,A轮时Andreessen Horowitz、Menlo Ventures和红杉资本都参与了跟进。有趣的是,CapitalG是谷歌的基金,而OpenRouter平台上也接入了谷歌的模型。谷歌一边自己做大模型,一边还通过旗下基金投资”模型中间件”——这个姿态挺值得玩味的。

    或许在谷歌看来,AI生态越繁荣,自己的模型也就有更多机会被用到。与其担心用户流向别的模型,不如让OpenRouter帮自己接触到更多开发者和企业客户。

    当然,OpenRouter也面临竞争。类似定位的公司还有Together AI、Replicate等,大家都在做”让企业更方便地用上各种AI模型”这门生意。但OpenRouter目前的增长速度,确实证明了这个方向的市场需求是真实存在的。对于普通开发者或者中小企业来说,这类平台的价值在于降低了试错成本——你不需要一开始就押注某一个模型,而是可以在不同模型之间灵活切换,找到最适合自己场景的那个。

  • 白宫申请90亿美元买AI芯片,给间谍们用

    说美国政府在AI上”押重注”,已经不算新闻了。但最近这个数字还是让人倒吸一口凉气——《纽约时报》披露,白宫已经批准了一项高达90亿美元的预算申请,专门用来给CIA、NSA这些情报机构买最先进的AI芯片,以及搭建配套的基础设施。

    情报机构的算力焦虑

    事情的起因挺简单:CIA和NSA发现自己的算力不够用了。具体来说,他们缺乏足够的计算能力来运行最新的AI模型,导致在AI技术的推进速度上”跟不上节奏”。

    这听起来可能有点反直觉——情报机构不是一向技术最先进的部门吗?但AI大模型对算力的需求是指数级增长的,顶尖的模型训练一次要烧掉数千万美元的计算资源。情报机构虽然有预算,但采购流程繁琐,等芯片到位,可能新一代架构又出来了。

    据《纽约时报》报道,这项预算申请专门针对英伟达Grace Blackwell超级芯片的采购和配套基础设施建设。

    Grace Blackwell是什么来头

    英伟达的Blackwell架构是2024年发布的下一代GPU,专门为大模型训练和推理设计。Grace则是英伟达自研的CPU,搭配Blackwell GPU组成超级计算平台。这个组合是目前AI训练领域最顶尖的硬件配置,价格自然也不菲。

    一块Blackwell架构的B200芯片,公开市场的单价就在3万到4万美元之间。如果按”90亿美元”的规模来算,这笔采购可能涵盖数万块芯片,加上数据中心制冷、供电、网络配套,确实是个天文数字。


    钱还没到位,国会那关不好过

    白宫虽然已经批准了这项申请,但钱还没法马上花出去——还需要美国国会点头。90亿美元不是小数目,任何一笔巨额国防或情报预算,在国会都会经历一轮激烈的辩论。

    支持者会说,这是国家安全的必要投资,中国在AI领域的投入同样巨大,美国不能掉队。反对者则可能质疑:情报机构到底要用这些算力做什么?有没有监督机制?会不会进一步加剧AI军备竞赛?

    这件事的另一层背景是,AI已经深度渗透进情报工作。从卫星图像分析、信号拦截解码,到开源情报的自动化处理,AI工具正在改变 spy game 的玩法。谁能拥有更强的算力,谁就能更快地从海量数据里捞出有价值的情报。

    90亿美元买的不只是芯片,更是一张”未来情报优势”的入场券。这张入场券贵不贵?肯定贵。但这场竞赛里,不买票的人,可能连参赛资格都没有。

  • Erin Brockovich出手了:她把美国AI数据中心地图画出来了

    Erin Brockovich出手了:她把美国AI数据中心地图画出来了

    提到Erin Brockovich,很多人脑子里会冒出Julia Roberts在电影里扮演的那个倔强女人的样子。她当年靠一己之力扳倒了太平洋煤气电力公司,帮加州小镇的居民拿到了3.33亿美元的赔偿。那是真事,不是编剧瞎写的。

    现在这位74岁的环保活动家又出手了,这次她的目标是一类全新的「污染源」——AI数据中心。

    一张地图,揭开AI竞赛的地面代价

    Erin新做了一个网站,叫「Brockovich Data Center Map」,把全美各地正在推进、已经落地、或者已经被社区抵制掉的数据中心项目全部标了出来。不只是标个点,她还同步收集各地居民对本地数据中心项目的具体投诉。

    她在网站上写了一段话,大意是:建设AI基础设施的竞赛正在美国一个城镇接一个城镇地展开。在某些地方,数据中心受到欢迎;在其他地方,它们被推迟、引发争议,甚至完全被放弃。这张地图捕捉了这场竞赛在现实世界中的足迹。

    「建设AI基础设施的竞赛正在美国一个城镇接一个城镇地展开。这张地图捕捉了这场竞赛在现实世界中的足迹——揭示了增长、冲突和不确定性的模式。」——Erin Brockovich

    这张地图的价值在于,它把平时只在当地新闻里出现的争议,汇总到了一个全国视角里。你能清楚地看到,AI这场盛宴的背后,哪些社区在买单。

    数据中心到底惹了什么麻烦

    数据中心本身不是新东西,但AI让它变了质。训练一个大模型需要成千上万块GPU同时跑,这意味着巨大的电力消耗和惊人的冷却水需求。

    一个大型AI数据中心的耗电量,差不多相当于一座小城市。用水量大到什么程度?有些地方的数据中心每天要消耗上百万加仑的水来冷却服务器。这些成本,最终都会转嫁到当地居民头上——要么是电费上涨,要么是水资源紧张。

    更让居民闹心的是,数据中心带来的就业岗位其实很少。建的时候有一批建筑工人,建完之后可能只需要几十个人来维持运转。相比之下,它被挡掉的那些产业发展机会和社区生活质量,是很难用数字衡量的。

    各地反应天差地别

    这张地图最有趣的地方在于,它显示了美国各地对数据中心的态度完全不同。有些州(比如得克萨斯和弗吉尼亚)非常积极,给了大量税收优惠,数据中心建得像雨后春笋。但在另一些社区,居民们组织起来,在镇议会上发言,写信给民选官员,硬是把项目拖黄了。

    这种分化背后有一个很现实的原因:数据中心带来的税收收益,跟它消耗的公共资源(电力、水、道路)相比,很多社区算完账之后觉得不划算。

    Erin的地图给这些分散在社区层面的抗争提供了一个「全国联动」的视角。以前一个小镇的居民可能会觉得自己是在孤军奋战,现在他们能上这个网站,看看其他地方的人是怎么跟数据中心打交道的。


    这件事跟我们有什么关系

    说回国内。中国在AI算力上的投入同样巨大,贵州、内蒙古、京津冀等地都在大力建数据中心产业园。Erin在美国做的事情,其实给我们提供了一个可以参考的视角:在拼命建算力基础设施的同时,有没有把社区的代价也算进去?

    AI公司喜欢谈「改变世界」,但真到了要建数据中心的时候,往往是离得最近的那些人在承担代价。Erin Brockovich把这件事摊开在地图上,至少让更多人开始问这个问题。

    这张地图目前只覆盖了美国,但它触及的问题是全球性的。AI的基础设施竞赛不只在加州或弗吉尼亚上演,它正在全世界每一个被选中建数据中心的社区里上演。那些地方的人,有权利知道他们要承接的是什么。

    • Erin Brockovich制作全美AI数据中心互动地图,收集社区投诉
    • 大型AI数据中心耗电量相当于一座小城市,日耗水可达百万加仑
    • 各地态度分化:得州、弗吉尼亚积极引进,部分社区成功抵制项目
    • 数据中心带来的长期就业有限,税收收益与公共资源消耗不成正比