作者: hiyoho

  • 【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    crawl4ai - LLM友好网页爬虫工具

    crawl4ai – 专为LLM和AI Agent设计的网页爬虫工具 @reference_1@

    📌 项目简介

    crawl4ai 是一款专为LLM和AI Agent设计的开源网页爬虫工具,能将任意网页内容转换为干净的Markdown格式,可直接用于RAG、AI Agent、数据管道等场景,无需依赖任何付费API。

    68.3K+
    GitHub Stars

    Python
    开发语言

    v0.6+
    最新版本

    ⚙️
    安装要求和过程

    环境要求

    • Python ≥ 3.10
    • Playwright(用于异步浏览器控制)
    • 支持 Windows / macOS / Linux

    快速安装(4步搞定)

    # 第1步:安装 crawl4ai
    pip install -U crawl4ai
    # 第2步:配置浏览器依赖
    crawl4ai-setup
    # 第3步:验证安装
    crawl4ai-doctor
    # (可选)如 Playwright 报错,手动安装浏览器
    python -m playwright install chromium

    Docker 部署(生产推荐)

    # 拉取官方镜像
    docker pull unclecode/crawl4ai:latest
    # 启动容器
    docker run -d -p 11235:11235 –name crawl4ai –shm-size=1g unclecode/crawl4ai:latest
    # 访问监控面板
    http://localhost:11235/dashboard


    核心功能

    ① 智能 Markdown 生成

    生成结构清晰、格式准确的干净 Markdown,支持 Fit Markdown 启发式过滤,自动剔除无关噪音内容。支持 BM25 算法过滤,可提取核心信息,更适合 AI 处理。

    ② LLM 驱动的结构化数据提取

    支持所有 LLM(开源/闭源)驱动的结构化数据提取。内置多种分块策略,支持基于用户查询的语义内容匹配,可通过自定义 Schema 从重复页面模式中批量提取结构化 JSON。

    ③ 浏览器深度集成

    支持托管用户自有浏览器,通过 Chrome DevTools 协议实现远程浏览器控制。支持浏览器配置文件持久化(保存认证状态、Cookie),完美支持需要登录的网站爬取。

    ④ 动态页面与反爬对抗

    支持执行 JavaScript、等待异步动态内容加载、处理无限滚动页面。提供隐身模式模拟真实用户行为,支持自定义请求头、Cookie、User-Agent 和代理认证,有效绕过常见反爬限制。

    ⑤ Docker 一键部署 + API 服务

    提供优化后的 Docker 镜像,内置 FastAPI 服务,开箱即用。内置 JWT 令牌认证保障 API 安全,支持大规模生产环境部署,是构建数据采集基础设施的最佳选择。

    💡
    典型使用场景

    场景1:RAG 知识库数据准备

    将网页内容转换为干净 Markdown,作为 RAG 系统的知识库来源。crawl4ai 的 Fit Markdown 功能可自动过滤导航栏、广告、页脚等噪音,只保留核心正文,避免无关内容干扰大模型输出。配合深度爬取(BFS/DFS策略)可批量采集整个网站。

    场景2:AI Agent 实时信息获取工具

    将 crawl4ai 封装为 AI Agent 的工具函数,让 Agent 能够自主爬取所需网页内容。比如用户问”今天有哪些 AI 新闻?”,Agent 可自动爬取新闻网站并提取结构化信息,真正实现 AI 联网能力。

    场景3:大规模数据采集管道

    结合 Docker 部署、浏览器池、缓存机制,搭建大规模高并发网页数据采集系统。内置的浏览器配置文件持久化能力,可保存登录状态实现需要认证的网站批量采集,适合构建企业级数据采集基础设施。

    🚀 30秒快速开始

    Python 代码方式:
    import asyncio
    from crawl4ai import *

    async def main():
    async with AsyncWebCrawler() as crawler:
    result = await crawler.arun(url=”https://example.com”)
    print(result.markdown) # 获取干净 Markdown

    if __name__ == “__main__”:
    asyncio.run(main())

    CLI 命令行方式:
    crwl https://example.com -o markdown
    # 深度爬取,最多10个页面
    crwl https://docs.crawl4ai.com –deep-crawl bfs –max-pages 10

    💝
    推荐理由

    如果你正在构建 RAG 系统或 AI Agent,crawl4ai 是目前开源界最值得关注的网页数据采集工具。它解决了传统爬虫的两个核心痛点:

    第一,真正为 LLM 优化。 传统爬虫输出的是原始 HTML 或杂乱文本,需要大量后处理才能喂给大模型。crawl4ai 直接输出干净、结构化的 Markdown,内置的 Fit Markdown 功能可以智能过滤导航、广告等噪音,让 RAG 召回质量大幅提升。

    第二,对动态页面和反爬场景的支持非常完善。 基于 Playwright 的浏览器控制,可以处理 React/Vue 等前端框架渲染的页面,支持等待异步内容加载、处理无限滚动。隐身模式和浏览器指纹自定义功能,让我在采集一些有反爬机制的网站时也能稳定获取数据。

    最让我惊喜的是它的 Docker 部署方案。 几分钟就能搭建一个带 API 服务的爬取引擎,内置 JWT 认证,可以直接集成到现有数据管道中。对于需要大规模采集的场景,这比手写 Scrapy 爬虫效率高太多了。

    ⭐ 总之,如果你需要为 AI 应用添加网页数据获取能力,crawl4ai 是目前最成熟的开源选择,没有之一。

    📥 下载地址

    License: Apache 2.0 | 作者: UncleCode | 最近更新: 2026年6月

    💡 关注【开源推荐】系列,每周带你发现最值得关注的 AI 开源项目
    ⭐ 如果这篇文章对你有帮助,欢迎在 WordPress 点赞留言!

  • 贝索斯又出手了,这次是120亿美元砸向「通用人工工程师」

    贝索斯又出手了,这次是120亿美元

    杰夫·贝索斯悄悄布局AI这几年,这次的动作大得有点离谱。他跟谷歌旗下Verily的前联合创始人维克拉姆·巴贾杰一起搞了个物理AI公司,叫Prometheus,刚完成120亿美元融资,投后估值410亿美元。这个估值什么概念?这是有史以来估值最高的AI初创公司之一。

    这已经是Prometheus的第二轮融资了。去年年底成立的时候拿了62亿美元,这次直接翻倍还多。投资方名单读起来像全球金融圈的点名:摩根大通、高盛、贝莱德,再加上贝索斯本人。

    Jeff Bezos
    杰夫·贝索斯,来源:Getty Images

    “通用人工工程师”是个什么玩意

    Prometheus要做的东西,他们自己叫”通用人工工程师”(Artificial General Engineer)。说白了,就是一套能自动搞定复杂物理系统设计和制造的软件——从喷气发动机到药物化合物,都算。

    这个野心大到有点吓人。他们想用AI替代大部分工程类工作。但贝索斯在接受CNBC采访时表示,AI带来的生产力提升会产生他所说的”劳动力短缺”——意思是未来对劳动力的需求会超过供给。这个观点跟科技圈很多人的判断正好相反。不少人觉得AI会导致大规模失业,贝索斯不这么看。

    “经济的显著生产力提升将提高生活水平。现在很多双职工家庭会变成单职工家庭,有些加班的人也会不再需要加班。”贝索斯是这么说的。

    410亿美元估值,钱要花在哪

    Prometheus目前在旧金山、伦敦和苏黎世设有办公室,一共150名员工。贝索斯说,这轮融资的大部分资金将用于满足公司的大规模算力需求。这个信息很直白——物理AI很烧钱,尤其是训练模型和运行仿真。

    410亿美元的估值让Prometheus站在了物理AI赛道的最前面。但这个赛道不是只有它一个。近几个月,风险资本家正越来越多地向物理AI领域投钱。这个赛道被投资者和创业者认为比纯软件赛道更具防御性——因为物理世界能产生仅靠代码无法构建的护城河。

    贝索斯对大规模劳动力运作有深刻认知。在亚马逊,他担任执行董事长,也是最大的个人股东,亚马逊在全球拥有超过150万名员工。过去一年,随着公司加速自动化进程,亚马逊已经裁员数万人。所以他说”劳动力短缺”,多少有点讽刺——他自己的公司正在用自动化减少劳动力。

    Prometheus目前尚未披露其已有的具体研发成果。150人,120亿美元,410亿估值——这些数字摆在一起,外界难免好奇他们到底做出来了什么。接下来几个月,应该是Prometheus从神秘走向公开的关键期。


    • Prometheus完成120亿美元融资,投后估值410亿美元
    • 由Jeff Bezos和Verily前联合创始人Vik Bajaj创立
    • 开发”通用人工工程师”软件,目标替代大部分工程类工作
    • 贝索斯预测AI将导致”劳动力短缺”,与主流观点相反
    • 融资主要用于算力需求,公司在旧金山、伦敦、苏黎世设有办公室
  • 西班牙人做机器人,不走波士顿动力的路子

    西班牙人做机器人,不走波士顿动力的路子

    类人机器人喊了这么多年,工厂里还是少见。不是技术不行,是制造业等不及了。欧洲一家叫Theker的初创公司刚完成8500万美元A轮融资,做的就是这件事——让机器人真的进工厂。

    他们的思路跟波士顿动力那种固定形态的人形机器人不一样。Theker的机器人可以重新配置,手、手臂、整体形态都能根据任务换。今天分拣包裹,明天打包服装,后天在仓库里处理瓶罐,同一个机器人换个”零件”就能干。

    Theker机器人
    Theker联合创始人,来源:Theker

    Zara的母公司投了,但这只是起点

    Theker的第一个大客户是Zara的母公司Inditex。这件事的意义不只是拿到一个客户,而是证明了他们的方向是对的——零售和物流的场景足够复杂,能搞定这里,制造业就不会太远。

    这轮融资由美国VC公司CRV领投,三星和LVMH董事长贝尔纳·阿尔诺旗下的Aglaé Ventures也跟进了。三星目前还不是客户,但双方聊得很深。Theker的态度很明确:欢迎三星同时当客户、供应商和投资者,这种三重身份能让一家初创公司同时拿到大规模制造的订单和信任背书。

    “我们创立Theker不是为了做试点项目。”联合创始人Carla Gómez Cano说得很直接。所以他们完全跳过创新部门,直接找物流或运营部门谈,那些地方的合作是实打实的,决策也快得多。

    欧洲史上最大机器人A轮,钱要花在哪

    8500万美元,Theker说这是”欧洲有史以来规模最大的机器人领域A轮融资”。他们在巴塞罗那市中心设了展示厅,接下来还要在欧洲、美国和亚洲开更多。团队现在几十人,到今年年底要冲到120人——光是筛选15000份求职申请就够忙一阵的。

    融资额是原计划的两倍。Gómez Cano之前还说要融3000万或4000万美元,结果拿了两倍的份。这件事也让他们更坚定了把总部留在巴塞罗那的决定。巴塞罗那这几年机器人产业起来了,Theker就是其中的代表。

    工厂机器人这个赛道,过去几十年一直是日本和德国的天下。现在AI进来了,游戏规则开始变。Theker的赌注是:通用化,而不是 specialization。一个能换零件的机器人,比十个只能干一件事的机器人,对工厂来说可能更划算。


    • Theker完成8500万美元A轮融资,CRV领投,三星和Aglaé Ventures跟投
    • 机器人支持重新配置,可适配分拣、打包、仓储等多种任务
    • Zara母公司Inditex为早期支持者,目标拓展至制造业
    • 总部位于巴塞罗那,计划扩建展示厅并扩大团队至120人
  • 毕业典礼上学生嘘AI演讲,微软写了3100字长文回应:你们是在提醒我们

    这几年科技公司推广AI的方式,和大众对AI的真实感受,中间有一道越来越宽的裂缝。最近美国各地大学毕业典礼上出现了一个有趣的现象:只要演讲嘉宾提到AI,台下就会响起嘘声。相关视频在TikTok和X上疯传,成了某种集体情绪的出口。

    前谷歌CEO埃里克·施密特在亚利桑那大学演讲时遭遇学生大声抗议;另一场佛州毕业典礼上,演讲者刚说AI是「下一个工业革命」,台下的反应也是一片起哄。这些视频看起来是学生在闹,但实际上折射的是一种更广泛的不满——年轻人一边在用AI,一边对它带来的后果感到不安。

    Microsoft
    微软总部 | 来源:The Verge

    微软的3100字回应

    面对这个局面,微软副总裁兼总裁布拉德·史密斯(Brad Smith)没有直接无视,而是写了一篇超过3100字的长文,标题叫《AI、就业与下一代》。文章的态度是温和的,甚至有点反思的意味。

    史密斯在文章里说,那些对AI提及皱眉甚至发出嘘声的毕业生,「其实是在告诉我们该听的信息:是时候再次提高标准了」。他在X平台上也补充了一句:「发出嘘声的毕业生是在提醒我们,AI应该服务人,而不是取代人。」

    「你们处于能发挥积极影响的位置,你们经历过不少挑战。虽然就业市场的不确定性可能让你觉得不公平,但你就是为这个时刻而生的。」

    这封信是写给谁看的?

    The Verge的文章提出了一个挺尖锐的问题:史密斯这篇长文,到底是说给愤怒的毕业生听的,还是说给那些看了嘘声视频却不以为然的企业高管听的?

    如果是后者,那这篇文章的意义就不一样了。那些高管本来就需要被提醒「AI要服务人」,但问题是,他们本身就是推动AI大规模落地的人。指望他们自我约束,这件事本身就有点矛盾。

    更何况,科技圈在这件事上的公信力并不高。OpenAI的CEO山姆·奥特曼之前警告AI会有灾难性影响,后来发现这种说法不受欢迎,又改口了。微软自己的AI CEO Mustafa Suleyman也一直在就业话题上「走钢丝」。大家不信,也是有原因的。


    年轻人的AI愧疚感

    这件事背后还有一个值得注意的细节。最近有调研发现,Z世代其实广泛使用AI,但用的时候会有「愧疚感」。他们知道AI有问题——能耗、版权、对就业的影响——但又离不开它。这种矛盾心理,在毕业典礼那个场合被放大了。

    毕业典礼本来是个展望未来时刻,演讲嘉宾站在台上描绘AI将如何改变世界,台下的学生听到的可能是:「我未来的工作要被这个东西取代了,而你正是推动这件事的人。」嘘声是一种抗议,但也是一种无力感的表达。

    史密斯的长文试图消解这种对立,但他的核心逻辑还是「AI会来,我们要学会适应」。这个叙事框架本身,可能就是学生不信的原因之一。

  • 狮门影业买了Runway的股份,打算用《饥饿游戏》IP做AI短剧

    好莱坞和AI的关系一直很微妙。一边是编剧大罢工留下的伤口还没愈合,一边是各家制片厂悄悄地和AI公司签协议。6月11日,狮门影业(Lionsgate)和生成式视频AI公司Runway宣布把合作升级——不只是技术合作,狮门还直接拿了Runway的少数股权。

    从「用AI做电影」到「用IP做AI内容」

    这次合作的核心内容其实分三层。第一层是股权:狮门买进了Runway的少数股份,正式成为战略股东。第二层是内容开发:双方要联合开发新的IP,同时推出一系列AI驱动的合作项目,其中第一批落地的就是AI生成的短剧系列。第三层是IP授权:狮门把自己手里的一堆经典IP交给Runway,用来训练或者生成内容。

    狮门手里的IP清单相当能打——《饥饿游戏》《疾速追杀》《分歧者》《广告狂人》……这些IP加起来的全球票房超过200亿美元。现在Runway可以用这些IP来生成AI短剧,至于具体先用哪个IP,双方暂时还没公布。

    John Wick
    狮门影业经典IP《疾速追杀》剧照 | 来源:TheWrap

    Runway的CEO说:AI是创意资源,不是省钱工具

    这话说出来其实挺有讲究的。好莱坞对AI的最大恐惧就是「AI来替代编剧和演员」,所以美国编剧工会(WGA)2023年大罢工的核心诉求之一就是限制AI的使用。Runway联合创始人兼联席CEO Cristobal Valenzuela特意强调了这个定位:

    「我们一直看到,对AI最重视的制片厂都将其视为创意资源,而非削减成本的工具。狮门理解这一点。此次扩大合作将帮助更多故事更快被讲述。」

    狮门副董事长Michael Burns的表态也在这个方向上:「Runway是很好的创意合作伙伴……它将帮助我们的创作者重新定义和重塑他们创意实践中『可能性』的边界。」

    上次的合作其实卡住了

    这不是狮门和Runway第一次合作。2024年双方就签过合作协议,但据TheWrap此前的独家报道,那个合作在「用AI生成完整电影」这件事上遇到了不小的限制——生成出来的画面达不到电影级的要求。这次调整方向,改做短剧系列,某种程度上是双方在现实约束下找到的一个新路径。

    短剧这个格式对AI生成来说要比长片友好得多。单集几分钟,容错率更高,观众对画质的容忍度也更高。而且短剧现在的商业逻辑已经跑通了——TikTok、Reels、Shorts这些平台上的剧情类短内容,已经有稳定的受众和变现路径。


    AI电影节的信号

    作为合作的一部分,狮门会成为Runway今年6月举办的「Runway AI电影节」的呈现合作伙伴。这个电影节的定位是展示AI辅助创作的电影作品,狮门的加入等于给了这个活动一个主流制片厂的背书。

    目前双方还没有公布AI短剧系列的具体上线时间表。但从合作宣布的节奏来看,Runway显然希望在AI视频生成这个赛道上,抢在OpenAI的Sora正式大规模开放之前,先把自己的商业落地案例做出来。

  • 独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    Google Lyria AI音乐训练争议
    独立音乐人起诉谷歌,指控其使用YouTube内容训练Lyria AI音乐模型 | 图片来源:The Verge

    独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    一群独立音乐人正在起诉谷歌,理由听起来挺直接:谷歌非法使用他们上传到YouTube的歌曲来训练Lyria 3音乐生成模型。但谷歌的回应方式,比诉讼本身更值得玩味。

    谷歌已提交驳回诉讼的动议。它的抗辩策略是典型的”两步走”:先说”你们无法证明我们用了你们的具体作品来训练”,再退一步说”就算我们用了,你们也在服务条款里授权我们这么做了”。

    “他们的诉讼基于’谷歌用他们的特定作品进行训练’这一没有证据支持的假设。即使接受他们未经证实的指控为事实,这份起诉书也不成立。每位原告都授权YouTube及其服务提供方谷歌,对上传内容拥有广泛的使用许可。”

    这是法律文件的常规操作。但当记者直接问谷歌是否使用YouTube视频训练Lyria 3时,该公司拒绝置评。这个沉默本身,其实已经说明了一些问题。

    谷歌自己说漏过嘴

    把几件事放在一起看,答案其实相当明显。

    2024年4月,YouTube CEO尼尔·莫汉(Neal Mohan)在接受彭博社采访时提到,YouTube视频的”一部分”可能会被内部用于训练Gemini等模型。同年晚些时候,一篇关于创作者工具的官方博客也确认了这一点,称”我们使用上传到YouTube的内容,来改善YouTube和谷歌平台上的创作者和观众的产品体验,包括通过机器学习和AI应用的方式。”

    谷歌甚至向CNBC确认,它正在使用YouTube上传内容训练Gemini和Veo。只是从头到尾,它从来没有明确确认过:这些内容是否也被用来训练Lyria。

    所以在驳回诉讼的动议里,谷歌其实把底牌亮出来了:原告直接将内容上传到YouTube时,已同意YouTube的服务条款,该条款授予谷歌”复制、分发、制作衍生作品”等基于上传内容的广泛权利。

    为什么不干脆承认

    原因并不难理解。目前谷歌公开承认这件事并没有什么好处,而且在诉讼仍在进行的情况下,保持”合理推诿”是它经过计算的策略。

    但这件事触及的问题比一场诉讼更大。AI音乐生成模型需要大量音乐内容作为训练数据,而全球最大的音乐视频平台就是YouTube。如果谷歌在用YouTube上的音乐内容训练Lyria,它面对的就不只是这一场集体诉讼,而是整个音乐创作者群体对AI训练数据合法性的质疑。

    华纳音乐今年收购AI溯源公司Sureel AI,走的正是另一条路:用技术追踪AI训练中的版权使用,而不是等到被告上法庭才回应。谷歌选择的是更硬的抗辩姿态,这场官司怎么判,可能会影响整个AI音乐行业的游戏规则。


  • 在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    Opendoor撤出印度
    Opendoor在印度业务仅运营不到两年便宣布撤出 | 图片来源:TechCrunch

    在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    在线购房平台Opendoor本周宣布关停印度业务,距离它在钦奈和班加罗尔开设办公室还不到两年。CEO Kaz Nejatian给出的说法是:要把运营工作迁回客户所在的美国,同时转向规模更小、以AI为核心的团队。

    这则公告在硅谷引发了一轮不小的讨论。创始人、投资者和外包专家都在问同一个问题:AI是不是已经开始改变离岸工作的经济逻辑了?

    印度早已不是只做外包后台工作的地方。它是全球最大的全球能力中心(GCC)市场——跨国企业设立的专属离岸单元,负责处理从IT、财务到研发的所有业务。印度目前有超过2100个这类中心,雇佣约236万人,年营收接近1000亿美元。

    Opendoor在2024年进军印度时,在钦奈和班加罗尔组建了近250人的团队,主要处理分散在各系统中的手动工作流。但过去几年,整个公司一直在收缩。证券文件显示,去年年底Opendoor全球员工总数为1042人,而前一年是1470人;非美国员工数量也从342人缩减到184人。

    大规模裁员让人很难单纯从”AI替代外包”这个角度来理解印度业务的关停。在美国房地产市场低迷、在线购房业务整体承压的背景下,Opendoor一直在全业务线削减成本。但Nejatian解释这一举措时的表述,还是让投资者和外包分析师感到共鸣——他们认为AI正在重塑企业组织运营工作的方式。

    投资者怎么看

    部分投资者把Opendoor的决定当作AI对印度庞大外包劳动力影响的信号。Better Tomorrow Ventures联合创始人Sheel Mohnot直接写道:”随着手动工作被AI取代,印度的很多工作岗位都会消失。”

    另一些人看到的则是企业组织方式更大范围的转变。Emergent Ventures风险投资家Keshav Lohia称这是”AI驱动运营的转折点”,认为AI的进步正在开始挑战让印度成为热门离岸目的地的成本套利模式。

    HFS Research首席执行官Phil Fersht对TechCrunch表示,这一进展不应只被看作工作岗位从印度转移到美国,更重要的转变是:AI正在减少企业原本需要的运营人力规模,让企业无论位于何处都能以更精简的组织运营。

    “这不是一次孤立的重组。这是随着企业围绕AI、自动化和更精简的工作流重新设计运营,我们开始看到的更广泛模式的一部分。”

    “服务即软件”时代来了?

    Fersht认为,赢家将是那些把AI、软件和人类专业知识结合起来、在不持续增加人员规模的情况下交付成果的企业。他把这种模式描述为”服务即软件”(service-as-software)。

    他说,虽然Opendoor可能是第一个备受瞩目的案例,但不太可能是最后一个。

    部分投资者的思考已经延伸到单个企业之外。Speedinvest风险投资家Varun Rekhi认为,如果AI降低对劳动密集型服务的需求,最终可能会给印度最重要的出口产业之一带来压力——该产业的核心就是向全球企业供应人才和专业知识。

    目前的Opendoor案例仍然复杂。该公司多年来一直在大幅削减人员规模,其退出印度业务的原因,既关乎自身的困境,也关乎AI和离岸工作的未来。但可以肯定的是,类似的讨论只会越来越多。


  • 把核反应堆冷却技术搬进数据中心,这家MIT初创公司说能零耗水还省电

    AI的爆炸性增长,背后是数据中心的大规模扩张。到这个十年结束的时候,美国数据中心的用电量预计会占到全国总量的9%到17%。而今天,数据中心大约有三分之一的电力是花在冷却芯片上的。

    这就是Ferveret想要解决的问题。这家公司的名字不太常见,是两个MIT的研究员创办的。其中一个是Reza Azizian,他曾经是MIT核工程方向的博士后;另一个是Matteo Bucci,MIT核科学与工程系的副教授。

    从核反应堆到AI芯片

    他们做的事情听起来有点跨界:把核反应堆里的热量传递技术,搬到数据中心的芯片冷却上。核反应堆里,怎么把堆芯的热量高效地导出来,直接决定了能发多少电。科学家在这件事上研究了几十年。现在,同样的技术思路被用到了AI芯片上。

    Ferveret的方案叫自适应相变冷却(APC)。简单说,就是把服务器整个浸没在一种特殊的液体里。这种液体比风扇吹出来的空气吸热效率高得多。但Ferveret跟别家的浸没式冷却不一样的地方在于气泡——他们的液体在服务器表面产生的小气泡,比别的方案更小,脱离表面的频率也更高,这样热量传递就快得多。

    最关键的一点是,这个方案不耗水。传统的数据中心冷却,蒸发水冷要耗掉大量的水。Ferveret用的是一种低沸点的液体,不含那些有毒的PFAS”永久化学物质”,而且根本不需要往系统里加水。

    Ferveret冷却系统
    Ferveret的冷却系统将服务器浸入特殊液体中(图片来源:MIT News)

    实测数据

    他们最近跟加州大学洛杉矶分校的塞缪利计算机科学系合作做了一项测试,结果显示Ferveret的APC方案比目前最先进的液冷方案,计算能效提升了15%。如果把这部分节省下来的电,再加上Ferveret的功率控制系统对运行条件的优化,同样多的电力,数据中心的AI模型能多产出35%的token。

    Azizian第一次走进数据中心是2017年。他记得那时候整个建筑里全是巨大又嘈杂的冷却风扇。”我当时想,天哪,你们不是这么冷却设备的吧。”风冷最多能占到数据中心总功耗的40%。因为不影响性能,没人介意这套技术已经是50年前的了。

    模块化设计,适配现有基础设施

    Ferveret的产品做得比较巧妙,不是那种把服务器整个泡进去的大油箱,而是一个个能装单台服务器的小箱子,直接装在机架里。这样的模块化设计,部署和维护都方便,现有的数据中心基础设施不用大改。

    他们还配套提供了控制软件,实时调整每台服务器的功率,进一步优化效率。Bucci说,他们的全栈系统包括冷却箱、机架、冷却分配单元和传感器,软件会监控这些传感器的数据,自动把每个箱子里的运行条件调到最优。

    零耗水的地理红利

    零耗水还有一个额外的好处。阳光充足的地方往往缺水,比如非洲、中东、美国的一些地区。Ferveret的技术让那些地方也有可能建数据中心,用当地的可再生能源,不用担心冷却用水的问题。

    Ferveret现在已经跟几家公司展开了测试,包括数据中心开发商CleanSpark、AI加速器公司FuriosaAI,还有美国最大的数据中心运营商之一Switch。他们也在跟那些超大规模的云厂商谈,目前已经是英伟达Inception初创扶持计划的成员。公司计划今年晚些时候公布更多合作伙伴的消息。


  • 亚马逊第一次公布数据中心用水数字:一年25亿加仑,说自己比同行省水

    亚马逊终于把数据中心用多少水这件事说出来了,这是他们第一次公开年度用水数据。2025年,亚马逊全球数据中心一共烧掉了25亿加仑的水。

    数字公布的时间挺微妙。就在西雅图通过了一年数据中心建设禁令之后没多久,这个禁令还得到了部分亚马逊员工的支持。公司这时候把用水数据亮出来,多少有点回应外界质疑的意思。

    25亿加仑背后的数字游戏

    25亿加仑,听起来是个天文数字。但亚马逊说,他们的用水效率其实比微软、谷歌、Meta这些同行都要高。他们的报告里有一张对比图,显示每用1千瓦时的电,亚马逊的数据中心耗水0.12升,比那几家的数字都低。

    不过这个对比有点取巧。亚马逊引用谷歌的数据,只针对Gemini AI的数据中心,而亚马逊自己的数据覆盖的是全部业务。如果把谷歌所有数据中心的用水算进来,情况可能不一样。

    还有一个漏洞。亚马逊的用水统计,没有算上为数据中心供电的那些发电厂间接用了多少水,也没有把新建数据中心施工过程中的用水算进去。环保组织一直盯着这一点,说科技公司的用水报告总是挑对自己有利的数字放出来。

    风冷为主,水冷为辅

    亚马逊说他们有办法省水。数据中心90%的时间用的是风冷,只有最热的那几天、一天里最热的几个小时,才会打开蒸发水冷系统。他们还把服务器的耐热阈值调高了,让机器在高温下也能撑得住,这样就不用一热就开水冷。

    亚马逊引用了一篇去年发表的同行评审论文,调整后的数字显示,他们的数据中心用水效率是行业平均水平的7倍。这个数字外界还无法独立核实。

    亚马逊数据中心
    亚马逊的数据中心园区(图片来源:The Verge)

    时机不凑巧

    外界的质疑声不会因为这一个报告就停下来。数据中心用水这个话题,已经从小圈子里的技术讨论变成了社区政治。纽约州已经通过了一年的数据中心建设禁令,西雅图的禁令能不能撑过法律挑战还不好说。亚马逊这时候把数字亮出来,更像是一次公关防御,而不是主动透明。

    科技公司之间比用水效率,这件事本身就很新。过去大家比的是算力、比的是模型效果,现在算力背后的环境成本被摆到了台面上。亚马逊第一个把数字亮出来,不管怎么说,总比一直捂着强。


  • DoorDash用AI聊天机器人点餐,拍张照片它就知道你想吃什么

    外卖App的点餐体验其实一直有点笨:你知道自己大概想吃什么,但就是找不到——要么搜关键词匹配不到,要么翻了半天菜单还是拿不定主意。DoorDash本周推出的一款AI聊天机器人,想用对话的方式把这个过程重新做一遍。

    这个功能叫”Ask DoorDash”,已经在iOS的部分美国用户中开始推送。它的核心逻辑很简单:你不用再手动搜索餐厅或商品,直接用自然语言告诉它你想吃什么,或者更直接一点——拍张照片,它帮你把照片里出现的东西变成购物车。

    拍照就能生成购物车

    杂货购物是这个功能最实用的场景。你可以拍一张烹饪书的页面,或者手写的购物清单,甚至直接拍一张食谱截图,Ask DoorDash会自动识别其中的食材和分量,帮你把对应的商品加进购物车。它还会贴心地问你:家里还有没有糖?有没有黄油?避免你重复购买。

    如果你之前在这家店下过单,它还能根据你的历史订单推荐商品,或者帮你一键重新下单上次的购物车。这个设计和国内一些电商App的”再来一单”有点像,但多了AI对话的灵活性——你可以说”上次买的那款咖啡再来一包,再加两盒牛奶”。

    DoorDash AI聊天机器人点餐
    DoorDash新推出的Ask DoorDash支持文字和照片两种方式点餐丨图片来源:TechCrunch

    点餐和预订也一样

    点餐的场景更偏向”模糊搜索”。你可以告诉它”帮我家四口人找点能吃饱的晚餐”,它会返回一堆匹配的餐厅,并且附带一句个性化说明解释为什么推荐这家。如果结果不够精准,你可以继续对话:”有没有适合带孩子去的?口味要清淡的。”它会在这个基础上重新筛选。

    选好餐厅之后,它还能根据你的饮食偏好、预算和用餐人数,直接帮你生成推荐购物车——相当于把”看菜单→选菜→加购物车”这几步合并成一句话。

    预订功能也是类似的逻辑。你说”晚上8点左右,市中心,两个人约会用”,它会返回有空位的餐厅列表。不满意可以继续提要求:”有没有环境更私密一点的?”

    大家都在做,但DoorDash来晚了

    把AI助手塞进外卖和购物场景,这个概念已经不算新鲜了。今年2月,Uber Eats就推出了一个名为”Cart Assistant”的AI购物车助手;Instacart也有类似的AI购物工具,面向使用Instacart技术的杂货商客户开放。大家押的赌注是同一件事:AI让”购物”这件事变得更像”聊天”,用户不用再适应软件的搜索逻辑,软件来适应用户的说法方式。

    从实际体验来说,这套思路确实解决了一些痛点。传统搜索要求用户知道确切的餐厅名或商品名,但现实中很多人点外卖的状态是”大概想吃这个,但也不知道叫什么”,这时候对话式搜索就有优势了。

    不过也得泼点冷水。类似的AI聊天购物功能,过去几年里已经被各种电商平台宣布过无数次,但真正改变用户习惯的案例并不多。大部分人还是习惯直接搜索,因为确定需求的时候,搜索比聊天更快。Ask DoorDash能不能真正被用户用起来,而不是一个”听起来很酷但没人用”的功能,接下来几周的推广数据会给出答案。

    DoorDash表示,这个功能未来几周会逐步推到美国更多用户,覆盖iOS和Android两端。至于国内用户什么时候能用上——暂时还没有消息。