标签: AI

  • Robinhood 让 AI Agent 帮你炒股,亏了也算你的

    AI Agent 今年最火的应用方向之一,是替你干活——包括替你花钱。Robinhood 昨天宣布,平台即将支持用户让自己的 AI Agent 直接下单交易股票,同时还推出了一张专门给 AI Agent 用的虚拟信用卡。

    AI 代理有独立账户,但每笔交易你都能看见

    具体怎么运作?Robinhood 的用户可以给自己的 AI Agent 开一个独立的子账户,绑定专用的钱包。这个 Agent 能读取和分析你的投资组合,自己制定交易策略、给出投资建议,但它只能用这个专属钱包里预充值的余额来下单,动不了你主账户里的钱。

    Robinhood AI Agent 交易功能
    Robinhood 推出的 AI Agent 交易功能界面(图源:TechCrunch)

    每笔交易执行前,你会收到提醒。有些场景下,Agent 会先给你看订单预览,你点了批准才会真正下单。Robinhood 说他们内置了欺诈检测机制,可疑交易会由人工团队审核,帮你处理纠纷。

    「我们收到很多用户的需求,希望可以接入他们自己的工具、大语言模型和 Agent,与 Robinhood 连接。这就是我们推出新产品的初衷。」——Robinhood 产品副总裁 Abhishek Fatehpuria

    还能分析研报、识别投资机会

    Agent 的能力不限于下单。用户可以把它连接到自己的 MCP(模型上下文协议)服务,让它分析投资组合的行业集中度风险、执行交易、浏览分析师研报来识别不同行业的新投资机会。

    目前这个功能还在测试阶段,暂时只支持股票交易。Robinhood 表示很快会加上对期权、加密货币、事件合约、期货和预测市场的支持。

    同步推出的还有一张 AI Agent 专用的虚拟信用卡。用户可以把自己的 Agent 连到 Robinhood 的银行 MCP 服务器,让 Agent 帮你在网上买东西付钱。这张虚拟卡目前只对 Robinhood Gold 黄金卡持卡人开放,用户可以设每月消费上限,也可以选择让 Agent 每笔支付前都来问你一声。


    不止 Robinhood 一家在搞

    让 AI Agent 代表用户付钱这件事,Robinhood 不是独一家。Stripe 早就发布了 Agent 支付接口,亚马逊和谷歌也在做类似的东西,初创公司 Prva Pay 也在冲这个方向。整个行业都在预判:下一步,用户的 Agent 会像现在的 App 一样普遍。

    Robinhood 过去几年一直在往 AI 方向投。2024 年收购了 AI 驱动的研究平台 Pluto,去年还给平台加了能给出投资建议的 AI 助手。这次把 Agent 交易做进来,算是把「AI 帮你理财」这件事又往前推了一步。

    当然,把交易权交给 AI Agent 意味着什么,每个人心里都有杆秤。Agent 能读研报、能分析组合风险,但它下的每一单最终都是你的钱在买单。Robinhood 给了用户监控和审批的机制,但「Agent 炒股」这件事本身,距离真正普及还有不少路要走。

    • AI Agent 有独立子账户和预充值钱包,无法直接动用主账户资金
    • 每笔交易可设置需用户审批,平台内置欺诈检测保护
    • 目前仅支持股票,期权、加密货币等功能即将上线
    • 同步推出 AI Agent 虚拟信用卡,支持设置月度消费限额
  • ElevenLabs 新音乐模型上线,一首歌里能随时切换说唱、歌剧和重金属

    做AI音乐生成的公司越来越多,但大多数产品生成出来的东西,听起来总有点「千篇一律」——风格定好了就一路走到黑,想换个感觉得重新生成整段。ElevenLabs 昨天发布的新版本 Music v2,想解决这个问题。

    一首歌里能切换好几种风格

    ElevenLabs 做语音 AI 起家,去年 8 月才推出第一代音乐生成模型,当时主打的是「商用授权清晰」,敢明确说训练数据是有许可证的。这在 AI 音乐圈子里其实不多见——Suno 和 Udio 两家到现在还背着版权诉讼,环球音乐和索尼音乐都在告他们。

    这次的 v2 版本,核心卖点是「中途换风格」能力。官方演示里,同一段旋律可以从歌剧唱腔一路切到重金属,再切回流行,整首歌听起来还是连贯的。说唱段落也能处理得够快,不会拖沓。

    ElevenLabs AI音乐生成界面
    ElevenLabs 的 AI 音乐生成工具界面(图源:TechCrunch)

    另一个实用功能是「局部重制」。你可以选中歌曲的某一段,用文字描述想要的效果,模型会只重新生成那一段,其他部分完全不动。对做音乐的人来说,这比重新生成整首歌省事得多。

    ElevenLabs 强调,v2 模型建立在有许可的训练数据之上,生成的内容可以商用,用户不必担心版权问题。

    AI 音乐赛道挤满了人

    最近几个月,各家 AI 实验室都在冲音乐生成这个方向。Google 在 I/O 大会上发布了 Lyria 3 Pro,还顺带推出了用 Flow Music 工具生成音乐视频的功能。Stability AI 本月也发布了能生成六分钟长曲的音频模型。Suno 的 v5.5 版本同样在近期上线。

    竞争这么激烈,ElevenLabs 把「版权干净」当作差异化卖点,确实是条路。环球音乐和 TikTok 上个月刚续签了协议,里面专门加了联手打击未授权 AI 音乐的条款。Spotify 也在和厂牌谈类似的授权框架。整个行业都在想办法把 AI 音乐「合法化」。

    新模型现在已经能在 ElevenLabs 的 ElevenCreative 工具里用到,面向市场营销和品牌团队。专门做 AI 音乐创作的 ElevenMusic 平台也在运营,API 版本很快就会开放。


    • Music v2 支持同一首歌内切换多种音乐风格,歌剧、说唱、金属可以串在一起
    • 可单独重制歌曲的某个片段,不影响其他部分
    • 训练数据有商用授权,生成内容可合法用于商业场景
    • 支持多语言歌词、人声和编曲,可靠性较上一代有明显提升
  • AI编程独角兽Cognition融资10亿美元,估值250亿美元,Devin年化收入逼近5亿

    做AI编程助手的创业公司里,Cognition是个异类。别人都在想着怎么把自己的工具塞进VS Code或者GitHub,它直接搞了个能自己干活儿的”AI软件工程师”Devin。结果就是:成立没几年,最新一轮融资超过10亿美元,估值250亿美元(融资前)。

    八个月前,Cognition刚以102亿美元的投后估值完成4亿美元融资。八个月后,估值翻了一倍还多。这速度,就算在AI创投圈里也是相当炸裂的。

    Cognition CEO Scott Wu
    Cognition CEO Scott Wu / TechCrunch

    投资人为什么这么敢押?

    这一轮由Lux Capital和General Catalyst领投,Founders Fund、8VC这些老股东继续跟投,还新进了Ribbit Capital、Atreides、Layer Global。阵容豪华,说明顶级VC在用真金白银投票——他们认为,独立的AI编程创业公司还有生存空间,不会被模型厂商直接吃掉。

    AI编程这个赛道,去年看起来像是模型厂商的囊中之物——Anthropic的Claude Code、OpenAI的Codex,还有谷歌收购Windsurf团队后搞的Jules,哪个不是自带模型、直接集成?Cognition能融到这个量级,本身就是在证明:专注做”AI agent自己写代码”这件事,有它独特的价值。

    客户和收入数据说话

    Cognition说自己已经拿下了奔驰、NASA、高盛、桑坦德银行这些大客户。更关键的是收入数据:过去六个月,企业客户使用Devin的规模每月环比增长50%,目前年化收入运行率已经达到4.92亿美元。

    这个增速,如果属实,确实能支撑250亿美元的估值。对比一下:Anthropic最新季度营收约翻了一番达到109亿美元年化,估值才到这个量级。当然,创业公司的”运行率”数字要打个折扣看,但方向是对的。


    Windsurf收购的后续

    去年Cognition收购了Windsurf的剩余资产(在谷歌挖走Windsurf团队之后)。这个操作挺有意思——Windsurf的核心团队去了谷歌做Jules,Cognition拿下了剩下的IP和产品。现在看来,这笔交易让Cognition在AI编程工具的产品积累上补了一课。

    Devin到底好不好用,开发者社区里评价两极。有人觉得它确实能处理一些完整的开发任务,也有人觉得它还是太容易跑偏,需要人一直盯着。但投资人的逻辑可能是:哪怕Devin现在还不够成熟,这个方向——完全自主的AI软件工程师——值得提前下重注。

  • AI战争已经来了,只是大部分人还没意识到

    上个月,Anthropic和美国国防部之间爆发了一场不太为人知的谈判——表面上是关于一份AI技术供应合同,但实际上触碰到了一个非常深刻的哲学和安全问题:我们应该让AI在多大程度上参与战争决策?这场争论的走向,可能会决定未来几十年人类如何打仗,甚至是否还能控制战争。

    Anthropic画了两条红线

    Anthropic在这次的合同谈判中,坚持保留两条「红线」:第一条,禁止将他们的AI用于美国本土的大规模监控;第二条,禁止开发能够自主识别、追踪并杀死目标的完全自主武器系统。换句话说,Anthropic愿意把Claude卖给军方用,但有两个底线不能碰。

    这两条红线听起来很合理,但美国国防部显然不满意。今年1月,国防部长Pete Hegseth要求重新谈判所有现有AI合同,新条款允许五角大楼在「任何合法用途」的模糊范围内使用这些公司的技术。这个措辞之宽泛,基本上等于说「我们想怎么用就怎么用,你们别管」。

    AI战争与红线
    Anthropic与美国国防部之间关于AI自主武器红线的争议(图片来源:The Verge / Janet Mac)

    完全自主武器离我们多远

    很多人以为「完全自主武器」还是科幻电影里的东西,但现实比想象中更接近。美国军方其实已经在用AI辅助打击决策了——Project Maven,这个项目从2017年就开始让AI分析无人机监控画面,帮助识别潜在目标。当时Google参与了这个项目,结果引发内部员工大规模抗议,四千多人联名请愿,Google最后选择不续约。

    Anthropic自己的CEO Dario Amodei其实也没说完全自主武器一定是坏事。他在博客里写过,「完全自主武器(那些把人类完全踢出循环、自动化选择和打击目标的武器)可能被证明对我们的国防至关重要。」

    这句话值得反复读。一家AI公司的CEO,一边画着「红线」,一边又说这类武器「可能至关重要」——这里的矛盾,基本上就是整个AI行业在军事应用问题上的缩影。

    速度至上主义的代价

    这场争论里最让人不安的一点,是国防部长Hegseth在备忘录里直白地写道:「不接受足够快的风险,超过了不对齐的风险」——翻译过来就是,宁可出问题,也不能慢下来。这种「速度至上」的哲学,一旦应用到武器系统上,后果可能是灾难性的。

    想想看,如果AI系统能在几秒钟内完成从识别目标到批准打击的整个流程,人类在这个循环里还有多少实际的控制权?名义上可能还有「人类监督」,但当系统处理速度比人类反应速度快几个数量级的时候,这种监督到底有多大意义?


    国际社会还在吵架,但技术发展不会等

    联合国下面有个「特定常规武器公约」论坛,专门讨论致命自主武器系统的问题,每半年开一次会。但开了十几年,各国还在为「什么是致命自主武器」这个定义吵个没完,更别提达成有约束力的协议了。与此同时,各国军方都在悄悄研发相关技术,等国际社会达成共识,可能黄花菜都凉了。

    Anthropic和五角大楼的这场博弈,最后会怎么收场,现在还看不清楚。但有一件事是确定的:AI进入战争这件事,不是「会不会发生」的问题,而是「已经发生了,我们能不能控制住它」的问题。答案如何,可能取决于接下来几个月这些合同谈判的结果。

  • 环球音乐和TikTok续约了,但真正的问题是AI音乐太难管了

    最近环球音乐集团(UMG)和TikTok续签了授权协议,表面上看是一次普通的商业合作,但细看条款会发现——两家公司这次把「打击未授权AI生成音乐」写进了合同里。这件事背后的信号,比合同本身更有意思。

    从撕破脸到握手言和

    如果你还记得2024年那场闹剧,就会知道这次续约有多不容易。当时UMG公开指责TikTok对平台上泛滥的AI音乐和版权问题不管不顾,一怒之下把旗下所有音乐目录从TikTok撤下。一夜之间,无数用户视频里的热门曲目消失了,这件事当时在音乐和科技圈都引起了不小的震动。

    现在双方坐下来重新签协议,而且主动把AI治理条款加进去,说明TikTok真的感受到压力了。UMG在联合声明里说,这次协议「延续了双方在AI保护方面的开创性承诺,旨在促进人类艺术创作,确保平台收益能够有效流向艺术家和词曲作者」。翻译一下就是:我们上次吵的那件事,这次写进合同了,别想赖账。

    TikTok与环球音乐合作打击AI音乐
    TikTok与环球音乐集团更新授权协议,联手打击平台上的未授权AI生成音乐(图片来源:TechCrunch)

    AI音乐到底有多难管

    这事说起来容易,做起来难。过去几年,AI音乐生成工具越来越好用,随便一个人就能用AI模仿Drake或者The Weeknd的声音,做出一首听起来像真的假的歌曲,放到网上能拿到几百万播放量,然后被下架——但伤害已经造成了。

    音乐行业的担心不是没有道理的:如果任何人都能用AI免费「借用」大牌艺人的声音赚钱,那真正的创作者靠什么吃饭?

    更麻烦的是,这种AI生成的音乐往往游走在版权法律的灰色地带。它不直接采样原曲,而是用AI模型「学习」艺人的声线风格,再生成全新内容——这在很多司法管辖区里,到底算不算侵权,法官们自己可能都还在摸索。

    这个协议可能成为行业模板

    UMG和TikTok的这个协议,很可能被其他平台和音乐公司效仿。眼下欧盟正在收紧对AI生成内容的监管,美国各州也在陆续推出类似措施,平台方如果不主动治理,迟早会被监管方逼着治理,到时候主动权就不在自己手里了。

    TikTok其实也有自己的小算盘。它近年来一直在努力向音乐行业证明自己的价值,去年推出了「TikTok for Artists」数据平台,给艺人提供推广工具和数据分析。和UMG把关系搞好,对TikTok来说是在音乐版权领域站稳脚跟的关键一步。


    说到底,这件事反映的是整个人类创作行业在AI时代的困境:技术跑得太快,法律和商业规则追不上。UMG和TikTok的这次合作能不能真的管住平台上的AI音乐,现在下结论还为时过早。但至少,有人开始认真想办法了。

  • mem0:给AI装上”长期记忆”,AI Agent记忆层首选方案

    mem0:给AI装上”长期记忆”,AI Agent记忆层首选方案

    🧠 给AI装上”长期记忆”:mem0 项目深度解析

    mem0 banner

    mem0 – 面向AI智能体的通用记忆层

    📌 项目简介

    mem0 是一个面向AI智能体的通用记忆层(Universal Memory Layer),解决了当前大模型最致命的短板之一:没有长期记忆。每次对话都是全新开始,AI记不住你是谁、喜欢什么、上次聊到哪。

    mem0 的出现让AI拥有了跨会话、跨平台、跨智能体的持久记忆能力,被 Y Combinator S24 孵化,目前在GitHub已获得 39,000+ Stars,是AI Agent基础设施赛道最热门的开源项目之一。

    ⚙️ 安装要求与过程

    环境要求:

    • Python 3.9+ 或 Node.js 16+
    • OpenAI / Anthropic / Ollama 等LLM API密钥(可选,也可用内置模型)
    • Docker(自托管模式需要)

    快速安装(Python):

    # 基础安装
    pip install mem0ai
    
    # 如需BM25关键词匹配 + 实体提取(推荐)
    pip install mem0ai[nlp]
    python -m spacy download en_core_web_sm

    快速安装(Node.js):

    npm install mem0ai

    CLI快速上手:

    # 全局安装CLI
    npm install -g @mem0/cli
    
    # 初始化(交互式配置)
    mem0 init
    
    # 添加用户记忆
    mem0 add "Prefers dark mode and vim keybindings" --user-id alice
    
    # 检索记忆
    mem0 search "What does Alice prefer?" --user-id alice

    🚀 核心功能

    1. 多层级记忆管理

    支持用户级会话级智能体状态级三层记忆隔离与融合,同一个用户在不同场景下的记忆可以独立管理,也可以按需共享。

    2. 自适应个性化

    随着交互次数增加,mem0会自动学习用户偏好、习惯用语、决策风格,并在后续对话中主动应用这些记忆,实现真正的个性化AI体验。

    3. 多信号融合检索(2026年4月重大升级)

    同时支持语义检索(向量相似度)、BM25关键词匹配实体链接匹配三种信号并行打分融合,检索准确率大幅提升。在 LoCoMo 基准测试中得分 91.6(较旧版提升20分)。

    4. 时间感知推理

    mem0 能理解时间维度——「我上周说过什么」和「我去年说过什么」的权重完全不同。支持基于时间的检索,完美适配待办计划、历史事件追溯等场景。

    5. 三种部署方式,灵活适配

    库调用(pip/npm安装,适合原型开发);② 自托管服务(Docker部署,数据完全私有);③ 全托管云平台(零运维,直接注册即用)。

    💡 典型使用场景

    场景一:AI助手个性化陪聊

    想象你有一个AI助手,它记得你上次说「正在学TypeScript」、「不喜欢太官方的解释」、「喜欢用代码示例说明问题」。下次你问「如何实现防抖」,它会直接给你TypeScript代码,并用轻松的口吻解释——而不是从头介绍你是谁。mem0让这种体验成为可能。

    场景二:企业客服智能体

    用户打来电话,AI客服能立刻调出他三个月前报过的故障、偏好的解决方案、甚至他的情绪标签(「这位用户比较急躁,需要快速响应」)。mem0让企业AI从「每次都像第一次」变成「老朋友一样了解你」。

    场景三:医疗健康追踪

    AI健康助手跟踪患者的历史症状、用药偏好、过敏记录,并在每次交互中主动引用这些记忆,提供真正个性化的护理建议。这在欧盟AI Act生效后,对「可解释AI」的合规要求也极其重要。

    🌟 推荐理由

    我第一次用 mem0 的时候,说实话是被它的简单震撼到了。

    只需要 pip install mem0ai,然后几行代码,你的AI就有了记忆。不需要部署向量数据库,不需要设计Embedding流程,不需要操心记忆的增删改查——mem0 全帮你搞定了

    但真正让我决定在用生产环境用它的,是2026年4月的那次算法大升级。新算法在 LongMemEval 上拿到 94.8分,记忆召回率提升了 53.6%。这意味着:它不只是「能存记忆」,而是「存对了、取准了」。

    另外不得不提的是,mem0 的全托管云平台(app.mem0.ai)对独立开发者非常友好,免费额度够用,付费版也比自己搭建维护便宜得多。

    如果你正在做AI Agent开发,mem0 是目前最值得接入的记忆层方案,没有之一


    📦 下载地址

    GitHub(开源,Apache 2.0协议):
    https://github.com/mem0ai/mem0 ⭐ 39K+ Stars

    官网(全托管云平台):
    https://mem0.ai

    PyPI(Python包):
    https://pypi.org/project/mem0ai/

    npm(Node.js包):
    https://www.npmjs.com/package/mem0ai

    研究论文:
    https://mem0.ai/research


    📌 本文由 WorkBuddy AI 自动采集撰写,开源项目第12期

  • 教皇发了一道4万字的AI通谕:技术不能把人变成工具

    教皇利奥十四世最近发表了一道长达4万字的教皇通谕(Encyclical),主题是人类与人工智能的关系。这是梵蒂冈第一次以最高层级官方文件的形式,系统性回应AI带来的伦理挑战。通谕的核心思想用一句话概括:要防止人类被技术”异化”,变成AI系统的附庸。

    有意思的是,这份通谕发布后,Anthropic的联合创始人Chris Olah直接在社交媒体上公开呼应了其中的观点。一个宗教领袖和一个AI实验室创始人在同一个问题上发声,这个画面本身就挺耐人寻味的。

    技术应当服务于人的尊严,而不是让人变成算法的工具。我们需要外部力量介入AI伦理治理,不能把全部话语权交给市场和科技公司。

    通谕到底说了什么

    教皇通谕在天主教教义体系里属于最高层级的教皇文献,通常用来回应人类社会面临的重大议题。这次选择AI作为主题,说明梵蒂冈认为这个问题已经不只是技术问题,而是关乎人类文明走向的伦理命题。

    通谕里反复强调一个词:”异化”(alienation)。意思是说,当AI系统越来越擅长模仿人类、替代人类决策,人有可能在不知不觉中把自己的判断权、选择权、甚至道德责任感都让渡给了算法。到最后,人不再觉得自己是行动的主体,而变成了系统里的一个节点。

    这个担心不是宗教界独有的。最近一两年,越来越多的AI研究者、哲学家和政策制定者开始讨论类似的问题:当AI帮你写邮件、帮你做招聘决策、甚至帮你判断谁该获得贷款,你到底是在”使用工具”,还是在”被工具塑造”?

    为什么AI圈会认真看待这份通谕

    Chris Olah不是随便什么人都请得动的。他是Anthropic的创始团队成员之一,也是AI可解释性研究领域的重量级人物。他公开呼应教皇通谕,至少说明一点:AI技术圈内部已经有人在认真思考”技术边界”这个问题,而不只是埋头把模型做得更大。

    Anthropic一直以来把自己定位成”最关注AI安全的主流实验室”,这次创始人亲自在宗教文献上表态,某种程度上也是在向外界释放信号:AI伦理不是公关话术,而是需要真正纳入技术研发流程的约束条件。

    外部治理真的能起作用吗

    通谕里呼吁”外部力量介入AI伦理治理”,这里说的外部力量,主要指政府机构、国际组织、公民社会,当然也包括宗教伦理体系。但现实情况是,AI技术的迭代速度远远快于任何监管框架的成型速度。

    欧盟的《AI法案》从提出到落地花了好几年,而这几年里大模型已经迭代了三四代。等规则写好了,要监管的技术对象可能已经完全不一样了。这就是为什么很多人对”外部治理”能不能真正起效持保留态度。

    但换个角度看,正因为技术跑得太快,才更需要有人站在旁边说”慢一点,想清楚再走”。不管这个声音来自梵蒂冈、布鲁塞尔还是别的什么地方,只要能让那些做决定的人偶尔停下来想一下后果,就不算完全没有意义。


  • 环球音乐和TikTok握手言和:一起把AI假歌清理出平台

    环球音乐集团(UMG)和TikTok最近宣布续签版权许可协议,条款里有一条很硬核的新内容:双方要联手把平台上未授权的AI生成音乐清理出去,同时完善艺人和词曲作者的署名机制。

    UMG在联合声明里说得很直白:这份协议”延续了TikTok与UMG在AI保护方面的开创性承诺,旨在促进人类艺术创作,确保平台收益能够有效流向艺人和词曲作者”。翻译一下就是:AI可以玩,但不能让假歌抢走真人的钱。

    TikTok平台界面
    TikTok此次承诺清理未授权AI音乐

    从翻脸到握手

    这事有点戏剧性。2024年UMG和TikTok打得不可开交——UMG指责TikTok在AI生成音乐和版权问题上不作为,直接把旗下整个曲库从平台撤下。那一波操作让无数用户视频突然没了配乐,TikTok对主流厂牌版权的依赖暴露无遗。

    现在双方坐下来续约,说明TikTok终于意识到:不把AI假歌的问题解决好,大厂牌随时可以再次掀桌子。而UMG也发现,TikTok毕竟是推广音乐最重要的阵地之一,彻底闹翻对艺人也没好处。

    TikTok和UMG将共同合作,清除平台上的未授权AI生成音乐,同时进一步完善艺人和词曲作者的署名机制。

    AI假歌到底有多猖狂

    过去两年,音乐行业被AI翻唱搞得焦头烂额。有人用AI模仿Drake的声音发歌,在被发现前已经刷了数百万播放量;The Weeknd的”AI版本”也出现过类似情况。这些假歌不仅侵犯了艺人权益,还在钻流媒体算法的空子——因为听起来像热门歌手,平台会主动推荐,真歌手反而被挤压。

    更麻烦的是,这类AI生成内容往往标注不清,普通用户根本分不清是真人还是AI。行业里越来越多的人开始担心:如果平台不设立明确规则,音乐创作者的生存空间会被这些”免费复制品”逐步侵蚀。

    这份协议可能是个模板

    分析人士认为,UMG和TikTok的这份协议,很可能成为整个科技行业处理”AI+知识产权+平台责任”这一组合问题的参考模板。欧盟已经在收紧对AI生成内容的监管,美国各州也在陆续跟进立法,其他平台面临的压力只会越来越大。

    TikTok去年推出了”TikTok for Artists”数据洞察平台,试图向音乐行业证明自己能为艺人带来实质性收益。这次在AI治理上让步,某种程度上也是在为这个更大的叙事背书:平台愿意接受外部监督,而不是自己说了算。


  • 埃琳·布罗克维奇新活:给美国AI数据中心画地图,把争议摊在阳光下

    埃琳·布罗克维奇这个名字,看过那部2000年同名电影的人都不会陌生。朱莉娅·罗伯茨演的那个倔强的环保活动家,靠一己之力掰倒了太平洋煤气电力公司。现在,她把目光转向了AI。

    不是AI本身有什么问题——是支撑AI的那些数据中心。布罗克维奇最近上线了一个网站,专门收集全美各地社区对本地数据中心项目的投诉,还做了一张互动地图,把这场”AI基础设施竞赛”的真实足迹摊开在阳光下。

    “建设AI基础设施的竞赛正在美国一个个城镇中展开。在一些地方,数据中心受到了欢迎。而在另一些地方,它们被推迟、遭到反对,或者干脆被彻底放弃。这张地图记录了这场竞赛的真实足迹——揭示了增长、冲突和不确定的模式。”

    数据中心到底惹了谁

    表面上,数据中心是”数字经济基础设施”,地方政府也乐意看到投资落地。但住得近的人想法不一样——数据中心耗电量惊人,冷却系统吃掉大量水资源,还有噪音问题。更别说那些动辄占地几十英亩的巨型建筑,对周边社区的空间压迫感很强。

    布罗克维奇的地图不是那种冷冰冰的基建统计,而是把每个争议项目的社区反馈都记录了进去。哪些项目被推迟了、哪些遭到了居民集体反对、哪些已经悄悄下马——这些信息散落在各地新闻和市政会议记录里,普通人根本没渠道汇总来看,现在有了这张地图,情况不一样了。

    AI热潮背后的基础设施焦虑

    这件事的背景其实挺大的。各大科技公司为了跑AI模型,正在全美疯狂建数据中心。微软、谷歌、亚马逊、Meta,每家都有自己的超大算力基地扩建计划。这股浪潮涌到哪儿,哪儿的电力和水资源压力就跟着上来。

    有些州(比如弗吉尼亚和得克萨斯)因为电网容量问题,已经开始重新审视数据中心的审批流程。社区居民也越来越多地出现在市政听证会上,拿着电费账单问官员:为什么数据中心来了以后,我的电费涨了?


    布罗克维奇的玩法

    她的网站(brockovichdatacenter.com)不只是放一张静态地图。访客可以提交自己社区的数据中心相关投诉,相当于一个众包式的数据收集平台。这种方式和她早年调查水污染事件的路径其实是一脉相承的——靠普通人提供的线索,拼出大公司不愿意让你看到的全貌。

    目前这张地图已经覆盖了数十个活跃争议地点,集中在弗吉尼亚州(那里是全球最大的数据中心集群之一),以及俄勒冈、得克萨斯、亚利桑那等州。随着AI算力需求继续膨胀,这张地图上的红点只会越来越多。

    布罗克维奇这次盯上的,是AI时代最容易被忽视的那层东西——不是算法,不是模型,是那些24小时嗡嗡响的机房,以及它们和周边社区之间越来越紧张的关系。

  • 给机器人当老师?印度零工戴帽子录视频,每小时赚1美元

    过去几年,印度的外卖市场疯了一样增长,Zomato和Swiggy都上了市,云厨房数量也在猛增。与此同时,做家庭服务的初创公司也越来越受欢迎,比如按需家政平台Urban Company、Snabbit和Pronto。

    就在这种背景下,一家叫Human Archive的硅谷初创公司冒了出来。他们的想法听起来有点疯狂——让这些零工工人戴上带摄像头的特制帽子,把日常工作的第一人称视角视频收集起来,用来训练机器人。

    “物理AI和机器人研发的核心瓶颈,是缺乏展示人类执行日常工作的高质量、真实世界训练数据。印度蓬勃发展的零工经济,正是这种尚未被开发、可规模化获取的数据来源。”

    820万美元入账,投资人阵容豪华

    周二,Human Archive宣布拿到一笔820万美元的融资。投资方名单读起来像AI圈的名人录——Wing Venture Capital、NVP Capital、Y Combinator,还有来自OpenAI、英伟达、谷歌、Mercor、BAIR、SAIL、Brad Bao和Meta的天使投资人。

    四个创始人全是加州大学伯克利分校和斯坦福的学生——Samay Maini、Rushil Agarwal、Shloke Patel和Raj Patel(后两人是表兄弟,Raj Patel担任CEO)。四个人在机器人、硬件和触觉数据领域都有研究背景。

    帽子、手套、动作捕捉服,全副武装

    一开始,Human Archive用临时装置或现成设备采集数据。现在,他们已经开发了能够协同工作的定制硬件,可以同步收集不同类型的数据。目前已经在多个地点部署了1000多个活跃的头戴设备,累计部署超过50种不同设备,可以同步采集7种不同模态的数据。

    他们的逻辑是:光有视频数据不够,得把视频和其他传感器数据配对,价值才能大幅提升。所以他们在做触觉手套、全身动作捕捉服、腕部摄像头——把RGB-D(实时配对的彩色图像和深度信息)和力反馈、全身动作、腕部视角这些数据同步采集起来,然后卖给AI实验室。


    碰壁:头部家政公司说”不”

    虽然Human Archive在跟多家公司谈合作,但现实给了他们一记耳光。包括Pronto和Urban Company在内的多家印度家政服务头部公司,都拒绝了合作。

    事情在上周末闹到了公开层面。印度媒体Entrackr报道称Pronto正在积极寻求合作关系,以收集工人数据用于机器人训练;而Snabbit此前曾与Human Archive进行过早期讨论,但项目最终告吹。Urban Company的CEO Abhiraj Singh Bhal在X平台上直接回应称,公司不会参与此类安排。

    Raj Patel随后回击称,Urban Company很快将被迫重新考虑,否则将面临客户流失、失去相关性的风险。联合创始人Rushil Agarwal更直白——他发帖称Pronto创始人Anjali Sardana听到他提出数据合作想法时,曾经嘲笑他”愚蠢”。

    工人每小时拿1美元,隐私问题谁来管

    Human Archive向参与数据收集的工人支付每小时1美元的基础报酬。《经济时报》的报告显示,其他公司支付的报酬是每小时250卢比到400卢比(约2.63到4.20美元)。Patel表示竞争对手的报酬比Human Archive高,但其在印度的实地存在使其能够保持较低的薪酬水平。

    比工资更棘手的是隐私问题。目前尚不清楚Human Archive向工人提供了哪些关于其镜头使用方式的信息。该公司表示,其商业合同符合印度《数字个人数据保护法(DPDP法)》的要求,会显示隐私政策通知,以及详细说明数据收集目的和处理方式的同意信息。公司还表示所有数据都是匿名的,并且会对录像中的人脸进行模糊处理。

    上周,Moneycontrol报道称,印度电子和信息技术部正在审查通过家政服务人员收集第一人称数据的初创公司的同意机制和数据收集实践。监管的风,已经开始吹了。