标签: AI

  • Erin Brockovich当年告倒了电力公司,现在她盯上了数据中心的黑箱操作

    Erin Brockovich 这个名字美国人都不陌生——朱莉娅·罗伯茨在电影里演的就是她。当年她把太平洋煤气电力公司(PG&E)告到赔了3.33亿美元,这次她把目光转向了另一个正在疯狂扩张的行业:数据中心。

    田纳西州孟菲斯xAI数据中心的燃气轮机
    2025年4月,田纳西州孟菲斯河港的xAI数据中心,燃气轮机清晰可见。这类设施的环评信息往往不透明。| 图片来源:Washington Post / Getty Images

    她新上线的网站做了一个全美数据中心分布地图,数据来源很接地气——全是周边居民主动爆料的。今年4月她公开征集线索,第一个月就收到了近4000份提交。

    “反馈里最普遍的问题——比噪音、比用水量、比电费上涨更常见的,是每一个提交里都反复出现同一个词:透明度。”她在Substack上写道。

    保密协议、事后公布,居民被蒙在鼓里

    Brockovich 在文章里说得很直白:她不是反对数据中心,也不是反对AI。她反对的是一种模式——项目许可都批下来了才对外公布,开发商不搭理居民的问询,而当地官员在周边居民还不知道有这么个事儿的时候,就已经签署了保密协议(NDA)。

    这种现象在全美都在发生。数据中心为了赶工期,往往和地方政府签了保密协议,等周边社区知道的时候,环评、用地、用电审批都走完了。用水和用电的压力最后由当地居民买单,但决策过程他们全程被排除在外。

    环保活动家盯上AI基础设施,监管压力只会越来越大

    这件事值得关注的地方在于:Brockovich 不是普通的自媒体博主,她有真实的动员能力和媒体影响力。她把这个议题带到公众视野里,意味着数据中心的环保合规和运营透明度,会从行业内部讨论变成更广泛的公共政策议题。

    对AI公司来说,算力扩张的阻力正在从”芯片够不够”转向”地方社区让不让建”。Meta、Google、Microsoft、Amazon 这几年都在数据中心扩建上遇到过地方阻力,Brockovich 这个动作相当于是把各地分散的反对声音整合到了一起。


    • Erin Brockovich 曾因起诉太平洋煤气电力公司被改编为电影,由朱莉娅·罗伯茨主演
    • 新网站收录全美数据中心分布,数据来自周边居民主动爆料
    • 征集令发布第一个月收到近4000份提交,透明度是最普遍的投诉点
    • 核心指控:项目获批后才公布、NDA封锁信息、居民被排除在决策之外
  • AI骗子用假黑人卖9美元的Shein皮带扣:TikTok上的数字黑脸狂欢

    AI骗子用假黑人卖9美元的Shein皮带扣:TikTok上的数字黑脸狂欢

    阿里娅(Aliyah)在TikTok上哭着求大家救她的皮带扣生意——”哪怕作为黑人女性,我也相信白人女性会停留13秒来看我的视频。”这条视频获得了81.4万点赞、650万次播放。问题是:阿里娅根本不存在。

    她是AI生成的虚拟形象,目的是给一件代发的Shein廉价商品导流。同款皮带扣在Shein上卖9美元,而在”阿里娅的店铺”里,标价是40美元。

    AI生成的哭泣虚拟形象
    TikTok上用AI生成的”哭泣卖家”形象,用来诱导共情购买。来源:The Verge

    骗局是怎么运作的

    这类视频的套路高度模板化:一个”边缘群体小商户”在镜头前哭泣或展示手工过程,背景是简陋的工作台,配上文案说自己的生意快撑不下去了。评论区里一堆人表示”我来支持你”,然后点进主页链接下单。

    但实际上:商品是从Shein或AliExpress一件代发的大路货,售价翻了三四倍。整个视频——包括”手艺人”本人——全是AI生成的。声音机械、表情和语音不匹配、擦眼泪时泪痕会凭空消失,仔细看破绽不少。但问题是,TikTok用户刷视频的平均停留时间就几秒,大多数人根本不会仔细看。

    “这是’共情诱饵’,”AI生成媒体研究员杰里米·卡拉斯科(Jeremy Carrasco)说,”他们会找到能触动某个群体的叙事,然后用AI角色来带货。”

    数字黑脸:更深的伦理问题

    宾夕法尼亚大学传播学研究员茜恩娜·戴维斯(Cienna Davis)把这种现象称为”数字黑脸”——非黑人个体利用数字技术模仿黑人表达,以获取经济或政治利益。这个概念源自19世纪美国贬低黑人的”黑脸表演”(minstrelsy)传统。

    这类视频大量使用黑人女性作为AI生成主角,不是巧合。研究显示,美国用户在TikTok上更容易对”黑人小商户”的叙事产生共情,从而下单。骗子就是在利用这种种族化的共情机制来赚钱。

    费斯克大学哲学助理教授坦佩斯特·M·亨宁(Tempest M. Henning)进一步指出,即便操作者是黑人,”用漫画化的方式扮演黑人”依然属于黑脸表演的范畴。而现在的AI版本,是把”黑人性”彻底变成了可随意调用的模板。


    平台为什么不制止

    卡拉斯科估计,他的团队每天能发现多达100个此类AI生成带货账号。YouTube和各类论坛上甚至有人专门教人怎么用ChatGPT提取爆款视频脚本、用Kling 2.0或Seendance生成AI视频、然后替换成自己的商品链接——整个过程不需要实物样品、不需要真人出镜、不需要写脚本。

    平台为什么不行动?原因很直接:这类内容能留住用户停留时长,而停留时长就是广告收入。给AI生成内容打标签会减少推荐量,平台没有动力主动做这件事。目前只有部分平台要求标注”AI生成”,但执行力度非常有限。

    更讽刺的是,连名人都中过招。《波托马克富家太太》的主演吉泽尔·布莱恩特(Gizelle Bryant)曾在播客里承认,自己因为看到一个”AI生成的黑人小男孩被霸凌”的视频,买了两个钩针编织包。她还说”维奥拉·戴维斯也在评论区呢,我怎么会被骗?”

    • AI生成内容的数量正在指数级增长,人工审核根本跟不上
    • 平台缺乏强制性的AI内容标注机制,标签全靠创作者自觉
    • 用户媒介素养跟不上AI生成技术的迭代速度
    • 最核心的:这个骗局对平台来说是有利可图的
  • 艾琳·布罗克维奇盯上了数据中心:AI基建热潮背后的不透明困局

    艾琳·布罗克维奇盯上了数据中心:AI基建热潮背后的不透明困局

    艾琳·布罗克维奇(Erin Brockovich)这个名字,大多数人是通过朱莉娅·罗伯茨主演的同名电影认识的——当年她硬刚太平洋煤气电力公司(PG&E)污染水源的案子,成了美国环保史上的标志性事件。而现在,这位环保活动家把目光投向了一个正在全美疯狂扩张的领域:数据中心。

    她最近上线了一个地图网站,专门标注全美各地正在建设或已建成的数据中心位置。这个地图被描述为”进行中的工作”,里面的数据点主要来自周边社区居民的主动上报。更夸张的是,布罗克维奇在五月初公开征集数据中心相关问题的线索,结果第一个月就收到了接近4000份提交。

    “提交内容里出现频率最高的担忧——比噪音、比用水量、比电费上涨都要高的——其实就一个词:透明度。”布罗克维奇在 Substack 上这样写道。

    先斩后奏的建设项目

    布罗克维奇说得很清楚:她不是在笼统地反对数据中心,也不是反对AI。她反对的是她地图上记录下来的那种模式——项目在许可已经拿到之后才对外公布,开发商不接当地居民的电话,而地方官员在邻居们还完全不知道有这回事的时候,就已经签了保密协议(NDA)。

    这套玩法在国内可能也不陌生。一个动辄消耗相当于几万个家庭的用电量和用水量的项目,决策过程却对受影响的社区完全不透明,等到大家知道的时候,许可已经批了,反对的窗口期基本过去了。

    田纳西州孟菲斯xAI数据中心内的燃气轮机
    燃气轮机——xAI数据中心,田纳西州孟菲斯,2025年4月。来源:Brandon Dill / The Washington Post / Getty Images

    AI热潮下的基础设施焦虑

    这件事的背景其实是:全美(乃至全球)正在经历一轮前所未有的数据中心建设热潮。AI大模型的训练和推理需要海量算力,算力背后就是服务器、冷却系统和——最要命的——电力。微软、谷歌、亚马逊、Meta,还有刚入局的SoftBank,都在疯狂找地方建数据中心。

    但问题是,这些项目对当地社区的影响是实实在在的:用电用水规模巨大,有的项目甚至要配套新建天然气发电厂;冷却系统的噪音污染让周边居民苦不堪言;而数据中心的税收贡献是否足以弥补这些外部成本,各地争议很大。

    更核心的矛盾在于:这些项目往往打着”经济发展”和”AI未来”的旗号,走快速审批通道,而当地居民的知情权和参与权在这个过程中被系统性地弱化了。布罗克维奇的地图项目,本质上是试图用信息公开来对抗这种不透明的决策模式。


    • 布罗克维奇数据中心地图:brockovichdatacenter.com
    • 她同时在 Substack 持续更新相关调查进展
    • 热点地区:弗吉尼亚州”数据中心走廊”、得克萨斯州、爱荷华州等
  • GitHub Copilot开始按token收费了,开发者炸了

    GitHub Copilot的”黄金时代”——至少是对于个人开发者和小型团队来说——眼看就要结束了。从2026年6月1日起,微软要把Copilot的计费方式从固定订阅制改成按token使用量收费。这意味着,有些人每个月的账单可能会从29美元直接飙到750美元甚至更高。

    消息一出,Reddit和X上到处是哀嚎。有用户算了一笔账:他现在每个月付大约29美元,按新的计费模式一算,月费直接飙到接近750美元。他的原话是:”这就是个笑话。这个新使用模式贵得离谱,我要取消订阅了。这个价格完全不划算,也没有任何实用价值。”

    “What a joke. 新定价模型太可笑了。我现在的费用大约是29美元/月,新费率会让我的成本飙到接近750美元/月。在任何实际意义上,它都不再具备成本效益或实用性。”

    —— Reddit用户评论

    有人涨单,有人叫好

    当然,也不是一边倒的骂声。有不少资深开发者跳出来说:如果你知道自己在干什么,正常使用根本不会消耗那么多token。那些账单爆炸的人,大多是没什么实际开发经验、靠”氛围编码(vibe coding)”一路莽过来的。

    一位用户在Reddit上写道:”我们这些人整天工作也几乎不会产生超额费用,费用暴涨的唯一原因是你纯粹靠’氛围编码’,做了大量冗余的迭代。”按这个逻辑,Copilot的新计费模式其实是在惩罚”滥用”——那些把Copilot当成万能答案生成器、不管三七二十一就让它大规模重构代码的人。

    GitHub Copilot新计费模式
    GitHub Copilot界面(图源:TechCrunch)

    还有人把矛头指向了微软的旧模式:”Copilot之前到底亏了多少钱?”——言下之意,之前的固定订阅制根本不可持续,现在只是把真实成本还给用户而已。

    微软”背刺”了吗?

    比较微妙的指控是:微软过去一直在鼓励用户无差别地使用Copilot,各种功能更新都在降低token消耗门槛,让单次高级请求就能跑数个小时、生成几十甚至上百个子代理。现在突然改规则,等于是把账单甩给了用户。

    有用户写了一段挺有代表性的评论:”按照微软设计和鼓励的方式使用系统的用户没有错,唯一的责任方是微软。是微软提供了这种计费方式,还不断降低大规模消耗token的门槛。”

    这其实牵出了一个更大的问题:AI编程助手的商业模式到底是什么?按订阅收取固定费用,对于重度用户来说提供商注定亏钱;按token收费,又会把大批中小开发者和轻量用户吓跑。目前看来,微软的选择是先保大客户——大型企业大概率还能拿到定制合同,而个人开发者和小团队就只能自己想办法了。


    截至发稿,微软还没有对媒体的询问做出回应。6月1日的新计费规则正式生效后,开发者社区的反应会更有看头。如果你现在还在用Copilot,建议提前去算一下自己的预估使用量——别等到账单来了才吓一跳。

  • AI精神病:当科技CEO们沉迷于自己造的梦

    Box创始人Aaron Levie本周在社交媒体上发了一条挺有意思的帖子,说科技公司的CEO们”特别容易患上AI精神病(AI psychosis)”。这话一出,科技圈炸了锅。

    我和同事们在TechCrunch的Equity播客里专门聊了这事儿。Levie并不是在否定AI工具,他的核心意思是:CEO们需要真正这些工具,才能理解它们到底值不值。

    “如果你根本没有接触过最终的实际工作,你怎么会知道这些工具的价值呢?你不能只看一张幻灯片就说’对,效率太惊人了,就这么干’。”

    —— Aaron Levie,Box CEO

    反AI情绪正在蔓延

    你可能也注意到了,现在有两种完全相反的声音同时存在:一边是”AI太棒了,所有人都在用”;另一边是”AI毁了一切,所有人都讨厌它”。

    最近有一些挺有意思的信号:

    • 大学毕业生在毕业典礼上听到AI相关内容就发出嘘声
    • 科技行业裁员潮带来的负面情绪持续发酵
    • 谷歌宣布给搜索增加更多AI功能后,DuckDuckGo的下载量直接涨了30%

    DuckDuckGo的CEO说他们的安装量增长了30%——当然,DuckDuckGo的体量比谷歌小得多,我不认为谷歌会立刻遇到麻烦,但这至少说明:有相当多的用户并不买账现在AI渗透一切的方向。

    谷歌的两难困境

    我的同事Kirsten提出了一个挺尖锐的观察:它正在追逐自己认为必须做的事来保持竞争力,但它正在破坏用户和品牌关联度最高的核心体验,而且也没有改善这个体验。

    AI精神病争议
    AI工具正在重塑人们对技术的信任边界(图源:TechCrunch)

    她在想,这个反AI的节点,是不是初创公司或者其他商业领域的机会?已经有早期迹象表明,人们正在用行动投票,直接转去用其他服务。

    更有意思的是,连DuckDuckGo自己也在一年前还在尝试往搜索里加AI功能,因为觉得”必须这么做”。而现在他们发现,其实有一条路可以走:”不,我们完全不感兴趣这些AI功能。哪怕我们要做,也会把它放在单独的沙箱里,完全不会影响你的核心搜索体验。”

    CEO们的”AI精神病”到底是什么

    Levie说的”AI精神病”,指的是很多CEO对AI有一种不切实际的幻想——他们和生成式AI真正能创造价值的”最后一步工作”足够脱节,所以容易被PPT上的演示迷惑。

    这不是说AI没有用。恰恰相反,问题是:谁在用?怎么用?那些真正在一线写代码、做设计、写文档的人,和那些只在董事会上谈AI战略的CEO,对AI价值的感知是完全不同的。

    现在很多公司的AI采用,是一种自上而下的推动。高管们相信”AI会带来生产力提升”,风投们也喜欢”你只需要一个非常小的团队,就能和规模大得多的公司一样高效”的梦想。但这个梦想和现实之间的鸿沟,可能比很多人愿意承认的要大得多。


    不管你是不是赞同Levie的观点,有一件事是确定的:AI现在极具争议性,而且这种争议不会很快消失。对于做产品的公司来说,如何在”跟上AI潮流”和”不惹毛用户”之间找平衡,会是一个越来越 tricky 的问题。

  • AI公司想免费帮你打扫卫生,条件是拍下你家的全过程

    一家叫Shift的AI创业公司最近在纽约搞活动:免费帮你打扫家,但条件是——他们要拍下整个清洁过程。

    这听起来像是那种”条件优厚到让人起疑”的买卖,实际上背后有个非常具体的目的:收集人类做家务的视频数据,用来训练未来的家用机器人。

    训练机器人比训练ChatGPT难多了

    文字和图像可以从互联网上大规模抓取,但物理世界的动作数据没那么好弄。教一个机器人叠毛巾、捡苹果、倒水,这些对人类来说轻而易举的事情,对机器人来说极其难编码。

    机器人要理解的不是文字,而是空间、力度、摩擦力、物体形状、光线变化——这些东西人类本能就会,但要把它们变成机器能读懂的数据,成本高得吓人。

    不止一家公司在这么做

    印度有个家政平台叫Pronto,也被曝出在客户授权后采集烹饪、清洁、洗衣等场景的视频,用来训练AI。这件事在印度市场引发了不少争议,竞争对手赶紧出来表态说自己绝对没在客户家里装摄像头。

    还有更”刻意”的做法:一些公司在专门搭建的场地里,让工人一遍又一遍地重复同样的动作,摄像头全方位记录。这种”数据农场”产出的素材质量高、场景可控,缺点是很贵。


    数据瓶颈倒逼出各种创意

    高质量的物理世界数据是开发物理AI的最大瓶颈。文本、图片、视频可以从网上爬,但要让机器人学会在真实人家环境中干活,就得有真实家庭环境的数据。

    所以出现了各种”用服务换数据”的模式:Shift免费清洁换视频、Human Archive给零工发相机帽采集第一视角数据、一些公司直接把产品先卖出去,再从用户使用中收集数据迭代算法。

    隐私问题迟早要爆发

    用免费服务换数据这件事本身并不新鲜——会员卡、cookies、行车记录仪、保险APP都在做。但家务场景涉及的是你家里面最私密的空间,摄像头拍到的不只是”清洁动作”,还有你的生活方式、家庭布局、个人隐私。

    目前这类公司的做法是让用户”选择加入”,但问题是:有多少人真的仔细读了那份授权协议?等家用机器人真正上市的时候,这些数据是怎么被使用、会不会被转卖,都会成为大问题。

  • OpenAI把Codex搬上Windows了,AI智能体直接帮你操作电脑

    OpenAI的Codex之前已经在Mac上能用”计算机控制”功能了,现在Windows用户也等到了。简单说,就是让AI直接”看”你的屏幕,然后在你的设备上帮你干活。

    这个功能的名字叫”computer use”,技术上跟Anthropic的Claude电脑控制是同一类东西——让AI理解屏幕内容,然后模拟人类操作:点按钮、输文字、开软件,整套流程自动化。

    不在电脑旁边也能管

    有个细节挺实用:你不在电脑跟前的时候,也可以通过ChatGPT手机应用查看Codex正在执行的任务,顺便管一管进度。对需要跑长任务的场景来说,不用守在电脑前了。

    Codex的”computer use”本质上是在模仿人类使用电脑的方式。它看屏幕、找按钮、点鼠标、敲键盘——只不过速度比人快得多,也不会累。

    OpenAI在抢智能体入口

    把Codex做成一个能操作你整个系统的智能体,这个方向不止OpenAI在走。Anthropic的Claude已经可以先用到电脑控制能力,微软也在把Copilot往这个方向推。大家的判断是一样的:未来的AI不只是回答问题,而是要能替你把事情做完。

    Windows这块市场OpenAI肯定不想让给别人。Mac版先上,现在补上Windows,基本覆盖大部分开发者群体了。


    安全和权限怎么算

    AI能操作你的电脑,这件事的便利性和风险是并存的。目前Codex需要用户主动授权才会开启这个功能,但往后这类能力的权限边界会是个持续的议题——毕竟,让AI”看见”屏幕内容,意味着它能接触到的信息范围相当大。

  • Meta 悄悄做了一款 AI 吊坠,想让 Reality Labs 不再每个季度亏 40 亿美元

    Meta 正在开发一款 AI 吊坠设备,计划明年开始测试。这个消息来自 The Information 看到的一份内部备忘录。简单来说,这就是一个可以别在衬衫上、或者当项链戴的小装置,核心功能是记录你的对话,然后由 AI 进行处理和回应。

    Meta AI 概念图
    Meta 的 AI 硬件野心不止于眼镜(图源:TechCrunch)

    这个设备的技术底子来自 Meta 在 2025 年底收购的 AI 可穿戴初创公司 Limitless。那家公司之前就在做几乎一样的东西——一个挂在脖子上的 AI 吊坠,持续录音,然后帮你整理记忆、提取待办、总结对话。Meta 当时说这笔收购是为了”加速 AI 可穿戴设备的开发”,现在看来,吊坠形态确实是他们想推的方向之一。

    AI 吊坠这个品类之前已经有很多公司试过,基本都没掀起什么水花。隐私顾虑、营销不走心,或者产品本身就没那么有用——原因可能是其中任何一个。

    Meta 的真实算盘

    这份备忘录还透露了两个配套动作:Meta 计划扩展 AI 眼镜产品线,同时推出一个名为 Wearables for Work 的企业订阅服务。把这几件事放在一起看,Meta 的意图相当明确——用硬件矩阵把 Reality Labs 从每个季度亏 40 亿美元的泥潭里拉出来。

    2026 年第一季度,Reality Labs 亏了 40 亿美元。这个数字已经不是新闻,而是某种常态。Meta 在 VR/AR 硬件上砸了超过 10 年,到现在还没看到真正的规模化盈利。AI 吊坠能不能改变这个局面?说实话,机会不大,但 Meta 也没有更好的选择了。


    AI 可穿戴这个赛道到底行不行

    吊坠形态有个天然优势:比眼镜门槛低。眼镜需要度数适配、外形接受度、社交压力,吊坠只要别在衣服上就行。但劣势也很明显——存在感太弱反而可能是个问题,用户凭什么要一直戴着它?

    OpenAI 也没放弃这个方向,说明大厂们普遍觉得”贴身 AI”是个值得押注的交互入口。只不过从产品史来看,记录一切对话这个卖点最容易卡在隐私上——你愿意让一个随时在录音的设备贴身戴着吗?这个问题 Limitless 没答对,Meta 也不一定行。

    • 设备形态:AI 吊坠,可别在衬衫或当项链佩戴
    • 技术来源:基于 2025 年收购的 Limitless 团队
    • 测试时间:最早 2027 年开始内部测试
    • 配套计划:扩展 AI 眼镜产品线 + Wearables for Work 企业订阅
    • 战略目标:扭转 Reality Labs 每季度 40 亿美元亏损
  • SoftBank 砸 750 亿欧元在法国建数据中心,AI 基础设施军备竞赛打到欧洲

    孙正义又出大手笔了。SoftBank 刚刚宣布,计划砸最多 750 亿欧元(约 870 亿美元)扩建法国数据中心容量。这不是普通的数据中心投资——目标是开发运营最高 5GW 的额外数据中心容量,这个数字已经接近许多国家全国的发电装机量。

    第一阶段已经在路上:SoftBank 要在法国的 Dunkirk(洛恩-普拉日)、Bosquel 和 Bouchain 三地开建,到 2031 年向法国上法兰西大区交付 3.1GW 的容量。这是 SoftBank 迄今为止在欧洲最大的一笔 AI 基础设施押注。

    SoftBank 既是 OpenAI 的投资者,也是其客户。这家公司在 AI 基础设施上的每一步布局,都跟 OpenAI 的扩张节奏深度绑定。

    法国为什么愿意接这个盘

    法国经济部长 Roland Lescure 在声明里说得很直白:这证明了马克龙想把法国打造成 AI 全产业链重要目的地的雄心。从算力到应用层,法国想在这一波 AI 浪潮里分一杯羹,而数据中心是最底层的入场券。

    但这块饼没那么好啃。在美国,数据中心建设已经引发越来越强的反对声浪——环保团体担心能耗和用水,电网运营商警告变电站扩容跟不上,居民则抱怨电费上涨。SoftBank 此前宣布在俄亥俄州建数据中心,配套一座 9.2GW 天然气电厂,这种”算力+能源”打包模式在欧洲能不能跑通,还是个很大的问号。


    750 亿欧元到底花在哪

    这个数字听起来吓人,但拆开看其实有迹可循。5GW 的数据中心容量,按当前 AI 训练集群的功耗水平,大约能支撑几十个超大规模 GPU 集群同时运转。法国电价在欧洲相对便宜,核电比例高,对算力密集型企业有一定吸引力。

    问题是,AI 基础设施的投资回报周期极长,而技术迭代极快。今天花 750 亿欧元建的机房,五年后会不会因为芯片架构升级而大面积闲置?SoftBank 这次赌的,是 AI 算力需求会在未来十年持续指数级增长——这个假设一旦失效,这笔钱就打了水漂。

    • 目标容量:最高 5GW,第一阶段 3.1GW(2031 年交付)
    • 投资规模:最高 750 亿欧元(约 870 亿美元)
    • 地点:法国上法兰西大区(敦刻尔克等地)
    • 定位:SoftBank 在欧洲最大 AI 基础设施投资
  • 你家打扫卫生的画面,正在被AI公司花钱买走

    本周有一家叫Shift的AI训练初创公司宣布,要免费帮纽约人打扫房子,后续还打算把这项服务推广到伦敦等其他城市。我看着自己乱糟糟的公寓,完全能理解这个服务的吸引力。

    但天下没有免费的午餐,总有条件。

    AI机器人训练数据收集
    AI公司正在想方设法收集真实世界的物理数据丨The Verge

    你家的清洁过程,就是机器人的”教科书”

    作为免费打扫的交换,Shift要求获得清洁人员工作时的全部录像:刷碗、擦台面、擦桌子、拖地——所有我们愿意外包的琐碎家务都要拍下来。而这些录像,正是机器人公司竞相训练机器完成家务、最终向消费者售卖家用机器人的核心数据。

    这比听起来要难得多。和近年来爆发式增长的聊天机器人、图像生成器这些纯数字AI工具不同,机器人需要跟物理世界打交道:要理解空间、运动、力量、摩擦力,还要应对奇怪的形状和材质、尴尬的灯光条件,以及人类本能就能掌握的其他所有物理常识。这就是为什么叠衣服、拿苹果、倒水这些对人类来说很简单的事,对机器人专家来说却一直难以实现。

    “不像聊天机器人、图像生成器和其他近年来爆发式增长的AI工具,机器人必须和物理世界打交道。这意味着要理解空间、运动、力、摩擦力、奇怪的形状和材质、糟糕的照明,以及人类本能就能掌握的所有其他东西。”

    不止Shift一家在这么做

    在印度,近期有报道披露,家政服务平台Pronto一直把客户的家作为AI训练素材的来源,拍摄做饭、打扫、洗衣服等家务场景。Pronto表示只有在客户明确同意的情况下才会拍摄,目前还不清楚客户能获得什么回报(除了拍摄的素材副本之外)。但这一做法还是在市场上引发了强烈反对,竞争对手的初创公司纷纷表态,称自己从未在客户家中拍摄用于训练AI的素材,也没有相关计划。

    其他公司则专注于扩大数据收集的规模。比如硅谷的Human Archive公司,希望和Pronto这类企业合作,让零工工作者戴上并不时尚的摄像头帽子记录自己的活动。这种帽子可以从佩戴者的视角收集素材,正是机器人公司需要的”自我中心”视角数据,用来训练机器理解人类如何在物理空间中活动。

    而Shift也直接面向消费者,声称已经向15个国家的数万人支付报酬,让他们通过自己的应用记录日常活动。


    “数据农场”正在兴起

    还有一些公司完全跳过”有用的工作”,直接付费让工人反复完成相同的物理任务,同时用摄像头和传感器捕捉每一个动作。这类”staged data farms”(模拟数据农场)专门把叠毛巾、拿杯子、搬箱子等重复体力劳动转化为有价值的AI训练素材——其价值高到足以支撑公司付费生产这些内容。

    还有一部分数据来自已经在现实世界部署的机器人。尽管宣传得天花乱坠,但真正的全自动化还遥遥无期(这也是需要大量数据的原因),企业还是急于把产品推向市场。他们会用客户家中的使用数据来优化产品,很多公司还会在机器人卡住的时候安排远程工作人员介入,这些介入过程的数据也会被用于训练。

    用数据换免费服务,这个交易并不新鲜

    当然,用有价值的东西交换数据的做法早就不是新鲜事了。多年来企业一直用折扣、便利、免费服务换取用户数据,从会员积分卡、浏览器Cookie,到行车记录仪、监测驾驶行为的保险APP,还有永远在播广告的智能电视,都是如此。

    现在的新变化是企业愿意付费收集的数据类型。目前来看,这意味着你可能会让一个戴着摄像帽的人免费帮你打扫家里,最终目的是让企业未来能卖给你一个机器人,代替人类做这些家务。

    • Shift:免费清洁换录像,已覆盖15个国家
    • Pronto(印度):家政服务中拍摄家务场景,引发争议
    • Human Archive:给零工戴摄像帽,收集第一人称视角数据
    • 模拟数据农场:付费让工人重复完成叠毛巾、搬箱子等动作