博客

  • OpenAI把Codex搬上Windows了,AI智能体直接帮你操作电脑

    OpenAI的Codex之前已经在Mac上能用”计算机控制”功能了,现在Windows用户也等到了。简单说,就是让AI直接”看”你的屏幕,然后在你的设备上帮你干活。

    这个功能的名字叫”computer use”,技术上跟Anthropic的Claude电脑控制是同一类东西——让AI理解屏幕内容,然后模拟人类操作:点按钮、输文字、开软件,整套流程自动化。

    不在电脑旁边也能管

    有个细节挺实用:你不在电脑跟前的时候,也可以通过ChatGPT手机应用查看Codex正在执行的任务,顺便管一管进度。对需要跑长任务的场景来说,不用守在电脑前了。

    Codex的”computer use”本质上是在模仿人类使用电脑的方式。它看屏幕、找按钮、点鼠标、敲键盘——只不过速度比人快得多,也不会累。

    OpenAI在抢智能体入口

    把Codex做成一个能操作你整个系统的智能体,这个方向不止OpenAI在走。Anthropic的Claude已经可以先用到电脑控制能力,微软也在把Copilot往这个方向推。大家的判断是一样的:未来的AI不只是回答问题,而是要能替你把事情做完。

    Windows这块市场OpenAI肯定不想让给别人。Mac版先上,现在补上Windows,基本覆盖大部分开发者群体了。


    安全和权限怎么算

    AI能操作你的电脑,这件事的便利性和风险是并存的。目前Codex需要用户主动授权才会开启这个功能,但往后这类能力的权限边界会是个持续的议题——毕竟,让AI”看见”屏幕内容,意味着它能接触到的信息范围相当大。

  • Meta 悄悄做了一款 AI 吊坠,想让 Reality Labs 不再每个季度亏 40 亿美元

    Meta 正在开发一款 AI 吊坠设备,计划明年开始测试。这个消息来自 The Information 看到的一份内部备忘录。简单来说,这就是一个可以别在衬衫上、或者当项链戴的小装置,核心功能是记录你的对话,然后由 AI 进行处理和回应。

    Meta AI 概念图
    Meta 的 AI 硬件野心不止于眼镜(图源:TechCrunch)

    这个设备的技术底子来自 Meta 在 2025 年底收购的 AI 可穿戴初创公司 Limitless。那家公司之前就在做几乎一样的东西——一个挂在脖子上的 AI 吊坠,持续录音,然后帮你整理记忆、提取待办、总结对话。Meta 当时说这笔收购是为了”加速 AI 可穿戴设备的开发”,现在看来,吊坠形态确实是他们想推的方向之一。

    AI 吊坠这个品类之前已经有很多公司试过,基本都没掀起什么水花。隐私顾虑、营销不走心,或者产品本身就没那么有用——原因可能是其中任何一个。

    Meta 的真实算盘

    这份备忘录还透露了两个配套动作:Meta 计划扩展 AI 眼镜产品线,同时推出一个名为 Wearables for Work 的企业订阅服务。把这几件事放在一起看,Meta 的意图相当明确——用硬件矩阵把 Reality Labs 从每个季度亏 40 亿美元的泥潭里拉出来。

    2026 年第一季度,Reality Labs 亏了 40 亿美元。这个数字已经不是新闻,而是某种常态。Meta 在 VR/AR 硬件上砸了超过 10 年,到现在还没看到真正的规模化盈利。AI 吊坠能不能改变这个局面?说实话,机会不大,但 Meta 也没有更好的选择了。


    AI 可穿戴这个赛道到底行不行

    吊坠形态有个天然优势:比眼镜门槛低。眼镜需要度数适配、外形接受度、社交压力,吊坠只要别在衣服上就行。但劣势也很明显——存在感太弱反而可能是个问题,用户凭什么要一直戴着它?

    OpenAI 也没放弃这个方向,说明大厂们普遍觉得”贴身 AI”是个值得押注的交互入口。只不过从产品史来看,记录一切对话这个卖点最容易卡在隐私上——你愿意让一个随时在录音的设备贴身戴着吗?这个问题 Limitless 没答对,Meta 也不一定行。

    • 设备形态:AI 吊坠,可别在衬衫或当项链佩戴
    • 技术来源:基于 2025 年收购的 Limitless 团队
    • 测试时间:最早 2027 年开始内部测试
    • 配套计划:扩展 AI 眼镜产品线 + Wearables for Work 企业订阅
    • 战略目标:扭转 Reality Labs 每季度 40 亿美元亏损
  • SoftBank 砸 750 亿欧元在法国建数据中心,AI 基础设施军备竞赛打到欧洲

    孙正义又出大手笔了。SoftBank 刚刚宣布,计划砸最多 750 亿欧元(约 870 亿美元)扩建法国数据中心容量。这不是普通的数据中心投资——目标是开发运营最高 5GW 的额外数据中心容量,这个数字已经接近许多国家全国的发电装机量。

    第一阶段已经在路上:SoftBank 要在法国的 Dunkirk(洛恩-普拉日)、Bosquel 和 Bouchain 三地开建,到 2031 年向法国上法兰西大区交付 3.1GW 的容量。这是 SoftBank 迄今为止在欧洲最大的一笔 AI 基础设施押注。

    SoftBank 既是 OpenAI 的投资者,也是其客户。这家公司在 AI 基础设施上的每一步布局,都跟 OpenAI 的扩张节奏深度绑定。

    法国为什么愿意接这个盘

    法国经济部长 Roland Lescure 在声明里说得很直白:这证明了马克龙想把法国打造成 AI 全产业链重要目的地的雄心。从算力到应用层,法国想在这一波 AI 浪潮里分一杯羹,而数据中心是最底层的入场券。

    但这块饼没那么好啃。在美国,数据中心建设已经引发越来越强的反对声浪——环保团体担心能耗和用水,电网运营商警告变电站扩容跟不上,居民则抱怨电费上涨。SoftBank 此前宣布在俄亥俄州建数据中心,配套一座 9.2GW 天然气电厂,这种”算力+能源”打包模式在欧洲能不能跑通,还是个很大的问号。


    750 亿欧元到底花在哪

    这个数字听起来吓人,但拆开看其实有迹可循。5GW 的数据中心容量,按当前 AI 训练集群的功耗水平,大约能支撑几十个超大规模 GPU 集群同时运转。法国电价在欧洲相对便宜,核电比例高,对算力密集型企业有一定吸引力。

    问题是,AI 基础设施的投资回报周期极长,而技术迭代极快。今天花 750 亿欧元建的机房,五年后会不会因为芯片架构升级而大面积闲置?SoftBank 这次赌的,是 AI 算力需求会在未来十年持续指数级增长——这个假设一旦失效,这笔钱就打了水漂。

    • 目标容量:最高 5GW,第一阶段 3.1GW(2031 年交付)
    • 投资规模:最高 750 亿欧元(约 870 亿美元)
    • 地点:法国上法兰西大区(敦刻尔克等地)
    • 定位:SoftBank 在欧洲最大 AI 基础设施投资
  • 你家打扫卫生的画面,正在被AI公司花钱买走

    本周有一家叫Shift的AI训练初创公司宣布,要免费帮纽约人打扫房子,后续还打算把这项服务推广到伦敦等其他城市。我看着自己乱糟糟的公寓,完全能理解这个服务的吸引力。

    但天下没有免费的午餐,总有条件。

    AI机器人训练数据收集
    AI公司正在想方设法收集真实世界的物理数据丨The Verge

    你家的清洁过程,就是机器人的”教科书”

    作为免费打扫的交换,Shift要求获得清洁人员工作时的全部录像:刷碗、擦台面、擦桌子、拖地——所有我们愿意外包的琐碎家务都要拍下来。而这些录像,正是机器人公司竞相训练机器完成家务、最终向消费者售卖家用机器人的核心数据。

    这比听起来要难得多。和近年来爆发式增长的聊天机器人、图像生成器这些纯数字AI工具不同,机器人需要跟物理世界打交道:要理解空间、运动、力量、摩擦力,还要应对奇怪的形状和材质、尴尬的灯光条件,以及人类本能就能掌握的其他所有物理常识。这就是为什么叠衣服、拿苹果、倒水这些对人类来说很简单的事,对机器人专家来说却一直难以实现。

    “不像聊天机器人、图像生成器和其他近年来爆发式增长的AI工具,机器人必须和物理世界打交道。这意味着要理解空间、运动、力、摩擦力、奇怪的形状和材质、糟糕的照明,以及人类本能就能掌握的所有其他东西。”

    不止Shift一家在这么做

    在印度,近期有报道披露,家政服务平台Pronto一直把客户的家作为AI训练素材的来源,拍摄做饭、打扫、洗衣服等家务场景。Pronto表示只有在客户明确同意的情况下才会拍摄,目前还不清楚客户能获得什么回报(除了拍摄的素材副本之外)。但这一做法还是在市场上引发了强烈反对,竞争对手的初创公司纷纷表态,称自己从未在客户家中拍摄用于训练AI的素材,也没有相关计划。

    其他公司则专注于扩大数据收集的规模。比如硅谷的Human Archive公司,希望和Pronto这类企业合作,让零工工作者戴上并不时尚的摄像头帽子记录自己的活动。这种帽子可以从佩戴者的视角收集素材,正是机器人公司需要的”自我中心”视角数据,用来训练机器理解人类如何在物理空间中活动。

    而Shift也直接面向消费者,声称已经向15个国家的数万人支付报酬,让他们通过自己的应用记录日常活动。


    “数据农场”正在兴起

    还有一些公司完全跳过”有用的工作”,直接付费让工人反复完成相同的物理任务,同时用摄像头和传感器捕捉每一个动作。这类”staged data farms”(模拟数据农场)专门把叠毛巾、拿杯子、搬箱子等重复体力劳动转化为有价值的AI训练素材——其价值高到足以支撑公司付费生产这些内容。

    还有一部分数据来自已经在现实世界部署的机器人。尽管宣传得天花乱坠,但真正的全自动化还遥遥无期(这也是需要大量数据的原因),企业还是急于把产品推向市场。他们会用客户家中的使用数据来优化产品,很多公司还会在机器人卡住的时候安排远程工作人员介入,这些介入过程的数据也会被用于训练。

    用数据换免费服务,这个交易并不新鲜

    当然,用有价值的东西交换数据的做法早就不是新鲜事了。多年来企业一直用折扣、便利、免费服务换取用户数据,从会员积分卡、浏览器Cookie,到行车记录仪、监测驾驶行为的保险APP,还有永远在播广告的智能电视,都是如此。

    现在的新变化是企业愿意付费收集的数据类型。目前来看,这意味着你可能会让一个戴着摄像帽的人免费帮你打扫家里,最终目的是让企业未来能卖给你一个机器人,代替人类做这些家务。

    • Shift:免费清洁换录像,已覆盖15个国家
    • Pronto(印度):家政服务中拍摄家务场景,引发争议
    • Human Archive:给零工戴摄像帽,收集第一人称视角数据
    • 模拟数据农场:付费让工人重复完成叠毛巾、搬箱子等动作
  • 软银豪掷750亿欧元在法国建数据中心,欧洲AI基础设施大战打响

    这两天软银扔出了一个重磅消息:计划最高投入750亿欧元(约870亿美元)在法国建设数据中心。这个数字什么概念?比很多国家的全年GDP还高。孙正义这次是真的把筹码全压在AI基础设施上了。

    5吉瓦,不只是个抽象数字

    软银的说法是,这笔钱要用来开发并运营最高5吉瓦的额外数据中心容量。第一阶段落在法国上法兰西大区,具体地点包括敦刻尔克(Loon-Plage)、Bosquel和Bouchain,到2031年先交付3.1吉瓦的容量。

    3.1吉瓦是什么概念?大约相当于3座大型核电站的发电功率,或者够支撑一个中型城市的全部用电——只不过这些电全都要用来跑AI。

    数据中心建设概念图
    AI数据中心建设已成为全球科技巨头的核心战场丨Getty Images

    软银既是OpenAI的投资者,也是OpenAI的客户,这次在法国的投资被定位为其在欧洲规模最大的AI基础设施布局。法国经济部长Roland Lescure在声明里说,这证明了马克龙要让法国成为”AI价值链全环节领先目的地”的雄心。

    “这一公告证明了埃马纽埃尔·马克龙总统的雄心,即让法国成为AI价值链全环节的领先目的地。”
    ——法国经济部长 Rolland Lescure

    美国那边却在闹

    有意思的是,软银在美国那边也在大举建设数据中心,配套的是一座9.2吉瓦的天然气发电厂。但在美国国内,反对数据中心建设的声音正在升温——居民担心能耗、水资源消耗,还有对电网和公用事业价格的影响。

    法国这边为什么能推进这么快?一方面马克龙政府一直在积极吸引AI投资,另一方面欧洲的数据中心监管环境和美国有些不同,社区阻力相对小一些。但长远来看,欧洲的能源成本和环保压力也不会比美国轻松。


    全球AI基础设施竞赛才刚开始

    把这件事放在更大的背景里看:微软、谷歌、亚马逊、Meta都在疯狂建数据中心,现在软银以750亿欧元的规模杀入欧洲,说明这场基础设施竞赛已经进入了一个全新阶段。

    值得关注的是,软银并不是在孤军奋战——它和OpenAI的绑定关系意味着,这些数据中心很可能会优先服务于OpenAI的计算需求,再加上软银日本合资企业的布局,孙正义某种程度上在搭建一个横跨美国、欧洲、亚洲的AI基础设施网络。

    • 投资总额:最高750亿欧元(约870亿美元)
    • 目标总容量:最高5吉瓦额外数据中心容量
    • 第一阶段交付:2031年,3.1吉瓦(法国上法兰西大区)
    • 定位:软银在欧洲规模最大的AI基础设施投资
  • MIT TR 盘点:2026 年 AI 领域最值得关注的 10 件事

    MIT Technology Review 最近做了一件有意思的事——他们第一次把”当下 AI 领域最重要的事”整理成了一份清单。不是那种泛泛而谈的趋势预测,而是编辑团队基于多年追踪,认真挑出来的 10 个方向。

    这份清单里有些内容你可能已经耳熟能详,但也有几个方向,连很多业内人士都还没认真想过。挑几个最有意思的聊聊。

    人形机器人的”数据饥渴”

    训练大语言模型需要海量文本,那训练人形机器人需要什么?答案是:海量”人类动作视频”。现在已经有公司在专门搭建巨型”训练中心”,让工人重复完成各种任务,用摄像头把整个过程录下来。更夸张的是”提线木偶”模式——让海外陌生人通过远程操控的方式,实时”驾驶”机器人做各种动作,以此收集训练数据。

    这套打法有没有用,现在还不好说。但逻辑是通的:想让机器人学会”把杯子拿起来”,先得让它看几万遍人类是怎么拿杯子的。

    “世界模型”可能是下一个大突破

    大语言模型擅长处理文字,但要让 AI 真正理解物理世界,还需要别的东西。这就是”世界模型”(World Models)的由来——AI 公司希望构建能够理解外部物理世界的系统,而不只是预测下一个 token。

    如果世界模型取得成功,AI 将克服大语言模型的局限性,真正进入物理环境——而不只是停留在屏幕里和你聊天。

    AI 智能体开始”组队协作”了

    第一波 AI 智能体只能做单件任务——运行一个浏览器、写几行代码,而且各自为战。下一阶段的智能体将能够”组队”,多个代理协作完成复杂得多的目标。这就像从”单打独斗”进化到”团队协作”,能力上限会完全不一样。

    中国的开源赌注,全球已经在用

    中国实验室把前沿模型免费开放,这件事在全球范围内获得了大量开发者的好感。现在的问题是:这种模式财务上是否可持续?没人能给出确定答案。但一个事实已经形成——全球开发者已经在基于中国的开源基础模型构建应用了。


    这份清单里还有几个方向也值得关注:AI 加持下的诈骗正在升级、武器化的深度伪造已经成为现实、全球范围内对 AI 的抵制浪潮正在形成。MIT Technology Review 这份清单的价值不在于”预测”,而在于它把那些真正在发生的、会被写进历史的变化挑了出来。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施根本没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • 互联网正在为机器重构,人类流量迟早被反超




    互联网正在为机器重构,人类流量迟早被反超

    过去几十年,云计算基础设施都是围绕「人类行为」设计的:人搜索、点击、滚动、播放,节奏稳定且可预测。但AI代理的行为完全不同——它们能在几秒钟内同时启动多个子代理,查询数百个数据库、搜索文档、调用API,然后像出现时一样迅速消失。

    在这种认知下,亚马逊正在重新设计其核心云基础设施的一块关键拼图。

    AI agents conceptual illustration
    AI代理正在重塑互联网基础设施的设计逻辑。图片来源:akinbostanci / Getty Images

    AWS悄悄上线了一件大事

    本周四,AWS发布了新一代OpenSearch Serverless——这是一个完全托管的搜索和向量数据库,本质是一个大规模存储和检索信息的系统——而它的设计目标非常明确:专门为AI代理工作负载打造。

    AWS表示,这个新系统能在代理触发任务时瞬间扩展,在代理闲置时缩回到零。这套逻辑听起来简单,但对原本为人类设计的架构来说,是一次根本性重构。

    「代理正从实验阶段走向生产环境,它们产生的流量模式是此前的基础设施根本没有为之设计过的。」——Tia White,Amazon OpenSearch Service 总经理

    人类的互联网,机器的用法

    这个发布背后,是整个科技行业逐渐意识到一个问题:为人类驱动的互联网而设计的基础设施,在越来越多代理存在的世界里,其实并不好用。

    目前AI代理在互联网活动中的占比还相对较小,但机器生成的流量已经相当可观,而且还在持续增长。Cloudflare的数据显示,过去六个月里,机器人流量占整体HTTP流量的31%。其中,AI爬虫、搜索引擎和助手约占所有机器人请求的四分之一。

    Cloudflare高级产品经理Lai Yi Ohlsen对TechCrunch说了一句很直接的话:

    「非人类流量将在2027年上半年某个时间点超过人类流量。」


    谷歌也押注了代理

    上周的谷歌I/O开发者大会上,谷歌宣布用户将能够把购物研究、行程预订、网页浏览、应用交互等任务委托给AI系统。但这件事的影响远不止消费级AI助手。

    企业正在越来越多地内部部署代理,同时也让代理面向自己的客户运行,在幕后创造出全新类型的机器生成流量。

    结果是,云服务商和基础设施公司一直在思考一个问题:如何把为人类设计的系统,改造为能够适应代理持续自主检索信息、调用工具、生成机器对机器流量的世界。

    这正是AWS新版OpenSearch Serverless想要解决的问题。

    技术关键:把计算和存储拆开

    这一代产品最核心的技术变化,是把计算层与存储层解耦。计算资源可以在几秒钟内扩展,以容纳代理流量的突发高峰,也可以缩回到零,这样客户在代理闲置时就不用付钱。

    White用一个比喻来解释之前的困境:就像你一直为一个停车位付钱,哪怕你根本没在用它。而升级后的Serverless版本更像是按计时器付费的停车位。

    「之前,哪怕是我们上一代的Serverless版本,你也至少得让一个实例在运行,因为存储和计算是耦合在一起的。你没法按照你需要的速率自动启动(计算),所以你总是要为你的工作负载预留闲置的计算资源,不管你用没用。」White说。


    整个云行业都在跟进

    这种转变正在整个云计算行业同步发生。Databricks和Snowflake正在把自己重新定位为企业数据的AI记忆和检索系统。微软已经推出了针对Azure的更新,专门用来处理AI代理的流量突发,并在代理之间共享记忆。Cloudflare在类似的逻辑下,上个月也推出了旨在为代理提供持久化环境和即时扩展能力的基础设施。

    公司部署的AI代理越多,围绕机器生成的工作负载重新设计基础设施的压力就越大,这反过来又可能让代理在更大规模上的部署变得更便宜、更容易。

    发布时,OpenSearch Serverless将原生集成Vercel和Kiro等AI开发平台,这样开发者就可以为代理部署生产就绪的搜索和向量后端,而无需管理基础设施。

    这对开发者来说是个好消息——至少从理论上讲,代理驱动的应用的运维成本应该会降下来。但更大尺度上看,这件事的真正意义是:互联网的基础设施,正在从「为人类设计」转向「为机器设计」。人类仍然是使用者,但底层管道的优先级已经变了。


  • 程序员宁愿辞职也不愿不用AI写代码,这事儿迟早要翻车




    程序员宁愿辞职也不愿不用AI写代码,这事儿迟早要翻车

    2026年,研究人员发现了一个有趣的现象:你没法把AI编程工具从程序员手里抢走。哪怕只是参与一个实验,大多数开发者也不愿意在没有AI辅助的情况下写代码。

    这听起来像是AI提效的胜利宣言,但另一群研究者却发出了警告:AI确实让代码产出更快了,但产出的代码未必更好。而这,可能会在将来给这群开发者带来麻烦。

    「大多数开发者即使只是为了参与一项研究,也不愿意在没有AI的情况下工作。」——METR 研究团队

    一次没能完成的实验

    事情要从METR说起。这是一家受人尊敬的AI研究实验室,2026年2月,他们想做一件事:更新此前一项关于AI编程效率的里程碑研究。

    这项2025年发表的研究测量了开源开发者手工完成任务和使用AI完成任务的耗时差异。结果让很多人意外:开发者报告说AI让他们更高效了,但实测数据显示AI实际上拖慢了速度。代码生成确实更快,但开发者花在查找和修复错误、引导AI、等待AI完成任务上的时间,把节省的部分全吃掉了。

    所以当METR想重复这个实验、测量AI进步带来的效率提升时,他们碰壁了。开发者不愿意参与,理由是——「我不想在没有AI的情况下工作」,哪怕只是为了实验。

    最终METR在2026年5月改做了一项调查问卷,让技术人员自己报告AI带来的效率提升。不意外地,受访者普遍认为AI让自己的产出价值翻了一倍。


    「Tokenmaxxing」的幻灭

    2026年迄今最火的趋势之一,是把一个人消耗的token数量当作AI生产力 proxy(代理指标)的「Tokenmaxxing」运动。用得多就等于产出多,这个逻辑听起来很诱人,但它可能已经走到头了。

    亚马逊内部有一个叫Kirorank的token追踪排行榜。《金融时报》本周报道,这个排行榜被员工「玩坏」了——大家过度调用AI代理,推高了成本,亚马逊最终关停了它。这件事本身就很说明问题:AI使用量高,不等于生产力高。

    Uber更夸张。《The Information》报道,Uber在2026年前4个月就把全年的AI预算烧光了。CTO Andrew Macdonald最近在一个播客里说,这种支出并没有带来项目或生产力的可衡量提升。

    「现在代码写得快了两倍?希望你同时也把维护成本减半了。否则你就是在用暂时的速度提升,换取永久的债务。」——程序员 James Shore

    维护成本这个坑

    AI生成的代码并不一定减少后续维护需求,甚至可能增加。程序员兼作家James Shore在Hacker News上爆火的一篇博客里把这件事说得很直白。

    有不少数据支撑这个观点。AI可靠性工程代理创业公司Entelligence AI的创始人Aiswarya Sankar发推称,企业把44%的token花在修复AI自己引入的bug上。代码审查工具公司CodeRabbit分析开源拉取请求后发现,AI产生的代码比人工代码多出1.7倍的问题。

    当然,这些数据来自正在售卖AI代码审查工具的公司,多少有点自营自夸的嫌疑。但独立研究也发现了类似问题。新加坡管理大学的研究人员在2026年4月发表报告,警告「AI生成的代码可能给真实软件项目引入长期维护成本」。


    那到底该怎么办

    那些想向你推销AI编程代理的人会说,开发者大可以用AI编程代理来做修复代码的苦活,速度跟得上AI吐出代码的速度。Cognition(Devin的开发商)的创始人兼CEO Scott Wu就是这个观点的代言人。

    但就连他也承认,Devin虽然可以独立工作,但目前它的技能水平介于初级和中级程序员之间,取决于具体任务。这不是一个「交出去就不用管」的方案。

    新加坡管理大学的研究人员提出了一个更「人类」的方案:程序员应该像熟悉自己最爱的编程语言一样,深入了解AI擅长什么、不擅长什么。他们需要为AI设计强大的质量保证体系,并且像对待初级开发人员一样,仔细审查AI的输出。

    同时,研究者们认为(Scott Wu也同意),人类仍然应该负责大局性的工作:软件架构、安全设计,这些事现在还放心交给AI。

    说到底,AI是个好工具,但它现在还没好到让你把脑子交给它。程序员拒绝在没有AI的情况下工作,这件事本身没问题;有问题的是,拒绝同时意味着放弃了对自己产出质量的把关权。