分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • Anthropic完成650亿美元融资,估值直逼1万亿

    昨天(5月28日)AI圈被一条消息刷了屏——Anthropic宣布完成650亿美元H轮融资,投后估值9650亿美元,距离万亿美元俱乐部只差临门一脚。

    这轮融资里有个细节值得注意:其中150亿美元其实是超大规模云服务商之前已经承诺的投资,包括今年4月亚马逊承诺的50亿美元。换句话说,这次融资有一部分是在”追认”此前已经落地的承诺。但这丝毫不影响市场的兴奋程度——联席领投方阵容相当豪华:Altimeter Capital、Dragoneer、Greenoaks、红杉资本、Capital Group、Coatue、D1 Capital Partners全部在列。

    Anthropic融资
    Anthropic本轮融资估值已接近1万亿美元(图源:TechCrunch)

    融资同日,Opus 4.8来了

    融资消息公布的同时,Anthropic发布了Claude Opus 4.8。新版本在智能体任务和多步骤推理上有明显提升,同时更强调”诚实性”和”自我纠错”能力——这其实是Anthropic一贯的安全叙事在模型能力上的延伸。

    企业客户对Claude Code的需求增长非常猛。Anthropic透露,这款面向开发者的编程工具在过去几个月里推动营收快速拉升。5月初,公司年度经常性收入(ARR)已经突破470亿美元。《华尔街日报》甚至报道说,Anthropic预计营收将激增130%,并实现首个运营盈利季度。

    如果这些数据属实,Anthropic可能是目前头部AI实验室里最先跑通”商业化”的一家。OpenAI和Anthropic都在疯狂烧钱,但Anthropic似乎更早看到了正向现金流的曙光。

    这会是IPO前的最后一轮吗

    9650亿美元的估值,加上”IPO前最后一轮私募融资”的市场预期,让这轮融资有了不同寻常的意味。Altimeter Capital创始人Brad Gerstner在声明里说:”Claude的最新进展推动了全球最苛刻机构的大规模采用,这一势头让Anthropic能够引领AI创新的下一阶段。”

    投资方的构成也很有意思。除了传统VC,三星、SK海力士、美光这些芯片产业链的战略投资方也进来了。这说明Anthropic不仅仅在囤积算力,还在往产业链上游布局——算力、芯片、应用三层同时押注。


    竞争对手在做什么

    OpenAI今年3月完成1220亿美元融资,投后估值8520亿美元,和Anthropic的差距正在缩小。马斯克的SpaceX(已与xAI合并)IPO目标估值更是高达2万亿美元。

    三家的路线已经开始分化:OpenAI押注多模态和消费者应用,Anthropic押注企业级安全和代码助手,xAI押注算力和数据规模。接下来12个月,IPO窗口一旦打开,这场比赛的节奏还会更快。

  • 谷歌DeepMind预言:2026年AI将实现永生

    谷歌DeepMind预言:2026年AI将实现”永生”

    2026年刚开始,谷歌DeepMind研究员就抛出一颗重磅炸弹:持续学习(Continuous Learning)将在2026年取得突破性进展,AI有望实现”自我进化”,不再需要人类反复训练。这个预言如果成真,AI的发展节奏会被彻底改写。

    Google DeepMind AI Continuous Learning
    谷歌DeepMind对持续学习的技术预言 | 来源:新智元

    这个预测不是空穴来风。Jeff Dean在NeurIPS 2025的炉边谈话中就指出,当前大语言模型的核心痛点就是”缺乏持续学习”能力。2025年底,谷歌团队提出的”嵌套化方法”已经增强了LLM的上下文处理能力,实现了持续学习的雏形。


    2026年:持续学习成为AI核心节点

    Anthropic CEO Dario Amodei最近公开表示,持续学习将在2026年落地且可实用化。这个说法不是营销话术——Anthropic的工程师自曝,过去一个月对Claude Code的贡献全部由AI 100%生成代码,非技术程序员Ben Tossell四个月用Claude Code造了50个项目,全程几乎0人工干预。

    持续学习是AI自我改进、能力涌现的核心要素。实现后,模型无需通过重新训练升级,可在自编码过程中不断进化。

    OpenAI研究员Hieu Pham甚至预测,2026年AI将破解一个千禧年难题。这个预测如果成真,意味着AI的推理能力将跨越式提升,不再只是”预测下一个token”,而是真正开始”思考”。

    2030年:全自动编程触发ASI加速

    前OpenAI研究员Daniel Kokotajlo团队用自主开发的AI Futures Model做了个推演:2030年有望实现完全自动化编程,甚至有25%的概率在1年内实现向超级人工智能(ASI)的飞跃。

    这个推演的核心逻辑是:全自动编程(AC)是AGI研发进入自动化加速阶段的”开关”。一旦落地,ASI极有可能快速起飞。这个预测听起来科幻,但推演方法是有依据的——以”能力基准趋势外推”为核心方法,采用ETR的编码时间跨度套件(ETR-HRS)作为基准,推演达到AGI所需的算力与发展路径。

    AI研发自动化分为三个阶段:

    • 阶段1:自动化编程——定义自动化编程器(AC)可完全替代AGI项目的整个程序员团队
    • 阶段2:自动化研究品味——研究品味指确定研究方向、挑选实验、解读结果、提取知识的能力;该阶段预测从AC进化到超人类AI研究员(SAR)的时间
    • 阶段3:智能爆炸——追踪三个里程碑:超智能AI研究员(SIAR)、顶尖专家级AI(TED-AI)、超级人工智能(ASI)

    2050年:诺奖级科研的主力军

    《自然》(Nature)杂志展望:到2050年,AI系统或将成为”诺奖级”科学研究的主力军。这个预测不是瞎猜——《超级智能:路径、危险与策略》作者Nick Bostrom预计AGI将在2050年前后出现,可回答当前大部分原则上可由科学解答的问题。

    伦敦研究与前瞻公司Outsmart Insight联创Alex Ayad提出了一个”黑灯实验室”场景:由AI算法驱动的自主系统结合机器人实验员,可24小时不间断攻克生物技术难题,全程无需人类在场。墨西哥国立自治大学物理学家Juan Carlos Hidalgo预测,在AI辅助下2050年核聚变能源成熟的前景”相当可期”。


    这件事为什么重要

    谷歌DeepMind这个预言的价值在于,它给出了一个明确的技术路线图:2026年持续学习落地 → 2030年全自动编程 → 2050年AI主导诺奖级科研。这个路线图如果成真,人类在科学研发中的角色会被根本性改变。

    现在下结论还太早。持续学习的技术路径还没收敛,全自动编程需要的不仅是代码生成能力,还有”研究品味”这种很难量化的能力。但方向已经清楚了:AI正在从”工具”变成”合作者”,再变成”主导者”。这个过程的节奏,可能比大部分人预期的快。

    对于开发者和企业来说,现在要问的问题不是”AI会不会替代我”,而是”我怎么在AI持续进化的环境里找到自己的位置”。这个答案,2026年可能会有第一部分线索。

  • MIT科技评论2026年AI十大趋势:去伪存真的关键之年

    MIT科技评论2026年AI十大趋势:去伪存真的关键之年

    2026年4月,MIT科技评论首次推出”当下AI领域最重要的10件事”年度清单。这份报告来得正是时候——AI行业喧嚣不断,泡沫和炒作混在一起,能看清方向的声音越来越少。MIT的编辑团队花了大量时间筛选,最终给出这份清单,目的很明确:剔除噪音,找出真正推动AI发展的核心力量。

    MIT Technology Review AI Trends 2026
    MIT科技评论2026年AI十大趋势封面图 | 来源:MIT Technology Review

    这份清单和MIT传统的”10项突破性技术”榜单有所不同。以前的榜单更偏重技术本身,而这一次的视角更宽——它看的是整个AI生态里,哪些力量在真正改变游戏规则,哪些只是昙花一现的炒作。


    一、人形机器人训练数据:教AI理解物理世界

    大语言模型的训练用的是人类文本,而人形机器人的训练数据是什么?是人类的动作视频。这个逻辑很直接——就像文字让模型学会”说话”,视频能让机器人学会”行动”。现在已经有公司在大规模做这件事:建大型训练中心,让工作人员重复做特定任务,采集动作数据;还有的用”傀儡式”操作,让海外人员远程操控机器人,记录每一次移动。

    问题是,这项投入巨大,但结果还没人说得准。机器人能不能真的从视频里学会灵活操作?还是说需要更多维度的数据?这个方向值得盯紧。

    二、大语言模型+:下一站在哪里?

    大模型已经席卷全球,整个行业都在问同一个问题:下一代突破在哪里?基础优化空间越来越小,但大模型本身不会被淘汰。MIT的编辑们认为,这个技术还有很多潜力没挖完,关键是往哪个方向挖。

    大语言模型不会消失,它只是刚刚开始。真正的问题 是:我们能让它做什么更多的事?

    三、升级版诈骗:AI让攻击成本暴跌

    这是清单里最让人不安的一条。AI正在让诈骗和黑客攻击变得前所未有的容易——速度更快、成本更低、操作更简单。以前需要专业技术才能做的攻击,现在门槛被AI砸到了地上。这个趋势在2026年会继续恶化,几乎没有放缓的迹象。

    四、世界模型:AI的下一个前沿

    现在的AI模型能聊天、写代码、生成图片,但它们不理解物理世界的运作规则。世界模型(World Models)要解决的正是这个问题——让AI真正”理解”外部世界,而不只是预测下一个token。如果这个目标实现,AI就能真正进入物理场景落地,而不只是停留在屏幕里。

    五、新型作战指挥室:AI进入军事决策

    算法早就让军事的一些基础工作自动化了,但生成式AI正在进入更高层的决策环节。指挥官开始认真参考AI给出的建议,这个变化正在重塑军队的情报共享方式、和大型科技公司的合作模式,以及致命决策的制定流程。这件事的影响面很广,而且不只是技术问题。

    六、武器化深度伪造:威胁已成现实

    长期以来被预测的”武器化深度伪造”威胁,在2026年已经成为现实。生成式AI技术的进步,加上Grok模型大规模生成非自愿色情图像、美国政府部门用这项技术制作宣传内容,这些事件加在一起,让深度伪造从”潜在风险”变成了”正在发生的事实”。

    七、智能体编排:从单打独斗到团队协作

    第一代AI智能体只能做单一任务——运行浏览器、写几行代码,而且各自为战。下一代智能体的方向是”编排”:多个智能体协作,分工完成复杂的长距离任务。这个变化一旦完成,AI能做的事情会比现在多出一个数量级。

    八、中国的开源押注:免费策略赢得全球开发者

    中国AI实验室把前沿模型免费开放,这个策略为他们赢得了全球开发者的认可和口碑。现在的问题是,这种模式能不能持续?财务上怎么算账?但不管怎样,全球开发者已经开始基于中国的开源模型构建各类应用,这个趋势已经成型了。

    九、人工智能科学家:AI开始做科研

    高校和企业都在开发能自主完成科研任务的AI智能体,把它们当作真正的协作者和科学家来用。有人甚至预测,这类AI科研助手未来有可能做出诺贝尔奖级别的研究成果。这个说法听起来夸张,但研发进度比很多人想象的快。

    十、反AI抵制运动:反弹正在发生

    AI不受限制地发展了这么多年,现在全球范围内出现了强大的反AI抵制浪潮。从保守派到自由派,从艺术家群体到工会,相关活动人士的声音正在扩大,而且已经开始取得一些小范围的胜利。这个趋势在2026年会继续发酵。


    我的看法

    读完这份清单,一个感受很强烈:AI行业正在从”能做什么”转向”应该做什么”。前几年大家都在比参数、比 benchmark,现在开始有人认真问这些问题——AI用在军事上边界在哪里?深度伪造谁来管?开源模式能不能持续?

    这份清单里我最看好”世界模型”和”智能体编排”两条线,这两个方向一旦突破,AI的应用场景会大规模扩展。最担心的当然是”升级版诈骗”和”武器化深度伪造”,这两个方向的技术进步速度远远快于监管跟进的速度。

    至于”反AI抵制运动”,我觉得这是健康的信号。任何技术发展到一定阶段,都需要来自社会的反馈和约束,AI也不例外。

  • 谷歌I/O 2026全记录:Gemini Spark永久在线,智能眼镜今秋开卖

    5月19日,谷歌I/O大会开幕。主题演讲持续了两个小时,核心信息只有一句话:Gemini不再是聊天工具,而是要替你干活。

    这次大会发布的东西不少,但有一条主线贯穿全场——把AI智能体塞进你每天用的所有谷歌产品里:搜索、Gmail、YouTube、Docs、Chrome,一个不落。

    谷歌说现在有9亿人在用Gemini,人们已经用它生成了超过500亿张图像。2026年的目标是让Gemini成为你互联网的”执行层”。

    搜索的25年来最大重构

    搜索框变成了”智能搜索框”——AI代理直接嵌在里面,当天就向全量用户推送。你搜”黑洞”,搜索结果页不是十蓝色链接,而是AI直接生成一个可视化解释视频,嵌在结果页里播放。

    夏天还会上线”生成式UI”功能:搜索结果根据你查的内容类型自动调整布局。查新闻、查视频、查图片,每种场景下搜索结果的呈现方式都不一样,是AI实时生成的界面。

    Gemini Spark:谷歌版OpenClaw

    这是本次大会最值得关注的产品之一。Gemini Spark是一个永久在线的个人AI代理,跑在谷歌云上——就算你关了电脑、手机没电,它还在云端继续跑任务。

    它能读取你的谷歌硬盘文件,知道你的日历安排,理解你的生活节奏。你跟它说”帮我策划街区派对”,它会自己发邮件、追踪采购进度、发跟进邮件,全程不需要你盯着。涉及付款的关键节点才会来问你确认。

    目前Spark只支持谷歌自家服务,夏天会接入Chrome浏览器和第三方服务。这个产品的定位很清晰:跟OpenClaw正面竞争。

    智能眼镜今年秋天就卖

    谷歌联合三星和眼镜品牌Warby Parker、Gentle Monster做两款智能眼镜,属于Android XR平台。

    • 音频版:今年秋季上市,镜腿有扬声器,有摄像头,能看见你看见的东西,支持实时跨语言翻译
    • 带显示屏版:还在研发,上市时间更晚,可以在镜片上显示短信、导航、搜索结果

    两款都支持调用谷歌的图像生成工具Nano Banana——你拍一下眼前的场景,AI可以在画面上叠加虚拟物体或特效,没显示屏的版本会把生成内容推到你的手机或安卓手表上。

    其他值得关注的发布

    Gemini Omni:对标Sora 2的视频生成模型,特色是”真实感”——可以把你拍的自拍视频换背景、换风格、换环境,人物表演保留,场景全部AI重绘。轻量版OmniFlash当天就向Pro和Ultra订阅用户开放了。

    通用购物车:谷歌要做跨网站的购物车,你在不同电商网站逛,把想买的东西都加进这个统一购物车,AI帮你比价、提醒降价、推送新配色。结账时谷歌的安全支付系统可以一次性结清跨店铺订单。

    第八代TPU:训练性能提升3倍,推理专用版本每秒能生成1500个token。谷歌2026年在算力基建上的投入预计达到1900亿美元。


  • DeepSeek V4-Pro永久降价75%,输出token不到1美元

    上个月DeepSeek推出V4-Pro的时候,给了一个75%折扣的促销价,截止日期写在5月31日。业内普遍以为这只是新模型上线的拉新手段,到期后会涨回原价。结果5月22日,DeepSeek直接在官方文档里把折扣价改成了永久定价——没有任何预告,就是悄悄把数字改了。

    新价格出来之后,输出token的成本是每百万0.87美元。作为对比,OpenAI的GPT-5.5输出token定价大概是其34倍。Anthropic的Claude Opus 4.7、谷歌的Gemini 3.5 Flash,在同级别推理能力下,每token价格都比这家中国公司贵出一截。

    DeepSeek-V4-Pro永久降价后,在全球”性价比”排名中直接登顶。输出定价低于1美元/百万token的前沿模型,目前只有这一家。

    为什么敢这么定价?

    背后的技术原因挺直接:V4系列从设计之初就针对华为昇腾950 AI加速器做了优化,不依赖英伟达GPU。DeepSeek在发布V4时就说过,一旦昇腾950超级节点大规模可用,API定价会大幅下降,当时预计是2026年下半年。结果他们提前动了刀,说明对基础设施成本已经看得足够清楚了。

    具体价格表:缓存命中输入0.003625美元/百万token,缓存未命中输入0.435美元/百万token,输出0.87美元/百万token。人民币计价的话,大概是0.025元到6元/百万token的区间。

    行业反应

    彭博社把这件事定义为AI价格战的升级信号。开发者社区的反应更直接——之前犹豫要不要把DeepSeek纳入生产系统的团队,现在可以放心规划了,因为价格的不确定性消除了。

    这件事的另一个影响是:如果每百万token低于1美元的高性能推理成为常态,那么教育、工具类SaaS、小型创业公司这些对成本敏感的场景,AI接入的门槛就彻底打开了。


  • Asana 75亿美元收购无代码AI智能体平台 StackAI

    工作效率平台 Asana 宣布以75亿美元收购无代码 AI 智能体构建器 StackAI,这是它向”AI原生工作平台”转型的关键一步。StackAI 的两位创始人 Tony Rosinol 和 Bernard Aceituno 将随收购加入 Asana。

    Asana AI workflow
    (图源:Getty Images / TechCrunch)

    Asana 把这次收购定位为”人类与 Agent 团队协作操作系统”路线图的一部分。StackAI 做的事其实挺有意思——它让没有技术背景的人也能搭建能在企业现有系统里跑的 AI Agent,可以接入 Salesforce、Slack、GSuite 这些数据源。

    StackAI 是 YC 2023年冬季批次孵化的项目,累计融资约2000万美元,最近一轮1600万美元的A轮投资方包括 Gradient、Epaklon Capital、Lobby VC、LifeX Ventures 以及 Vercel CEO Guillermo Rauch。

    为什么要买它

    Asana 过去几年陆续推出了 AI Studio(Agent 构建器)和 AI Teammates(预制自动化流程)等产品,但面对 OpenAI、Anthropic 这些大模型公司的”降维打击”,光靠自己的技术积累有点吃力。StackAI 的价值在于它已经打通了企业常用系统的数据管道,而且不需要写代码——这对 Asana 的核心用户群(项目经理、运营团队)来说门槛刚刚好。

    当然竞争也不小。Zapier 这类老牌自动化工具在拼命加 AI 功能,大模型公司也在推自己的 Agent 平台。Asana 的优势是它已经嵌进了成千上万家公司的日常工作流里,这是 OpenAI 没有的数据上下文。

    Asana 自己的坎


    但这家公司日子并不好过。ChatGPT 问世以来,Asana 的市值跌了一半还多。今年3月创始人 Dustin Moskovitz 卸任 CEO,由 Dan Rogers 接手。新管理层的赌注就是”人+Agent”协作这个方向——今天这笔收购是这个战略的最新落地动作。

    Dan Rogers 在声明里说:”这次收购加速了我们的路线图,把我们带进人机协作的下一个阶段。AI Teammates 和 AI Studio 已经让我们看到了势头,StackAI 现在能让用户走得更远——把最复杂的业务流程端到端地’Agent 化’。”

    75亿美元的价格不便宜,但对一家想在工作流 AI 赛道翻盘的公司来说,这可能是不得不下的注。

  • Anthropic完成650亿美元融资,IPO前估值逼近1万亿美元

    Anthropic今天宣布完成650亿美元H轮融资,投后估值9650亿美元——距离”万亿俱乐部”只差350亿。这很可能是它登陆公开市场前的最后一轮私募融资。

    Anthropic Claude AI
    Anthropic 总部(图源:Anthropic 官方)

    本轮由 Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capital、Capital Group、Coatue、D1 Capital Partners 联合领投。机构的名单里还有 Baillie Gifford、Blackstone、Brookfield、D.E. Shaw Ventures、DST Global、Fidelity 这些名字。

    本轮中有150亿美元来自此前已承诺的”超大规模云厂商”投资,其中包括亚马逊4月宣布的50亿美元。三星、SK海力士、美光这三家芯片产业链公司也作为战略投资方入局。

    钱要花在哪里

    Anthropic 说这笔钱会用来推进安全与可解释性研究、扩充算力以满足 Claude 快速增长的企业客户需求,以及扩大产品和合作伙伴关系。

    值得注意的是,融资消息发布当天 Anthropic 同步推出了 Claude Opus 4.8,这个新版本在 Agent 任务和多步推理上有明显提升。据彭博社报道,Anthropic 还在准备把之前只限量发布的网络安全模型 Mythos 向更广泛的用户开放。

    盈利拐点要到了

    公司的营收运转率(run-rate revenue)本月刚突破 470亿美元。《华尔街日报》援引知情人士说法称,Anthropic 预计本季度将迎来首个经营盈利季度——营收同比增长130%能把一家AI公司从”烧钱”拉到”赚钱”。


    Altimeter Capital 创始人 Brad Gerstner 的说法更直接:”Claude 的最新进展让全球最挑剔的企业客户大规模采用。这种势头让 Anthropic 站在了下一阶段AI创新的最前沿。”

    当然,IPO之前还要跟 OpenAI 正面竞争。OpenAI 3月完成1220亿美元融资,投后估值8520亿美元。马斯克的 SpaceX(已合并 xAI)则瞄准2万亿美元估值,计划IPO募资逾750亿美元。AI大模型公司的估值竞赛,数字已经大到失去了直观意义。

  • Google I/O 2026:搜索框正在消失,AI代理替你做决定

    谷歌的核心属性是什么?过去二十年里,答案一直是”搜索”。你打开浏览器,在搜索框里输入问题,谷歌返回十个蓝色链接。

    但这个模式正在发生根本性的变化。Google I/O 2026展示的愿景是:AI代理会主动完成搜索,甚至无需你触发、参与或知情。

    在谷歌构想的搜索场景中,大量搜索行为不再由用户主动发起。这也引发了一个核心疑问:在AI主导搜索的新形态下,谷歌还能被称为”搜索引擎”吗?

    Sundar Pichai 的赌注

    The Verge的主编Nilay Patel前往Google I/O 2026现场,采访了谷歌CEO Sundar Pichai。两人的对话围绕几个核心方向展开:搜索功能的变革方向、谷歌在AI生态中的定位信心来源、以及这些变化对互联网未来的影响。

    Pichai的赌注很大:他认为谷歌在AI基础设施、模型能力和用户数据上的积累,使其在”后搜索时代”仍然拥有不可替代的位置。但外界的疑问是:如果AI直接给出答案,用户不再点击链接,谷歌的广告商业模式还能维持吗?

    Sundar Pichai 在 Google I/O 2026
    Sundar Pichai 在 Google I/O 2026 | The Verge

    AI代理购物车的野心

    谷歌在I/O上展示的”通用AI购物车”概念,可能是最值得关注的发布之一。这个AI代理不只是帮你搜索商品,它会追踪价格、提供购买建议、寻找折扣,甚至在合适的时候替你下单。

    这听起来像科幻小说,但谷歌的Demo显示它已经在有限场景下运行了。问题是:用户愿意把购买决策权交给AI吗?这是一个信任问题,不只是技术问题。

    互联网还有未来吗?

    这场变革背后有一个更深层的问题:如果AI代理吞噬了搜索流量,那些依赖搜索流量的网站(媒体、博客、电商平台)还能存活吗?互联网的内容生态是靠”人类点击链接”来维持的,如果点击消失了,内容创作者的收入从哪来?

    • 媒体行业已经在裁员和转型中挣扎
    • 如果AI摘要取代了点击,广告收入将大幅缩水
    • 内容创作者需要新的变现模式,而不是依赖搜索流量

    本周其他值得关注的动态

    除了Google I/O,本周AI行业还有几件事值得记一笔:

    Spotify推出AI功能,可以为每个用户生成专属的每日播客——由AI根据用户的收听历史自动制作。这标志着个性化内容生成正在从文字走向音频。

    YouTube Shorts的AI混剪功能:谷歌让用户可以拿别人的Shorts视频用AI进行混剪。这引发了版权和创作者权益的新一轮争论。

    SpaceX启动IPO,马斯克被列为风险因素——招股书里明确写了:如果马斯克分心过多,或者卷入政治争议,公司业务可能受到不利影响。这大概是IPO招股书里最诚实的风险披露了。

    搜索不会消失,但会变形

    把Google I/O的发布放在一起看,一个清晰的信号是:搜索不会消失,但它会从”你主动提问”变成”AI主动帮你”。这个变化对普通用户来说可能更方便,对依赖搜索流量的整个互联网内容生态来说,却是一个结构性挑战。

    谷歌显然知道这个问题。Pichai在采访中被问到”互联网是否还有未来”时,他的回答是:内容生态会适应,就像过去每一次技术变革一样。但这一次,适应的速度可能比任何人预期的都要快。

  • AI真的在抢走白领工作吗?数据说不

    你肯定也听过这种说法:AI正在吞噬白领工作,软件开发、金融分析、科技公司文案,通通不保。Coinbase、Meta、思科最近一波裁员,更让这种焦虑发酵到了新高度。

    但在你递交辞职信去学水管工之前,值得看看数据到底在说什么。

    简短的答案:目前还没有。尽管到处都是”就业末日”的警告,但几乎没有证据表明AI已经对美国劳动力市场产生了大规模影响。

    失业率数据打脸恐慌论

    美国劳工统计局(BLS)的数据清清楚楚:那些被认为”最容易被AI影响”的职业,失业率反而比受AI影响较小的职业更低。而且,没有任何迹象显示大量劳动者正从”危险职业”涌向”安全职业”(比如体力劳动)。

    前BLS局长埃里卡·麦肯塔弗(Erika McEntarfer)说得很直白:”迄今为止所有可用证据都表明,AI对当前劳动力市场状况的影响目前可能很小。我们从历史中知道,创新需要时间才能渗透到行业变化和职业变化中。AI不太可能在首先改变企业之前就改变劳动力市场。”

    AI与就业市场关系示意图
    MIT Technology Review 配图 | Stephanie Arnett

    年轻人确实在受苦,但原因很复杂

    公平地说,美国就业市场现在对很多人来说都很糟糕,尤其是年轻求职者。最近大学毕业生的失业率约为5.6%,远高于全体工人的失业率水平,这个数字是疫情以来、2008年经济衰退以来都没见过的。

    有迹象表明AI正在加剧22至25岁、寻求软件开发等受AI影响较大职业的年轻人的痛苦。但把这些职业的困境全算在AI头上,目前还缺乏足够证据。

    • AI应该为就业困境承担多少责任?不确定
    • 受AI影响职业中入门级工作的减少,是即将到来的其他职业的预兆,还是仅仅是”低解雇、低招聘”劳动力市场的孤立症状?也不知道

    斯坦福的研究发现了一个关键细节

    斯坦福数字经济实验室的研究人员分析了950个职业,按”AI暴露度”分为五档。他们用了ADP的庞大数据集(比BLS的数据大得多),发现了一个有意思的现象:

    在ChatGPT首次公开发布的2022年底之后,受AI暴露度最高的职业(如软件开发和客户服务)中,22至25岁的员工人数开始下降。到2025年,受AI暴露的职业的入门级工作岗位下降了16%。

    但研究同时发现了一个经常被忽略的关键细节:影响取决于AI的使用方式。那些任务可以”最少人类参与”自动化的工作(比如入门级编码),就业人数减少了;而在AI主要用于增强人类工作的工作岗位,入门级工人的就业人数增长反而快于平均水平。

    “编码知识” vs “隐性知识”

    这项研究提出了一个有趣的解释:入门级工作更多依赖于人们通过教育获得的”编码知识”——这类知识容易被AI模仿。而年长工人有更多的”隐性知识”,即基于经验的那种直觉和判断力,这类智慧目前还很难被AI取代。

    这意味着”边赚边学”的传统职业模式,至少在某些职业里,可能真的被打破了。年轻毕业生的技能可以与AI匹敌,所以他们找不到工作了。


    这次会不一样吗?

    对AI取代工人潜力的焦虑并不是什么新鲜事。2013年就有大量报道描述包括AI在内的一系列新数字技术如何开始威胁白领工作。2016年底,奥巴马总统任期的最后几天,他发布了一份由顶级经济和科学顾问撰写的报告,警告AI正在威胁工人。

    当时AI先驱杰弗里·辛顿说:”人们应该停止培训放射科医生”,因为该职业很快就会被AI取代。当然,这个预测没有成真。AI确实已经成为筛查放射学图像的工具,但放射科医生的数量比以往任何时候都多。

    事实证明,人类放射科医生执行大量有价值的任务,包括解释结果和与患者互动,这些任务目前还无法用AI完成。

    也许这次会不同。AI确实已经获得了做类人任务的难以想象的能力。但之前的AI就业焦虑有一个先见之明的教训:我们真正的关注点应该少放在反乌托邦的恐惧上,更多放在可能影响到数百万人的工作场所的真正过渡上。

    我们需要更好的数据

    哈佛大学经济学教授大卫·戴明说:”我们基本上是在盲目飞行。”目前的数据收集工具并不能充分解释AI如何影响庞大而多样的美国劳动力市场。

    斯坦福数字经济实验室即将启动一个定期更新的项目,提供关于AI如何改变经济的数据。在花费数千亿美元推出AI技术的时候,我们在了解这种过渡上投入的资金甚至不到1%。

  • Cursor Composer 2.5 发布:不换底座、1/10成本追平Claude Opus 4.7

    过去几个月,AI 编程工具的用户有个普遍感受:Claude Code 用起来越来越顺手,Cursor 反而有点掉队。这个局面在5月19日变了——Cursor 发布了 Composer 2.5,直接把基准测试成绩拉到了和 Claude Opus 4.7 同一个水平线。

    有意思的是,这次 Cursor 没有换底座模型,仍然用的是月之暗面开源的 Kimi K2.5 权重,只是把85%的计算量砸进了后训练。换句话说,同样的底座,靠训练手法把成绩硬拉了上去。

    Composer 2.5 在 SWE-Bench Multilingual 拿到79.8%,和 Claude Opus 4.7 的80.5% 只差0.7个百分点。成本却只有后者的约1/10。

    价格才是真正的杀手锏

    具体定价:输入0.5美元/百万token,输出2.5美元/百万token。作为对比,Claude Opus 4.7 的输入定价大约在20美元/百万token量级。差距是数量级的。

    Cursor 为什么要走这条路?直接原因很现实:Cursor 调用 Anthropic 的模型需要付推理费,成本结构是跟着 Anthropic 走的,它没法把 Claude Code 的价格打下来。自研模型是唯一能打出差异化的路径。


    长任务能力是这次的重点

    AI 编程工具的一个核心痛点是:短任务表现都不错,但任务一拉长(多文件修改、跨步骤依赖、几十轮工具调用),模型就容易失忆或者犯低级错误。

    Composer 2.5 针对这个场景做了专项优化。训练方法里有个细节值得说:「功能删除」训练——从可运行代码库里随机删掉某项功能,让模型重新实现并通过测试验证。这种方式生成的训练数据质量远高于人工标注,因为它自带可验证的正确性信号。

    另一个训练技巧是带文本反馈的强化学习。不是等整个任务结束才给一个奖励信号(那样太稀疏,模型很难学到东西),而是在模型执行出错的位置直接插入局部提示——比如工具调用失败时,提示可用工具列表——让模型从错误位置开始就能得到针对性反馈。

    透明性这块,这次学乖了

    上次发布 Composer 2 的时候,Cursor 没有披露模型底座来自 Kimi K2.5,结果被社区扒出来后在 Hacker News 上引发了一轮讨论。这次 Composer 2.5 的发布公告里直接写明了底座来源,算是吃一堑长一智。

    目前 Cursor 内部35%的合并 PR 已经由自主 Agent 创建。这个数据背后意思是:模型不只是给人提供代码建议,而是能独立跑完一个功能分支的开发-测试-提 PR 全流程。Composer 2.5 发布首周,Cursor 用户的模型调用量就翻了一倍。


    下一步是什么

    Cursor 已经宣布正在和 SpaceX AI 合作训练下一代模型,使用 Colossus 2 的百万 H100 等效算力,总计算量会是 Composer 2.5 的10倍。按这个节奏,下一代模型的基准测试成绩还会再往上走一截。

    顺带一提,马斯克在 X 上转了 Composer 2.5 的发布推文,确认了 Colossus 2 参与了部分训练。这条转发本身比任何公关稿都更有分量——意味着这家公司的训练基础设施已经得到了业界最挑剔的那批人的认可。