分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • ElevenLabs全面接入SynthID水印,AI声音内容终于有迹可循

    AI声音越来越像真人,水印成了最后的防线

    以前AI生成的声音一听就知道是机器——语调平、没感情、偶尔还卡壳。现在不一样了。ElevenLabs、Google、OpenAI的语音模型出来的效果,打电话过去很多人根本分不出来对面是真还是假。这让”声音深伪”从一个技术问题变成了一个社会问题——诈骗电话、假录音、伪造名人发言,这些事已经在发生。

    ElevenLabs这周做了一个实质动作:把Google DeepMind的SynthID水印技术接入了自己的文字转语音生成流程。免费用户已经能用上,接下来几周会覆盖所有音频生成。这个水印是直接嵌进音频里的,人耳听不到,但用ElevenLabs的音频检测器可以识别出来。哪怕音频被裁剪、加速、转格式、删掉元数据,水印还在。

    AI生成音频水印示意图
    SynthID水印:嵌在音频里、人耳听不见、但可以检测 | 图片来源:ElevenLabs

    SynthID是什么,为什么是Google在推

    SynthID是Google DeepMind在2023年推出的AI内容水印系统,最初用于图片,后来扩展到音频和视频。原理是在生成内容里嵌入一个人类无法感知的模式,专门的检测器可以把它找出来,从而判断这段内容是不是AI生成的、是哪个平台生成的。

    今年5月的Google I/O上,Google宣布了一个”SynthID联盟”——OpenAI、英伟达、ElevenLabs、Kakao都承诺采用这个标准。这是AI行业少有的”主动给自己套绳子”的时刻:大家同意在自己的输出里加标记,让外界能追溯来源。当时这还只是一个承诺,ElevenLabs现在是第一个真正把这件事跑通的上线案例。

    “人们应该知道自己在和AI互动。随着我们的语音、音乐和音效模型越来越好,我们希望人们能够识别一段音频是否由AI生成,而且不需要专业工具。”——ElevenLabs产品团队

    水印能解决什么问题

    最直接的用途是溯源。如果有一段可疑的音频在传播,用ElevenLabs的免费音频检测器(Audio Detector)扫一下,就能知道是不是ElevenLabs生成的。这对打击深伪诈骗和虚假音视频有直接帮助。

    但这事也有局限性。水印只能证明”这段音频是ElevenLabs生成的”,不能证明”这段音频是某某人说过的”。如果有人用ElevenLabs克隆某人的声音去诈骗,水印能告诉你是ElevenLabs生成的,但没法直接告诉你克隆的是谁。要真正解决问题,还需要平台、法律、用户教育一起上。

    另一个现实问题是:水印只覆盖愿意加它的人。如果有人用没有水印的开源模型生成音频,这套体系就失效了。所以SynthID联盟的意义在于,让主流平台都加入,至少大部分商业AI音频是有标记的。

    ElevenLabs在博客里还提到,他们正在推动把SynthID加入C2PA的软绑定列表。C2PA是一个内容来源认证标准,能让被删掉元数据的内容重新”找回”自己的来源信息。这两个标准如果能打通,AI内容的溯源体系会更完整。

    监管压力是背后的推手

    越来越多的司法管辖区要求AI生成内容必须以机器可读的方式标注为”合成内容”。欧盟AI法案里有相关条款,美国各州也在推类似立法。对ElevenLabs来说,提前把水印做好,比事后被监管强制要求要主动得多。

    而且ElevenLabs本身也面临过滥用问题。2024年有过一波用ElevenLabs克隆名人声音制作深度伪造音频的事件,当时公司加强了安全审核。水印是又一层防护——就算有人绕过审核生成了不当内容,至少事后能追查来源。

    接下来,OpenAI、英伟达那边什么时候跟上,是业界最关注的。Google说它们都会用SynthID,但承诺和实际落地之间还有距离。ElevenLabs先走了一步,对其他平台是个压力,也是个参考。


  • 特朗普政府提议取消自动驾驶汽车刹车踏板要求,特斯拉Cybercab离上路更近了

    一个刹车踏板的存废,牵动整个自动驾驶行业的命运

    美国交通部这个提议听起来有点反直觉——允许自动驾驶汽车不带刹车踏板。但这恰恰是特斯拉Cybe​​rcab这类产品真正上路必须要跨过的监管门槛。现行联邦机动车安全标准(FMVSS)要求每辆车都必须配备刹车踏板,哪怕这辆车从设计上就没人开。特朗普政府现在想把这条改掉。

    国家公路交通安全管理局(NHTSA)管理员Jonathan Morrison在声明里说得很直白:”我们正站在自Model T以来车辆技术领域最大技术革命的边缘。如果想让美国领先,就得重新想象我们的监管框架。”这话的背景是,中国和其他国家在自动驾驶上也在加码,美国监管如果跟不上,优势就没了。

    特斯拉Cybercab概念车
    特斯拉Cybercab:没有方向盘,没有踏板,监管却还没跟上 | 图片来源:Tesla

    特斯拉等了很久的绿灯

    特斯拉过去几年一直在开发那辆两座Cybercab,定位就是完全自动驾驶、没有方向盘也没有踏板。马斯克这些年反复说,一旦监管批准,就能全国部署。但现实是,特斯拉从来没去申请FMVSS豁免——因为豁免就算批了,数量也有限制,不是真正的规模化路径。

    现在NHTSA的提议是直接改标准,而不是搞豁免。这意味着车企可以从设计阶段就按”无踏板”来走,不用每次都去华盛顿求情。对特斯拉来说,这比啥都管用。

    NHTSA表示,移除刹车踏板等部件要求”理论上将让车企能更快地把自动驾驶汽车推向道路”。

    当然,特斯拉现在也没闲着。过去一年在奥斯汀运营了一小片robotaxi服务,刚开始副驾有安全员,后来逐步撤掉,变成”无人监督”运行。不过NHTSA披露,特斯拉承认在用远程操作员——低速情况下远程介入,处理障碍物或事故后移动车辆。这说明完全无人化还没到那一步。

    不只是特斯拉受益

    Zoox(亚马逊旗下)其实是更典型的例子。他们造了一辆从头就是为自动驾驶设计的小巴式robotaxi,去年好不容易拿到FMVSS豁免才能演示,现在还在等商业化运营的豁免。如果标准直接改了,第二波、第三波产品就不用再走这个流程。

    Waymo相对好办一些,因为他们用的是改装版现有车型(捷豹I-Pace),本来就有方向盘和踏板,不受这个限制。但Waymo也在研发下一代没有手动控制的车辆,到时候同样会碰到这个问题。

    这个提案现在进入30天公众意见征集期。也就是说,接下来一个月,车企、安全倡导组织、竞争对手都会进来表态。最终是否生效,还得看DOT的决定。但从特朗普政府一连串动作来看——包括之前NHTSA提议取消雨刮器和除雾系统要求——方向是很明确的:能减就减,别让监管拖住创新。

    安全问题谁来管

    支持方的逻辑是:如果一辆车从设计上就没有驾驶员,刹车踏板就是个摆设,还可能增加成本和复杂度。NHTSA说他们会”加强对根本安全标准的要求,并让AV开发方对安全性能负责”——意思是,踏板可以不要,但安全不能含糊。

    但安全倡导组织肯定不这么看。没有刹车踏板的车,万一系统宕机了怎么办?乘客能做什么?这些问题不是技术白皮书能回答的,得真出点事才会有定论。30天意见期里,这类声音估计不会少。

    这件事更大的背景是中美在自动驾驶上的竞争。中国北京、上海、深圳的robotaxi已经跑了一段时间,监管上也在摸索。美国如果率先在联邦层面放开”无踏板”设计,对特斯拉和Zoox出海可能是个卖点——当然,前提是自己国内先跑通。


  • Gemini 3.5 Pro跳票到7月,谷歌在最不该慢的时候慢了

    谷歌AI人才流失概念图
    Gemini 3.5 Pro推迟发布之际,谷歌正面临顶尖AI研究员持续流向Anthropic和OpenAI的尴尬局面

    谷歌原本计划6月发布Gemini 3.5 Pro,现在推迟到了7月。单独看这件事,其实没什么大不了——让模型多喘口气、多改几版再发布,总比赶工出来一个半成品强。但问题是,这个推迟发生的时机实在太不凑巧了:同一周里,Transformer架构的共同作者Noam Shazeer离职去了OpenAI,诺贝尔化学奖得主John Jumper离职去了Anthropic。模型晚几周发布可以等,人才往外走这件事等不了。

    谷歌这周失去的不仅仅是几个研究员

    Shazeer这个名字在AI圈分量很重。2017年那篇”Attention Is All You Need”论文,他是共同作者之一,Transformer架构就是那篇论文里提出来的。谷歌在2024年花了27亿美元以acqui-hire的方式把他从Character.AI请回来主导Gemini项目,结果不到两年,他又走了,这次是去OpenAI。

    Jumper的离开在另一个维度上更伤——他领导的AlphaFold项目拿了2024年诺贝尔化学奖,这是谷歌DeepMind迄今为止最干净利落的科学成果。AlphaFold团队的核心成员跟着Jumper一起走,基本上等于把DeepMind这几年最亮眼的一张牌整个搬到了Anthropic。

    Alphabet的股价在6月22日跌了5%,2250亿美元的市值就这么蒸发了。市场反应不一定理性,但市场担心的东西很具体:前沿AI实验室同时在抢芯片、抢客户、抢分销渠道,而这些竞争的背后归根结底是抢人。谷歌在前面两项上有优势,在”抢人”这一项上不能出问题。

    企业买家关心的不仅仅是模型本身

    Gemini 3.5 Pro的延迟发布本身并不是致命伤。谷歌说推迟是为了收集早期测试用户的反馈,对模型做进一步优化,这个说法站得住脚。企业客户也不希望拿到一个匆忙上线、跑真实工作流就出问题的模型。

    但企业客户买AI模型的时候,看的不只是眼前这个版本好不好用,他们也在押注接下来半年到一年的路线图——下一版模型什么时候出、质量怎么样、做这个模型的人还在不在这个实验室里。当Shazeer和Jumper在同一周宣布离职,企业CIO做决策时的信心就会打个折扣。这个折扣不一定是理性的,但采购决策从来不纯粹是理性计算。


    谷歌并不是输了,但它需要证明更多

    把话说回来,谷歌DeepMind仍然拥有巨大的计算资源,Gemini通过Search和Workspace的分发渠道也是竞争对手眼馋的。Gemini 3.5 Pro完全有可能在7月发布一个质量很高的版本,把这一轮的注意力重新拉回来。

    真正的问题是信心。Anthropic靠着Claude在开发者社区里积累了很强的口碑,尤其是在代码生成这块;OpenAI有最强的消费者拉力和平台生态。谷歌不能只靠提醒所有人”Transformer是我们发明的”来赢这一局,它得持续证明前沿AI可以走得足够快,而且做这个研究的最优秀的人还愿意留下来。

    7月的发布会是一个观察窗口。如果谷歌能拿出一份足够硬核的基准测试数据、清晰的价格方案,以及开发者社区的积极反馈,那么6月的这次推迟和人才流失就会变成脚注。如果发布含糊其辞、细节有限,竞争对手会用这个空隙做文章。


    这一轮AI人才战的背后还有一个容易被忽略的驱动力:IPO预期。Anthropic和OpenAI都在筹备上市,在上市前进去拿股权,对于谷歌内部的顶级研究员来说是一个很难拒绝的财务激励。谷歌可以给高薪,但给不了上市前股权的倍数增长空间。这个结构性因素不会在短期内消失,谷歌需要想清楚除了薪资之外还能给顶尖研究员提供什么——这个问题,6月的这一周把它摆到了台面上。

  • 不做芯片做软件,Sail用8000万美元赌AI推理可以更便宜

    AI推理优化概念图
    Sail Research用软件优化替代定制芯片,把AI推理成本压到对手的十分之一

    everyone都在造芯片,Sail说软件就够了。这家刚刚冒出头的初创公司本周宣布完成8000万美元融资,估值4.5亿美元,由Kleiner Perkins和Sequoia联合押注。它的主张听起来有点反潮流——当OpenAI在做Jalapeño芯片、谷歌有TPU、亚马逊有Trainium的时候,Sail说光靠软件优化就能把AI推理成本压到对手的十分之一。

    长周期智能体才是主战场

    Sail Research的平台专门跑”长周期”AI智能体——就是那些需要连续工作数小时甚至数周才能完成的任务。它在Linux虚拟机(叫Sailboxes)里运行智能体,开发者可以自定义每个虚拟机的软件环境。关键是,当智能体在等待外部系统返回数据时,Sail会把整个智能体关掉,不再烧钱,等数据回来了再继续。这个设计思路很直接,但确实能省不少钱。

    他们在BrowseComp-Plus基准测试上拿了90.72%的分数,同时推理成本只有对手的十分之一。这个成绩单够亮眼,但真正有意思的是它背后的逻辑:大部分企业根本造不起自己的定制芯片,但它们可以在现有的英伟达GPU上跑Sail的软件层,达到类似的效率提升。

    Sail的CEO Neil Movva说得很直白:人类用电脑最看重速度,但智能体最需要的是规模、可靠性和可持续的成本。这句话其实点出了当前AI基础设施争论的核心——我们到底是在为什么买单?

    定制芯片 vs 软件优化,两条路都能走通

    这一轮AI基础设施的竞争,某种程度上分裂成了两个阵营。一边是”算力派”,认为推理成本的根本解法是定制芯片——OpenAI找Broadcom做Jalapeño,谷歌继续迭代TPU,亚马逊推Trainium,都在走这条路。另一边是”效率派”,认为现有的GPU已经够强,问题出在软件层没有把硬件能力吃干榨净。

    Sail属于后者。它改写了多个开源推理引擎,用了一套自己优化的算法来提升显存利用率。效果据称不错,但这个说法需要打一个问号:基准测试的跑分环境和真实生产环境往往是两回事,90.72%的分数能否在客户的实际工作负载上复现,还得等产品正式铺开才知道。


    投资者阵容值得注意

    这一轮的投资者名单里有两个名字很显眼:Intel CEO Lip-Bu Tan和Alphabet董事长John Hennessy。Hennessy的身份尤其微妙——他既是谷歌的董事长,又投了一家说”软件优化可以替代定制芯片”的初创公司。不管这在战略上意味着什么,至少说明业界对AI推理成本问题的关注度已经非常高了。

    Kleiner Perkins和Sequoia同时进场也是一个信号。两家顶级VC在同一个轮次里联手,通常意味着他们判断这个赛道已经过了”要不要做”的阶段,现在的问题是”谁能先做出来”。Sail的4.5亿美元估值不低,但它面对的是一个实实在在的市场需求:企业用完AI之后发现账单比预期厚得多,它们愿意为任何能压低成本的技术方案付钱。


    这一轮融资的时间点选得有点巧——正好是OpenAI官宣Jalapeño芯片之后没几天。两件事摆在一起看,像是一场关于”AI推理成本到底该怎么降”的公开辩论。OpenAI选了最难的路(自己做芯片),Sail选了最快落地的路(软件优化)。两条路都能走通,但受益的客户群不太一样:超大规模云厂商有能力做定制芯片,普通企业只能靠软件层省成本。

  • 高通想做下一个英伟达,先掏出了Dragonfly CPU

    高通Dragonfly CPU
    高通发布Dragonfly C1000 CPU,进军AI数据中心市场 | 图源:生成图

    美东时间6月25日,高通在纽约举办了2026投资者日暨股东大会。这场活动之前,市场对高通能不能在AI数据中心市场分一杯羹持怀疑态度——毕竟这个市场已经被英伟达、AMD和英特尔盯住了。但高通拿出来的一套完整产品路线图和一份大幅上调的财务指引,让股价在盘后直接涨了13%。

    Dragonfly C1000:专为AI智能体设计的CPU

    高通在投资者日上正式发布了Dragonfly C1000处理器。这款芯片的定位很明确:不是给普通服务器跑数据库的,是给AI智能体用的。随着自主智能体(Agentic AI)快速普及,CPU需要承担越来越多原本由GPU处理的任务——智能体要持续思考、调用数据库、执行代码,如果CPU跟不上,GPU就只能干等着,而GPU闲置对数据中心来说就是直接亏钱。

    高通的差异化优势在于功耗。做了几十年手机芯片的人,最知道怎么在性能和处理功耗之间找平衡。现在数据中心扩建最大的瓶颈不是芯片性能,是电力——各大云厂商都在为能耗发愁。高通把在手机和边缘计算上积累的能效技术搬到数据中心,正好打在了痛点之上。

    高通CFO Akash Palkhiwala在会后接受采访时说得很直白:”CPU市场供给不足,行业需要更多具备成熟技术能力的参与者。”言下之意:英伟达和AMD的CPU供应跟不上需求,高通来补这个缺口。

    Meta已经下单,2028年量产即部署

    发布的同时,高通宣布了一个重量级合作:Meta将在2028年Dragonfly C1000量产阶段大规模部署这款芯片,双方已签署长期供货协议。对高通来说,拿下Meta这样的头部云厂商的订单,是对产品竞争力的最好背书。

    除了Meta,高通还透露已经拿到两家超大规模云服务商(hyperscaler)的定制芯片大额订单,定制芯片业务将逐步兑现规模化收入。高通CEO Cristiano Amon说,高通和云厂商的合作”不是从零起步”——凭借手机芯片和边缘计算产品,高通早已和全球几乎所有头部云厂商建立了稳定合作关系。

    收购Modular,对标英伟达CUDA

    硬件之外,高通同步宣布收购AI软件公司Modular。这笔交易的对价是不超过1920万股高通普通股,按高通周二收盘价计算,价值约39.2亿美元。Modular拥有Mojo编程语言、MAX推理平台和AI编译器,这套软件体系可以实现AI应用在不同芯片架构上高效运行——高通明说,这个技术栈要对标的是英伟达的CUDA。

    CUDA是英伟达最深的护城河。无数AI应用和模型都基于CUDA开发,换不了平台,用户就被锁住了。高通收购Modular,就是要打通从芯片硬件、编译工具到模型部署的全链条,复制英伟达靠软硬件协同构筑行业壁垒的路径。这个算盘打得清楚:光有芯片不够,得有软件生态才能留住客户。


    财务指引大幅上调,股价盘后涨13%

    这次投资者日最刺激市场的地方,是高通大幅上调了中长期营收指引。2029财年非手机业务营收指引从原来的220亿美元上调至400亿美元,增幅接近91%。汽车业务的设计订单总价值已扩容至650亿美元,2029财年汽车板块收入目标提高至100亿美元。

    手机芯片一直是大通的基本盘,占最近季度总营收的三分之二。但全球智能手机出货量早在2017年就见顶了,增长空间有限。高通过去几年持续向智能汽车、机器人和云端算力倾斜资源,这次的财务指引上调,算是给市场交了一份多元化转型的时间表。

    多重利好催化下,高通股价在会后盘后交易中大涨13%。市场用钱投票,表达了对高通进军数据中心算力市场的看好。至于高通能不能真的从英伟达、AMD和英特尔手里抢到市场份额,接下来几年见分晓。

  • 特朗普政府拦下GPT-5.6,OpenAI只能先给少数人用

    OpenAI GPT-5.6延迟发布
    特朗普政府要求OpenAI分阶段发布GPT-5.6 | 图源:生成图

    这件事发生在本周三(6月25日)OpenAI的内部员工Q&A上。据The Information报道,Sam Altman告诉员工,GPT-5.6不会像以往那样直接公开发布,而是先以”有限预览”的形式,只给一小群企业客户用。在这个预览期里,美国政府会逐个审批客户访问权限。

    政府把关,客户一个一个批

    按照Altman对员工的说法,GPT-5.6不会直接对公众开放,而是先进入”有限预览”阶段——只给一小群企业客户用。在这个预览期里,美国政府会逐个审批,决定哪家公司能拿到访问权限。

    如果这段有限发布进展顺利,OpenAI希望”几周后”再扩大范围,做更广泛的发布。但这个”几周”到底是什么时候,目前没人知道。

    据The Information报道,Altman在本周的公司内部Q&A上向员工传达了这个消息。他说政府会”逐客户审批”访问权限。值得注意的是,Altman还提到,OpenAI的员工如果对此有异议,也得配合执行。

    Anthropic的遭遇更惨

    同样被政府盯上的还有Anthropic。本月早些时候,Anthropic收到最后通牒:必须暂停Mythos 5和Fable 5这两个先进模型的访问。政府还出台了一项出口管制指令,禁止”外国公民”访问这些技术——这甚至包括了Anthropic自己那些不是美国公民的员工。

    相比之下,OpenAI拿到的条件算”客气”的了。但问题在于,这种监管力度是不对称的。政府对待不同的AI公司,标准明显不一样,这让整个行业都开始担心:下一个被盯上的会是谁?

    特朗普的”放手”承诺去哪了

    这事儿最讽刺的地方在于,特朗普政府上台时明明承诺过对AI采取”放手”态度,要”速度取胜”,还鼓励美国AI出口。结果现在,政府却在用一种相当直接的方式介入前沿模型的发布节奏。

    本月早些时候,特朗普签署了一项行政令,要求特定AI公司在公开发布新模型之前,先自愿提交给政府做测试和评估。这个”自愿”到底有多自愿,从OpenAI和Anthropic的遭遇来看,答案已经很明显了。


    网络安全模型:真正的威胁还是营销噱头

    政府担心的具体是什么?据TechCrunch的分析,核心顾虑在于像Mythos这样的前沿网络安全模型。这类模型理论上能以人类分析师无法企及的速度发现和利用软件漏洞——而很多软件系统里都藏着这样的漏洞,等于给攻击者留了后门。

    但问题是,这些模型目前都不对外开放。它们到底有多危险,外界其实没法验证。这也让一些人怀疑,Anthropic口中的”安全风险”到底有多少是真实的,又有多少是营销话术——毕竟,把模型包装成”太危险不能随便给你用”,也是一种很有效的产品定位。

    不管真相如何,政府介入AI模型发布这件事,已经从一个假设变成了现实。接下来几个月,AI行业的游戏规则可能会因为这件事发生根本性的改变。

  • 内存芯片紧缺让美光赚翻了,AI算力狂潮背后的隐形赢家

    美光内存芯片与AI算力
    美光科技正在从AI内存芯片紧缺中收获惊人的增长

    AI热潮捧红了一堆创业公司和亿万富翁,但它还造成了一个不那么明显的结果:内存芯片严重紧缺。这个问题预计会持续到2027年,而最大的美国内存芯片制造商美光(Micron),正在成为这场”RAMageddon”里最耀眼的赢家。

    从830亿到1.2万亿,美光的股价坐了火箭

    2024年初,美光的股价还在83美元左右徘徊,市值大约910亿美元。而本周,美光的股价已经冲破1048美元,市值站上1.2万亿美元。

    这个涨幅有多夸张?不到两年半的时间,股价翻了超过12倍。带动这一切的核心动力只有一个:AI。

    AI模型对内存的需求是出了名的贪婪。训练要内存,推理也要内存,而且随着模型越来越大,这个需求还在加速。美光作为全球最主要的内存芯片供应商之一,站在了这场需求爆炸的正中央。

    财报数字让人咋舌

    美光本周三收盘后公布了第三财季财报,数字让华尔街分析师集体重新审视自己的模型。营收同比翻了四倍,达到414.5亿美元;净利润从去年同期的18.8亿美元暴涨到282亿美元。

    财报发布后,美光股价当天飙升超过13%。公司对第四财季的指引同样亮眼:预计营收在490亿到510亿美元之间。

    这些数字背后是一个简单的供需逻辑:AI数据中心对HBM(高带宽内存)和企业级DRAM的需求远超供应,美光手里握着的订单已经排到了未来几个季度。

    跟Anthropic绑在了一起

    美光这周还有一件事值得注意:它跟AI实验室Anthropic签了一份战略协议,将向Anthropic供应内存和存储芯片。更意味深长的是,美光还参与了Anthropic的最新一轮(Series H)融资——虽然它没有披露具体投了多少钱。

    这个动作很有意思。芯片厂商投资AI实验室,本质上是在用资本绑定未来的客户需求。Anthropic现在是Claude的开发者,也是AI领域最炙手可热的公司之一。美光通过投资锁定供应链关系,这步棋下得相当精明。

    消费者也在为内存紧缺买单

    内存芯片紧缺不只是企业端的问题,它正在向消费端传导。苹果CEO库克一周前刚警告说,苹果产品涨价已经不可避免——背后的重要原因之一就是内存成本飙升。

    这波涨价会落到每一个买手机、买电脑的消费者头上。AI很酷,但买单的不只是科技巨头,还有每一个普通用户。


    美光的狂欢能持续多久?这个问题没有确定答案。内存芯片行业的周期性是出了名的,供不应求可以在几个季度内变成供过于求。但至少在目前,AI算力扩张的势头还没有放缓的迹象,美光的好日子可能还会持续一段时间。

    对于那些还在犹豫AI基础设施投资机会的人来说,美光的股价走势提供了一个参考:在AI浪潮里,不一定非要去投模型公司,给这些公司提供”粮食”的芯片厂商,可能是更稳的赌注。

  • Notion Mail宣布关闭,AI智能体正在吃掉独立应用的地盘

    AI智能体接管邮件管理
    Notion Mail的退场,折射出AI智能体对软件交互方式的根本性重塑

    Notion本周宣布,将于9月22日关闭其邮件产品Notion Mail。表面上看,这是一个产品的退场;实际上,它折射出的是AI智能体对软件交互方式的一次根本性重塑。

    一半用户不打开收件箱了

    Notion在X上发帖解释了关闭原因:随着Notion的智能体能力越来越强,他们观察到越来越多用户把邮件工作流直接交给智能体处理,超过一半的Notion Mail用户管理邮件时根本不会打开收件箱

    一个邮件客户端的产品,有一半用户不打开收件箱——那他们还用什么?用智能体。智能体帮他们分类、帮他们起草回复、帮他们决定哪些邮件需要人工介入。收件箱这个存在了几十年的概念,正在被智能体架空。

    Notion的决定很直接:既然用户已经不怎么开收件箱了,那就别维护一个独立的邮件客户端了,全力做智能体。

    从收购Skiff到关闭Mail,只用了两年

    Notion Mail这个产品本身的历史并不长。2024年,Notion收购了注重安全的生产力创业公司Skiff,随后在同年10月以预览模式推出了邮件产品,2025年4月才正式开放给用户使用。

    它的卖点是把邮件和Notion AI打通,自动标签、智能过滤、帮你安排日程。对手也不少:Superhuman在做”最快的邮件体验”,Fyxer在用AI帮你写邮件,现在又冒出来一个AgentMail,今年3月刚融了600万美元,专门做”给AI智能体用的邮件服务”。

    Notion Mail从推出到关闭,满打满算也就两年。这个节奏在AI时代已经不算短了——但跟智能体的发展速度比起来,还是慢了一拍。

    “智能体优先”正在成为现实

    以前的产品逻辑是:做一个应用,用户打开应用,在应用里完成操作。现在的逻辑正在变成:智能体在后台跑,用户只在需要的时候才介入。收件箱、日历、待办列表——这些”控制台”式的界面,存在的必要性正在被质疑。

    另一个是独立AI邮件工具的生存空间问题。Notion有智能体底层,可以顺势把邮件功能整合进去。但那些专门做AI邮件的工具呢?Superhuman还在坚持做”更快的邮件体验”,但它最近收购了GPTZero——一个用来检测AI生成内容的工具。这个动作本身就在说明,Superhuman也在重新思考自己的定位。


    AgentMail的思路更激进:它要做”给智能体用的邮件服务”,人类用户不是目标用户。这个方向跟Notion Mail的关闭其实是一回事——邮件作为人类直接操作的界面,价值正在缩水。

    从更大的视角看,这件事不只是邮件客户端的问题。AI智能体正在逐步接管用户在各个应用里的操作。记事本、日历、项目管理工具——这些工具的”入口”属性都在被削弱。用户跟系统的交互方式,从”打开应用-操作-关闭应用”,变成”告诉智能体想要什么-智能体搞定”。

    这个转变对创业公司的启示很直接:做一个好用的独立应用仍然有价值,但更重要的可能是,你的产品能不能被智能体调用。能被智能体整合的工具,比不能被整合的工具活得久。

    Notion Mail的关闭不是第一个,也不会是最后一个。AI智能体对软件形态的重塑,才刚刚开始。

  • AI智能体要上线,先在一个人造世界里被折磨一遍——Patronus AI的生意经

    Patronus AI数字世界测试AI智能体
    图片来源:AI生成概念图

    AI智能体越来越能干,从回答问题到自主执行多步骤复杂任务,进展快得让人有点慌。但有一个问题一直没被很好解决:你怎么在智能体上线之前,确信它在各种奇怪场景下都不会搞砸?

    Benchmark分数再高,也不等于真实世界能用。这就是Patronus AI在做的事情——他们给AI智能体造”数字世界”,让智能体在里面被压力测试,直到开发者有信心把它放出来。

    两个前Meta AI研究员,盯上了AI安全测试这个坑

    Patronus AI成立于2023年,创始人是两位前Meta AI研究员Anand Kannappan和Rebecca Qian。他们的判断很直接:AI实验室用来展示实力的benchmark,跟智能体真实表现之间的关系,远没有大家以为的那么紧密。一个智能体在benchmark上拿了高分,放到真实环境里可能犯一些你完全没预料到的错误——而且它犯错了你还可能不知道。

    Patronus的做法是造”数字世界模型”——把网站和内部系统做成可交互的仿真环境,让智能体在里面跑,用强化学习的方式迭代:做对了给奖励,做错了罚。这个过程可以跑很久,Kannappan说他们想让智能体在环境里跑10小时、10天甚至10周。

    他们拿Waymo做类比:Waymo在真实道路上测试之前,先用合成世界模拟了无数种极端场景——暴雨、小孩追球冲上马路——这些在真实世界里可能几年才碰到一次,但在仿真里可以批量生成。

    智能体最擅长的事,是走捷径

    Patronus的投资方Notable Capital的Glenn Solomon说了一句话很到位:智能体最擅长的事,是走捷径。它们会找到一种表面上完成任务、实际上偷工减料的方式,然后你就以为它工作了。Patronus的价值就在于能发现这些”hack”,逼模型真正把任务做对。

    目前他们主攻软件和金融科技这两个方向。选这两个领域不是偶然的:任务是否完成是可以被验证的(verifiable),你跑一段代码看能不能编译、下一笔单看账户余额对不对,都是有客观标准的。Kannappan说,那些”很难验证”的领域(比如创意写作、开放式对话)他们暂时还没碰。

    营收一年涨15倍,几乎每个前沿AI实验室都是客户

    这种需求有多旺盛?Patronus的营收过去一年涨了15倍。这轮5000万美元的B轮由Greenfield Partners领投,Notable Capital、Lightspeed、Datadog、三星跟投。加上之前的融资,总共融了7000万美元。

    Solomon说,几乎所有前沿AI实验室和很多AI创业公司都是他们的客户,需求几乎吃不饱。这个数字听着夸张,但想想现在每家做AI智能体的公司都面临同一个问题:怎么向上面交差,证明自家的智能体”可靠”?如果这个需求是真实的,Patronus确实踩在了正确的时间点。

    竞争对手方面,Patronus主要不是在跟另一家公司抢客户,而是在跟AI实验室自己的内部评估团队抢。每家AI大厂其实都在做自己的测试框架,只是做得够不够好另说。另外一些人肉数据公司(比如Mercor和Surge)也在做跟强化学习相关的数据服务,但Patronus的区别是”不需要人参与”——评估过程完全自动化。


  • Claude正在从ChatGPT手里抢付费用户,这件事比看起来有意思得多

    Claude与ChatGPT竞争付费用户
    图片来源:AI生成概念图

    过去一年,如果你问一个普通人”你用哪个AI助手”,十有八九会听到”ChatGPT”。这个认知优势太大了,OpenAI几乎把”AI助手”这个品类变成了自己的代名词。但事情正在起变化——而且变化的方式,可能连Anthropic自己都没完全预料到。

    信用卡交易分析公司Indagari刚放出一组数据,看了会让人重新思考”AI消费者市场”这个词的真正含义。他们分析了2800万美国消费者的匿名信用卡交易,时间跨度从2025年到2026年5月10日。数据不能告诉你Anthropic exact营收是多少,但足以看清趋势——而趋势是:Claude的付费用户和收入,逐月增长,2026年1月以来涨了大约75%。

    三月那一波增长,背后有个意想不到的原因

    有意思的是,三月份Claude付费用户曾经出现过一波 spikes——而那波增长的触发事件,是Anthropic公开拒绝让自家的模型被特朗普政府用于对美国人的大规模监控和自主武器。这件事在消费者端激起的反响,比任何营销活动都管用。

    通常情况下,跟政府对着干会让一家公司丢掉客户。但Anthropic的情况似乎相反——消费者用钱包投了票,告诉他们”继续这样做”。这件事本身值得写一篇文章,但这里先说数据。

    DataCamp上的搜索数据更夸张

    在线教育平台DataCamp(约2000万用户)提供另一个角度的佐证。今年开始,”Claude”成了他们网站上被搜索次数最多的词——比”AI”这个词本身还多。而在自学消费者中,Claude课程的需求量是ChatGPT的三倍。过去30天里,Claude课程的需求涨了18倍。

    这个数据读起来有点反直觉。ChatGPT在企业培训市场仍然遥遥领先,毕竟大多数公司采购的是ChatGPT Enterprise。但个人消费者——那些自己掏腰包付订阅的人——正在用行动表明他们更喜欢Claude。

    一个合理的解释是:Claude在编程、写作、分析等长文本任务上的体验,让一批”重度用户”彻底转了阵营。这群人愿意付钱,而且付得不少。

    当然,把ChatGPT拉下马还早得很。Sensor Tower的数据清清楚楚:ChatGPT的体量仍然大得多,只是最近增长没那么猛了(部分原因是基数已经太大)。Indagari的数据也显示ChatGPT的付费用户绝对数更多。但Claude在”消费者付费意愿”这个维度上的追赶速度,已经快到让OpenAI不能忽视。

    IPO前夕,这份数据来得正是时候

    Anthropic和OpenAI都在准备上市。在这个时间点上,能拿出一份”消费者端也在增长”的数据,对Anthropic的估值故事很重要。此前Anthropic给外界的印象是”企业级AI”和”开发者工具”(Claude Code确实很强),消费者市场似乎不是他们的主战场。现在看来,这个叙事需要更新了。

    不过也有个阴影笼罩着这份增长数据。本月早些时候,美国政府对Anthropic出了狠招——禁止其最强的网络安全模型Mythos 5和Fable 5被非美国人使用,Anthropic干脆把这两个模型暂时从市场上撤了下来。这件事对国际用户的影响有多大、会否拖累增长,目前还没有数据。但到目前为止,能看到的每一份数据都显示Anthropic还在涨。