博客

  • Meta悄悄做了个新App:Forum想让你在Facebook群组里用AI聊天

    Meta前几天偷偷上架了一个iPhone应用,叫Forum。看名字你可能没感觉,但这东西其实就是把Facebook群组从主应用里”拆”出来,做了一个独立的地方,还塞了一个AI聊天机器人在里面。

    Meta Forum App
    Meta新推出的Forum应用,专为Facebook群组设计

    为什么要把群组”拆”出来

    这件事得从用户行为说起。不知道你有没有发现,现在很多人搜东西,会在谷歌搜索后面加个”Reddit”——因为他们想看真人怎么说的,而不是SEO优化过的营销内容。

    Meta肯定也注意到这个趋势了。人们去Facebook群组,本质上也是在找”真实人类的观点”。但问题是,Facebook主应用太臃肿了,信息流、广告、推荐内容混在一起,找群组里的历史讨论真的累。

    Forum的定位很明确:它想做一个”部分像Reddit、部分像Facebook、部分像谷歌AI概览”的东西。核心思路是——你要找信息,不用出Meta的生态。

    AI聊天机器人是核心,不是摆设

    Forum里内置了一个AI聊天机器人,这个设计挺聪明的。Facebook群组有个长期痛点:很多有价值的信息埋在几年前的对话串里,你根本翻不到。

    这个AI机器人干的事,本质上就是帮你”搜”群组里的内容,但它不是给你一个搜索结果列表,而是直接用对话的方式把答案告诉你——就像谷歌的AI概览那样,只不过信息来源是你的群组。

    对Meta来说,这个设计有个很大的好处:用户不用跳到外部搜索引擎或者Reddit去搜同样的问题了,他们直接在Forum里就能拿到”社区驱动的答案”。


    这不是Meta第一次做群组独立App

    有意思的是,Meta(那时候还叫Facebook)其实2017年就做过一个独立群组应用,后来给关了。这次的Forum,某种程度上是那个失败项目的”AI增强复活版”。

    但这次的逻辑不太一样。2017年那个,基本上就是把群组功能原封不动搬到一个新应用里。这次的Forum,从设计思路上就是围绕”AI优先”来的——搜索、信息提取、内容导航,都是AI先上,然后才是传统的信息流。

    而且Forum不会替代主Facebook应用里的群组功能。它是一种”分流”:想要沉浸式刷信息流的,继续用主应用;想要高效找信息、参与专业讨论的,来Forum。

    竞争逻辑:守住自己的流量

    如果把这件事放在更大的背景里看,Forum其实是Meta对Reddit和ChatGPT的一种防守反击。

    Reddit这几年吃掉了大量”找真实答案”的搜索流量,很多人甚至已经不去谷歌了,直接去Reddit搜。而ChatGPT这类AI搜索工具,也在侵蚀传统搜索引擎的领土。

    Meta的算盘是:我手里有几百万个Facebook群组,里面全是真实人类的讨论。如果我能用一个AI机器人把这些内容”激活”,让用户不用离开我的生态就能拿到他们想要的答案,那我不就同时挡住了Reddit和AI搜索工具的进攻吗?

    这个逻辑能不能跑通,现在还不好说。但至少从战略意图上看,Forum是Meta在”社交+AI”这个方向上一次挺认真的尝试。

    会有一些有意思的可能性

    如果Forum真的做起来了,可能会出现一些挺有意思的场景。比如你加入一个摄影群组,不用翻几年的 old posts,直接问AI”这个镜头适合拍人像吗”,它就能把群组里所有相关的讨论帮你总结出来。

    或者加入一个育儿群组,问”两岁宝宝不爱吃饭怎么办”,AI给你的是几百位真实家长的经验,而不是百度百科上冷冰冰的文字。

    当然,这一切的前提是:Meta得让用户愿意下载一个额外的App。在2026年的今天,这件事本身就不容易。

  • Anthropic Project Glasswing:用Claude揪出10000个漏洞,网络安全游戏规则变了

    前几天翻到Anthropic的一个项目更新,有点震惊。他们搞了个叫Project Glasswing的东西,拿Claude Mythos Preview去扫那些”系统重要性软件”的代码,一个月不到,找出了一万多个高危和严重级别的漏洞。

    Anthropic Project Glasswing
    Project Glasswing使用Claude Mythos Preview识别软件漏洞

    一个月一万多个漏洞,这是什么概念

    先说这个数字。一万多个高危/严重漏洞,不是那种”你的按钮颜色不对”级别的bug,是真正能被恶意利用、搞垮系统的那种。Anthropic说他们用的是”系统重要性软件”——就是那些全世界都在用、但你可能没意识到它存在的基础库和关键基础设施代码。

    传统的安全审计,一个团队花几个月才能把一个大型项目扫一遍。Claude Mythos Preview这个速度,基本是把”发现漏洞”这个步骤给工业化了。

    Claude Mythos Preview的能力在于理解复杂代码的结构,找出传统扫描器会漏掉的深层安全缺陷。这不是简单的模式匹配,而是真正的”理解”代码在做什么。

    瓶颈转移了:从”找漏洞”到”修漏洞”

    这个项目最让我感兴趣的地方,不是”AI找到了很多漏洞”这件事本身,而是它暴露出来的新问题:现在找漏洞已经不是瓶颈了,怎么验证、怎么披露、怎么修,这才是卡住的地方。

    想象一下,你的AI一天给你报几百个可能的漏洞,你得一个个去看它是不是真的、危害有多大、怎么修。AI把”发现”的成本几乎降到了零,但”验证和修复”还是得人来干。Anthropic在更新里也承认了这一点——现在的瓶颈是人的速度,不是AI的速度。


    50个机构一起上,但细节要等90天

    Anthropic不是自己单干,他们拉了大概50个组织一起做这个项目。有开源社区的人,有软件厂商,也有安全机构。想法很简单:关键基础设施的安全是公共品,大家一起护。

    但他们执行的是一个相当严格的”协同漏洞披露”政策:发现漏洞之后,最多90天(或者补丁发布后45天)才会公开细节。理由也很充分——如果Anthropic今天发现了一个漏洞,明天就把细节发出去,那在开发者把补丁做出来之前,黑客就能拿着这个信息去攻击那些还没更新的系统。

    所以对普通人来说,你现在听到的关于Project Glasswing的消息,其实是个”滞后指标”。真正厉害的那些发现,得等几个月才能知道详情。

    这件事的意义不止于”找漏洞”

    我觉得这件事真正值得关注的,是它暗示了一个趋势:AI在安全领域的应用,正在从”辅助工具”变成”基础设施”。以前你请个安全团队来审计代码,是按人天收费的。现在Anthropic用AI把这个事情的规模拉上去了,成本结构就完全不一样了。

    对于那些维护着关键开源项目、但没钱请安全团队的小团队来说,这种AI驱动的安全审计可能是个真正意义上的”救命稻草”。当然,前提是Anthropic愿意把这种能力开放出来,而不只是自己玩。

    另外值得思考的是:当AI既能用来”找漏洞”也能用来”挖漏洞”的时候,这场军备竞赛会往哪个方向走?Anthropic现在是站在防守这一边的,但那些能力,换个角度也能用来进攻。

  • 特朗普按下暂停键:AI安全行政令为什么黄了

    特朗普按下暂停键:AI安全行政令为什么黄了

    昨天有件事挺有意思。特朗普本来要签一个AI安全行政令,结果临门一脚给推迟了。

    这个行政令如果签了,会是美国AI监管史上挺重要的一个节点。它要求AI公司在发布先进模型前14到90天,把模型提交给政府做安全评估。逻辑很简单:你造了一把更锋利的刀,总得让监管看看这刀会不会伤到自己人。

    特朗普发表讲话
    特朗普推迟签署AI安全行政令(来源:Getty Images/TechCrunch)

    特朗普自己的解释

    特朗普对白宫记者团说的是:”我不喜欢里面的某些内容。我们在AI上领先中国,领先所有人,我不想做任何可能阻碍我们领先地位的事情。”

    这个表态其实挺直白的。翻译一下就是:监管可以要,但不能影响美国AI公司的竞争力。尤其是在和中国竞争的大背景下,任何可能让美国公司”束手束脚”的规则,都要慎重。

    “我们领先中国,我们领先所有人,我不想做任何会阻碍我们领先地位的事情。”
    ——唐纳德·特朗普

    非官方原因更有意思

    多家媒体透露了一个更”真实”的版本:没有足够多的科技行业CEO能在短时间内赶到华盛顿特区参加签署仪式。

    你品品这个逻辑。一个总统行政令的签署仪式,如果没有一堆科技大佬站在背后举着签字笔拍照,那这个仪式还有什么意义?AI监管这种事,本质上是要给企业界看的——你看,政府和我(特朗普)是站在你们这边的。

    如果CEO们都不来,这场秀就不好看了。所以推迟,等大家都有空了再搞。


    这个行政令到底要干什么

    说回行政令本身。它要求国家网络主管办公室(Office of the National Cyber Director)和其他相关机构,制定一套流程,在AI模型发布前对其安全性进行评估。

    这个要求的背景是:过去一年,Anthropic发布了Mythos,OpenAI发布了GPT-5.5 Cyber,这两款模型都具备快速发现并利用安全漏洞的能力。用大白话说就是:这些AI已经能自己找Bug、自己写攻击代码了

    监管者的问题很直接:如果AI能自己发现漏洞,那它会不会被坏人拿去干坏事?如果模型在发布前能被政府”过一遍安全检测”,是不是能减少这种风险?

    • 14-90天前置审查:AI公司需要在模型发布前最多提前90天、最少4天向政府提交模型
    • 安全评估流程:由政府机构评估模型是否存在被滥用于网络攻击、生物武器研发等风险
    • 跨机构协作:国家网络主管办公室牵头,联合其他相关机构共同制定标准

    为什么这个行政令有争议

    支持者会说:这是必要的安全护栏。AI能力越强,出事后的后果越严重。政府有必要在模型发布前看一眼。

    反对者(主要是AI公司和他们的支持者)会说:这会导致美国AI研发速度变慢。如果OpenAI要多等90天才能发布GPT-5.7,而中国的AI公司不需要等,那美国的技术领先优势就会被稀释。

    特朗普的表态显然站在了反对者这一边。他说行政令的措辞”可能成为阻碍”(could have been a blocker),这个表述很有意思——他不是说”这个行政令本身不好”,而是说”现在的版本有问题,要改”。

    网络安全与AI
    AI安全评估涉及多个政府机构的协作(来源:TechCrunch)

    这件事的背后逻辑

    把这件事放在更大的背景里看,有几个趋势值得注意:

    第一,美国AI监管正在进入”务实优先”阶段。拜登政府时期推过一些AI监管倡议,但特朗普2.0版本的核心逻辑是:监管不能影响竞争力。这次行政令推迟,就是这个逻辑的体现。

    第二,”拍照外交”仍然是政治秀的重要部分。科技CEO们的到场与否,能直接影响一个政策仪式的推进节奏。这说明AI行业和政府的互动,仍然高度依赖个人关系和公开示好。

    第三,AI安全问题的紧迫性没有被否认,只是被”优先级排序”了。特朗普没有说”AI安全不重要”,他说的是”现在的版本可能会阻碍发展”。这意味着未来还是会有一个版本的AI安全行政令出台,只是会更照顾产业界的感受。


    接下来会怎样

    按照华盛顿的办事节奏,这个行政令不会就此消失。白宫会重新修改措辞,把那些”可能阻碍发展”的条款弱化或者删除,然后挑一个CEO们都有空的日子,再搞一次签署仪式。

    但对于AI行业来说,这次推迟释放了一个明确信号:在特朗普2.0时代,AI公司的自由度会比很多人预期的要大。只要你能证明监管会影响美国的技术领先地位,那监管就很可能会为你让步。

    至于AI安全本身,可能就要靠行业自律了。

  • 谷歌AI眼镜上手:差一口气就成正经产品了

    谷歌I/O的”几乎时刻”:AI眼镜终于像个正经产品了

    上周谷歌I/O大会我摸到那个Android XR眼镜了。说”摸到”而不是”看到”,是因为终于有个大厂把AI眼镜做得不像科幻片道具,而是像个你能日常戴出门的东西。

    先说清楚,这次体验的还是原型机。但和往年那些”展示柜里的概念品”不一样,这次的完成度已经到了”差点就能卖”的程度。TechCrunch的Sarah Perez在现场试戴后写了一篇文章,标题就很诚实:We tried Google’s AI glasses and they’re almost there

    Google Android XR AI眼镜原型机
    谷歌Android XR眼镜原型机,与Gentle Monster合作设计(来源:Google/TechCrunch)

    两条腿走路:先卖音频版,再推显示版

    谷歌这次的策略挺聪明。他们说今年秋天先推仅音频版本的眼镜,就是没有显示屏、只靠耳机和Gemini语音交互的那个版本。然后晚些时候再推带显示屏的AR版。

    为什么要分两步走?我理解的原因有两个:一是音频版技术门槛低,供应链和品控更容易搞定,能赶在Meta Ray-Ban继续蚕食市场之前先占个坑;二是显示版确实需要再多打磨一阵,这次原型机的显示效果还不够锐利,长时间戴容易眼疲劳。

    谷歌和Warby Parker、Gentle Monster、三星一起做的这个眼镜,外观上已经不像”极客玩具”了。Gentle Monster那款的造型,普通年轻人戴着逛街完全不违和。

    实际戴起来怎么样

    我挑几个最有感的场景说:

    实时翻译是最好用的功能。演示人员说西班牙语,眼镜在我右眼上方显示英文文本,同时Gemini用英语在我耳边”悄悄话”。那个感觉……就像一个随身同声传译,而且不用低头看手机。对于经常出国的人来说,这个功能本身就值回票价了。

    导航也做得挺好。你告诉Gemini”导航到最近的咖啡店”,眼镜会在你视野里显示下一个转弯的信息。低头能看到地图上的蓝点,抬头走路的时候导航提示不会挡视线。这个设计细节说明谷歌真的想过”日常使用”的场景,而不是堆功能。

    拍照+AI处理这个组合有点意思。你可以直接说”拍张照片,把这个人变成动漫角色”,眼镜拍完照,传给Gemini和Nano Banana的服务器,几十秒后返回处理好的版本。当然现场Wi-Fi负载太高,来回花了45秒,但这个工作流本身是通顺的。

    Android XR眼镜显示界面演示
    眼镜显示界面可以叠加天气、导航、翻译等信息(来源:Google)

    但缺点也挺明显

    先说显示版的问题。原型机只有右眼有显示屏,图像有点模糊(TechCrunch的记者认为是他戴了左右眼度数不同的隐形眼镜导致的,但也有可能就是分辨率还不够)。更关键的是,戴了几分钟后右眼上方开始有疲劳感。这个问题如果不解决,没人能戴着它超过半小时。

    音频版的问题在于音质。现场太吵,音乐开到最大还是听不清细节。谷歌显然也没打算让它替代高端耳塞,它的定位就是”走路、做家务、骑车的时候能听个响,同时还听得清别人说话”。这个定位和Meta Ray-Ban是一样的。

    还有一个细节:原型机不能自动检测你是否戴着眼镜。量产版会有这个传感器,摘下来就暂停,戴上去继续。这种小功能看似不起眼,但日常用起来差别很大。


    谷歌的算盘

    为什么谷歌在这个时间点推AI眼镜?我理解有几个原因:

    • Meta Ray-Ban卖得不错,证明”眼镜+AI”这个形态是有市场需求的,谷歌不想再错过一波硬件浪潮
    • Gemini需要更多的”入口”。手机、网页、智能音箱都有了,眼镜是最自然的”始终在线”的场景
    • 安卓生态需要一个新的差异化卖点,尤其是在和苹果竞争的时候

    但谷歌也要面对一个现实:Meta已经在市面上卖了一年多,Snap也在做类似的事情。谷歌选择先推音频版”占坑”,再把显示版慢慢打磨到真正能用的程度,这个节奏是合理的。

    现场体验完我最直观的感受是:这款眼镜距离”能日常戴”还差最后那一小步。显示效果再锐利一点、续航再长一点、重量再轻一点,就够了。按照谷歌的节奏,显示版大概率要到2027年才会真正上市。

    到那时候,AI眼镜会不会已经是一片红海了?

  • Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI 特色图

    📌 项目简介

    Gemini CLI 是 Google 官方开源的终端 AI 智能体,把 Gemini 大模型的能力直接搬进了你的命令行。它不只是一个聊天工具——它能读你的代码库、帮你写代码、调试 Bug、执行终端命令,甚至直接操作文件,真正实现了「在终端里有一个懂你项目的 AI 搭档」。


    ⚙️ 安装要求和过程

    📦 环境要求

    • Node.js >= 18(必须!)
    • npm 或 npx(自带)
    • Google 账号(登录获取免费额度)
    • 终端:支持 macOS / Linux / Windows

    🚀 快速安装(3步搞定)

    最简单的方式,一步安装:

    npm install -g @google/gemini-cli

    或者用 npx 直接运行(无需安装):

    npx @google/gemini-cli

    安装完成后,在终端输入以下命令启动:

    gemini

    首次使用会用浏览器打开 Google 登录页面,授权后即可开始使用,免费版有每天 1000 次请求额度,对个人使用完全够用。


    💡 核心功能

    🔍 1. 全代码库理解

    Gemini CLI 不是「瞎猜」你的代码,它能真正读取和理解整个项目目录。你问它「这个函数的逻辑是什么」,它会去读对应的文件,给你准确的答案,而不是泛泛而谈。

    🛠️ 2. 代码生成与执行

    直接让它写代码、改 Bug、重构函数,它生成完还能直接帮你写到文件里。更厉害的是它可以在沙箱环境里执行代码,验证结果后再提交,减少低级错误。

    🔗 3. 内置 Google 工具集成

    因为是第一方工具,Gemini CLI 可以直接调用 Google 的生态:搜索网页、读取 Gmail、管理日历、操作 Google Drive 文件……这些都不需要额外配置,登录账号就能用,真正的一体化体验。

    📋 4. 多模态支持

    不只处理文字——你可以把截图、设计图、PDF 文档直接丢给它,它能看懂图片内容、提取 PDF 里的文字、分析表格数据。写前端的时候直接把设计稿截图发过去,它能帮你写出对应的 HTML/CSS,这体验真的很丝滑。

    ⚡ 5. 超长上下文窗口

    Gemini 的杀手锏就是上下文长度,CLI 版本同样支持最高 100 万 token 的上下文窗口(付费版)。什么概念?你可以把整个中型项目的代码库全部塞进去,它都能记住,不需要像其他工具那样担心「忘记前面的对话」。


    🎯 典型使用场景

    场景一:接手陌生项目,快速上手

    刚 clone 下来一个开源项目,看不懂项目结构?在终端里直接输入 gemini 启动,然后问它:「这个项目的入口文件在哪?主要业务逻辑是怎么流转的?」它会读一遍整个目录,给你画出一张「项目地图」,比自己瞎看文档快太多了。

    场景二:写代码卡壳,AI 当结对编程伙伴

    正在写一个复杂的正则表达式或者递归算法,脑子转不动了?不用切换窗口去网页版 ChatGPT,直接在终端里问 Gemini CLI,它看着你的代码上下文给建议,甚至直接帮你写完整个函数。最关键是——它知道你项目里已有的工具和风格,不会给你写出风格迥异的代码。

    场景三:自动化日常开发任务

    需要批量重命名文件、生成项目的 README、写单元测试、或者分析 git log 找出是谁引入了某个 Bug?这些琐碎但耗时的任务,直接告诉 Gemini CLI 去做,它能在终端里直接执行,你只需要最后确认一下结果就行。


    🌟 推荐理由

    我推荐 Gemini CLI,最直接的原因就是:它是真的「懂终端」的 AI 工具

    之前用过不少 AI 编程助手,但大多要么是在网页里聊天(切换窗口很打断思路),要么是 VS Code 插件(离开编辑器就用不了)。Gemini CLI 不一样——它就在你的终端里,和你日常的 cdgitnpm 命令待在一起,想问什么直接问,完全不需要切换上下文。

    另一个很打动我的点是免费额度够大方。每天 1000 次请求,对个人开发者来说基本上用不完。当然如果你需要 100 万 token 的超长上下文,那就要开付费了,但普通使用免费版完全够用。

    当然它也有不足——相比 Claude Code,Gemini CLI 的代码生成质量偶尔会稍逊一筹,复杂逻辑可能需要多轮对话才能搞定。但作为一款终端原生的免费 AI 助手,它已经足够好用,特别是如果你本来就在用 Google 生态(Gmail、Drive 等),整合体验会很流畅。


    📥 下载地址

    🌐 官方网站:geminicli.com

    🐙 GitHub 仓库:github.com/google-gemini/gemini-cli(104.5k ⭐)

    📦 npm 安装:npm install -g @google/gemini-cli

    📚 官方文档:查看 GitHub README

    🚀 如果你每天都在用终端,Gemini CLI 值得一试。
    把它当成你的「终端里的 AI 结对编程伙伴」,你会发现开发效率提升不止一点点。

  • AI初创公司的ARR造假游戏:VC和创始人如何联手”造神”

    上个月,一家法律AI初创公司的CEO在X平台发了一篇帖子,直接把AI圈炸开了锅。他揭露了一个很多人心知肚明却不敢明说的秘密:很多AI初创公司公开宣布的收入数据,水分大到离谱。

    ARR造假隐喻
    ARR造假就像匹诺曹的长鼻子(图源:TechCrunch/ChatGPT AI生成)

    还远不是真正的收入

    这里说的ARR,全称是Annual Recurring Revenue(年经常性收入),本来是用来统计按订阅模式收费的SaaS公司的核心指标。但现在的AI初创圈,这个概念已经被玩坏了。

    最主要的混淆手段,是把”合同ARR”(有时候也叫”承诺ARR”,即CARR)直接当成ARR来报。这两者之间的差别,就像你签了一份为期三年的健身房合同,和你已经连续三年每周都去健身房并把钱结清了之间的差别——前者是承诺,后者是实绩。

    有投资者透露,他见过一些公司的CARR比真实的ARR高出70%。这些合同里很大一部分收入,可能永远都不会真正到账。

    CARR最大的问题,是在产品尚未落地时就计入收入。如果实施周期很长或者出了岔子,客户可能在试用期就取消合作,导致全部或部分合同收入无法收取。有前员工爆料,他所在的公司甚至把一个为期一年的大型免费试点项目也算进了ARR。

    使用CARR却称之为ARR的明显问题,是它比传统ARR更容易被”操纵”。如果初创公司不切实际地计算流失率和降级销售,CARR就可能被虚高到离谱的程度。

    另一种更有问题的”ARR”

    除了CARR,还有另一种同样有争议的”ARR”指标:年化运行率收入(annualized run-rate revenue)。这种算法更离谱,它是根据某一时期的收入(比如一个季度、一个月、甚至一周或一天)来推算未来12个月的收入。

    由于很多AI公司按使用量或效果收费,这种计算年化运行率ARR的方法可能产生严重误导,因为收入不再是锁定在可预测的合同里。今天你的AI工具突然爆火,收入飙升,明天可能就跌回原点。


    VC的真实想法

    接受采访的投资者表示,VC没有理由主动曝光这些虚报行为。通过对外公布的虚高ARR视而不见,VC实际上是在帮助”造神”自己的portfolio公司。

    当一家初创公司公开报告高收入时,更有可能吸引到最优秀的人才和相信该公司是其品类中无可争议的赢家的客户。这是一场精心设计的叙事游戏,而ARR数字就是游戏里最关键的筹码。

    • 估值越来越高,造假的激励也更强
    • AI时代初创公司被期望比以往增长快得多
    • 展示快速增长的压力促使一些VC支持虚高数据
    • “造神”成功后,VC和公司创始人都获利颇丰

    当然,并非所有初创公司都愿意用CARR代替ARR来展示增长。他们更喜欢清晰透明地公布数字,部分原因是他们明白公开市场是用ARR而非CARR来衡量软件公司的。这些创始人优先考虑透明度,不愿意为了短期收益而牺牲长期信誉。

    但现实是,那些选择透明度的公司,在融资时可能会处于劣势。当同行都在用CARR来”美化”自己的收入数据,坚持只用真实ARR的公司看起来就像增长乏力一样。这是一个典型的”劣币驱逐良币”的局面。

    我认为这是短视的,为了短期收益做这种事,你会让本来就高的倍数变得更高、更疯狂。这是非常糟糕的操作,迟早会反噬你。

    对于外部观察者和普通投资者来说,分辨这些数字的真假并不容易。ARR、CARR、年化运行率ARR,这些术语本身就足够让人眼花缭乱,更不用说每家公司在计算时都可能使用不同的标准和假设。

    下一次看到某家AI初创公司宣布”ARR突破1亿美元”的新闻时,或许我们应该多问一句:这个数字是真的ARR,还是CARR,或者干脆就是年化运行率?答案可能会让你大吃一惊。

  • GPT-5.6曝光了,OpenAI砸钱宣战:换掉Claude Code

    GPT-5.5发布才三周,GPT-5.6的内部测试代码就被曝光了。OpenAI的迭代速度快到让同行连喘气的机会都没有。

    GPT-5.6开发曝光
    知名爆料人Leo曝光GPT-5.6已进入内部测试阶段(图源:36氪)

    OpenAI加速爆更,Codex将狂飙3倍

    GPT-5.6还没正式亮相,OpenAI的产品端已经先炸了一波。有爆料称OpenAI将在本周四上线「ultrafast模式」,速度提升2-3倍,专为延迟敏感型任务提供最快的可用响应。

    同步推进的还有图像模型的A/B测试更新,就是那个在Image Arena排行榜上以+242分断档领先的gpt-image-2。要知道OpenAI在速度优化上早就有布局,今年3月GPT-5.4发布时,Codex的/fast模式已经实现了1.5倍加速。后来GPT-5.3-Codex-Spark更是借助Cerebras芯片,把推理速度拉到了超过1000 token/秒,是普通模式的15倍。

    而这次的ultrafast模式,直接在主力模型上实现2-3倍提速。不是阉割版,不是小模型替代,是正儿八经的旗舰模型加速。对于开发者来说,Agent循环、长任务流水线、浏览器自动化,所有需要等待的场景,体验将直接起飞。

    OpenAI的目标不再止步于AGI,而是直指ASI(超级智能)。当模型迭代速度由AI自身驱动,通往ASI的飞轮已经开始自转。

    全面开战!Codex vs Claude Code

    硅谷最戏剧性的一幕出现了。赶在OpenAI「ultrafast模式」上线之前,Anthropic放出了Opus 4.7 Fast模式,提供比Codex更快的高级推理、更优的长上下文编码,以及更流畅的氛围编码体验。

    真正激烈的一幕,就是Codex和Claude Code的全面开战。Anthropic率先出招,从6月15日起,为付费订阅用户每月提升50%的编程额度,全面覆盖Claude Agent SDK、命令行工具claude -p,以及深度集成GitHub工作流的Claude Code。

    Codex vs Claude Code
    OpenAI与Anthropic的编程工具大战已然开启

    OpenAI的反应非常迅速,祭出了一招堪称「重磅级补贴」的操作——在接下来30天内,任何想从其他平台切换到Codex的企业,都将获得2个月的免费使用权。奥特曼更是亲自下场带货,直言「Codex才是目前市面上最强的AI编程产品」。

    2个月免费,按Pro计划200美金/月的标准算,等于直接送了400美元的使用权。这种怼脸开打的战局,看呆了整个硅谷。OpenAI的意图非常明确:趁Claude Code用户还在犹豫,直接拿出钱砸出一条迁移的通道。


    当迭代速度逼近ASI

    把视野拉到最高的维度,GPT-5.6和编程大战,表面上是两件独立的事。但把它们放在一起看,一个远比任何单一事件都更深刻的趋势浮现了——AI的自我加速和商业化,正在形成正反馈飞轮。

    一方面,模型在加速进化。GPT-5.3-Codex是OpenAI首个「参与自身训练」的模型。到GPT-5.5,OpenAI内部85%的员工每周使用Codex。GPT-5.6的开发,几乎可以确定是在GPT-5.5的深度参与下进行的。AI在帮OpenAI造更强的AI。

    另一方面,编程工具的普及正在释放前所未有的工程产能。Codex 300万周活跃用户,Claude Code用户数同样在爆发式增长。当数百万开发者把AI编程工具当作日常效率神器,AI生成的代码又反哺回AI的训练和部署,这个循环的速度只会越来越快。

    • AI参与自身训练和部署,形成自我强化循环
    • 编程工具普及释放工程产能,加速产品迭代
    • 两家万亿级公司用「补贴战」加速AI普及
    • 通往ASI的飞轮已经开始自转
  • Spotify联手环球音乐:AI翻唱和混音要合法了

    Suno和Udio最近有点尴尬。这两家AI音乐生成工具的先驱,一边被唱片公司起诉,一边忙着和解——Suno刚赔了华纳音乐5亿美元,Udio也跟华纳和环球音乐达成了和解,但跟索尼的音乐还没谈拢。

    Spotify应用图标
    Spotify应用图标 | 图片来源:TechCrunch

    就在AI音乐平台们为版权问题焦头烂额的时候,Spotify悄悄走出了一条不一样的路。周四,Spotify宣布跟环球音乐集团(UMG)达成合作,要让用户用生成式AI给自己喜欢的歌做翻唱和混音。这个功能会作为付费附加包推出,只有Spotify Premium订阅用户能用,而且参与合作的艺术家能拿到收入分成。

    提前谈好,不先斩后奏

    Spotify去年就透露过这个计划,当时他们说得挺明白:这些AI工具会通过”提前达成协议的方式开发,而非先上线再寻求谅解”。这话听起来像在阴阳谁?没错,就是Suno那类先上线、再被起诉、再和解的平台。

    Spotify概述的原则很清楚:艺术家和版权方应该能自主选择是否以及怎么参与AI工具,如果参与,应该拿到公平的报酬。

    这次跟环球音乐的合作,就是这套原则的第一个落地案例。Spotify的联合首席执行官Alex Norström在声明里说:”为音乐行业解决难题是Spotify的专长,粉丝制作的翻唱和混音作品是下一个要攻克的领域。我们在开发的产品以参与其中的艺术家和词曲作者的授权、署名和报酬为核心。”

    环球音乐怎么看?

    环球音乐集团董事长兼首席执行官Sir Lucian Grainge对这事的评价挺正面。他觉得这是艺术家深化跟粉丝关系的一种方式,同时也能创造额外的收入机会。目前还不知道有哪些环球旗下的艺术家同意参与,但这事一旦铺开,影响会挺大——环球音乐手里握着不少顶级艺术家。

    为啥Spotify能做成这事?因为他们直接去找唱片公司谈,而不是像Suno那样先做了再说。看到用户对AI音乐有需求,Spotify选择走合规路线,跟版权方先把事儿谈妥。环球音乐可能只是第一个,Spotify后面大概率还会跟索尼、华纳、还有那些独立音乐发行公司谈类似的合作。

    AI音乐的未来在哪?

    这个消息是Spotify周四投资者日公布的一堆新功能之一。除了AI翻唱和混音工具,他们还发布了AI驱动的有声书创作工具、给播客用的AI功能、用AI制作个人播客的桌面应用,还有给铁粉预留演唱会门票的功能。

    回头看,AI音乐这条路上,Spotify选了一条最不容易但可能也最可持续的路。Suno和Udio们证明了市场有需求,但也证明了没有版权授权的路走不长。Spotify这套”先授权、再上线”的打法,虽然慢一点,但一旦跑通,后面的想象空间不小。

    对艺术家来说,这是一把双刃剑。好处是多了一个收入渠道,粉丝用你的作品生成AI翻唱或混音,你能拿到分成。坏处是,你的音乐可能以你没想过的方式被使用。但目前来看,至少艺术家有选择权——可以选择不参与。


  • 谷歌AI搜索翻车了:搜’disregard’竟然返回聊天回复

    你有没有遇到过这种情况:想用谷歌搜一个英文单词的意思,结果AI概览(AI Overviews)不但没给你搜索结果摘要,反而像聊天机器人一样回了一句”好的!有什么可以帮你的?”——这事还真发生了,而且闹得有点搞笑。

    一个单词引发的”车祸”

    事情是这样的。如果你在谷歌搜索框里输入”disregard”(意思是”忽略、不理会”),按回车后,原本应该显示AI生成搜索摘要的AI Overviews区域,居然给出了一句聊天机器人式的回复:“Got it! Let me know if you need help with anything else.”(好的!如果你需要其他帮助请告诉我。)

    Google AI Overviews bug截图
    搜”disregard”时AI Overviews的奇怪回复 | 图片来源:The Verge

    这不是孤例。The Verge的记者们测试后发现,类似的”翻车”也出现在其他几个词上。比如搜”ignore”(忽略),AI Overviews会回复:”Message received! I’m here and ready to help. What would you like to focus on today?”(收到消息!我在这里随时准备帮忙。你今天想关注什么?)

    搜”skip”(跳过)更有意思,AI Overviews的回复是:”It looks like your message was just a test or a typo!”(看起来你的消息只是测试或者输入错误!)然后还贴心地让你”随时提问或分享提示词”。

    这几乎可以确定只是一个有趣的bug。也许谷歌搜索在经历完谷歌I/O 2026的一堆事务后也”累了”,开始答非所问。

    AI搜索的”身份危机”

    这个bug其实暴露了一个更有意思的问题:当搜索工具越来越”智能”,它到底应该扮演什么角色?用户搜一个单词,期待的是词典式的解释或者相关网页链接,而不是一个假装自己是客服的聊天机器人。

    谷歌的AI Overviews功能从推出到现在,一直处在”搜索”和”聊天”的模糊地带。它的设计初衷是帮你总结搜索结果,让你不用点开一堆链接就能快速获取信息。但当它遇到”disregard”这种本身就有”忽略我”含义的词时,系统好像真的”忽略”了搜索请求,转而进入了聊天模式。

    截至文章发稿时,谷歌还没有回应关于这个bug的置评请求。不过对于普通用户来说,这个问题影响其实不大——谁会没事搜”disregard”呢?但它在某种程度上提醒我们,AI搜索再聪明,也还是会发现一些让人哭笑不得的边界情况。


  • Anthropic首次盈利:Claude增长太猛,连自己都没想到





    Anthropic首次盈利:Claude增长太猛,连自己都没想到


    Q2营收109亿美元,Anthropic第一次赚钱了

    Anthropic最近给投资者透露了一个消息:2026年第二季度,他们的营收预计达到109亿美元,比第一季度的48亿美元增长了130%。更令人惊讶的是,他们预计这个季度能实现5.59亿美元的运营利润——这是Anthropic成立以来的第一次盈利。

    你可能会说,109亿美元营收、5.59亿美元利润,利润率不是很高啊。确实,只有大约5%的运营利润率。但你要知道,Anthropic之前每年都在烧钱,亏损额以十亿美元计。能在这个季度扭亏为盈,说明他们的商业模式开始跑通了。

    Anthropic原本给自己设定的盈利目标是2028年。现在2026年Q2就要实现运营盈利,提前了整整2年。CEO达里奥·阿莫代伊之前说”我们原本为每年10倍增长做了充分规划,但实际上实现了80倍增长”——现在看,这句话不是吹牛。

    钱从哪来?Claude Code立功了

    Anthropic没有详细披露分产品的营收结构,但我们可以从一些公开信息中看出端倪。

    最大的营收来源是Claude Code,这个编程助手产品的年化营收已经达到25亿美元。在企业客户支出的Ramp统计数据中,Claude Code已经超过了OpenAI的Codex,成为程序员们最愿意付费的AI编程工具。

    Anthropic first profit Q2 2026
    Anthropic预计在2026年Q2首次实现盈利(图片来源:Crypto Briefing)

    另一个增长引擎是企业客户的大规模部署。5月14日,普华永道(PwC)宣布在全球范围向数十万专业人员部署Claude,这将在Q2开始贡献营收。摩根大通上线了10个金融服务智能体,用于招股书和信贷备忘录的撰写。百时美施贵宝向3万余名员工部署Claude,用于加速药物研发。

    年消费额超过100万美元的客户数量,在2个月内从500家增长到超过1000家。仅这一千多家大客户,年合同价值就超过10亿美元。

    盈利能持续吗?不一定

    这里要泼一盆冷水。Anthropic的Q2盈利可能只是阶段性的,不一定能持续。

    原因很简单——算力成本。Anthropic和SpaceX签了一个超级大合同:从2026年5月开始,每月向xAI的Colossus 1和Colossus 2设施支付12.5亿美元租金,年化就是150亿美元。这个合同总金额高达450亿美元,期限到2029年5月。

    但Q2的时候,这个算力合同还处于爬坡期,Anthropic还没有支付满额的12.5亿美元/月。到下半年,当算力支出达到满额的时候,成本压力会大幅增加。Anthropic自己也说,2026年下半年高额的预定算力成本可能导致全年难以维持盈利。

    • 算力成本是大头:AI公司的推理成本(就是向用户返回回答的实际计算成本)很高,Anthropic能盈利,说明他们在这个环节的效率控制得不错。
    • 但未来投入只会更大:训练下一代模型、租用更多GPU、招聘更多人才,这些都需要钱。能否实现结构性盈利,取决于营收增长能不能持续超过基础设施成本的增速。

    为什么这件事很重要?

    Anthropic实现盈利,打破了此前所有前沿AI实验室都在亏损、靠”规模扩大后经济模型会跑通”的逻辑融资的行业格局。它证明了,在当前市场价格下,跑通前沿AI的盈利是可行的。

    这对整个行业有三个重要影响:

    • 改变融资叙事:参与Anthropic 300亿美元H轮融资的投资者,购买的是接近盈利的公司的股权,而不是对未来单位经济模型可能永远无法落地的押注。
    • 给OpenAI压力:OpenAI目前还在亏损(2026年预计运营亏损约140亿美元),而Anthropic已经盈利。在即将到来的IPO竞争中,Anthropic的盈利故事比OpenAI更有吸引力。
    • 证明企业AI市场真实存在:Anthropic的营收增长主要来自企业客户,不是消费者订阅。这说明企业愿意为真能帮他们省钱或赚钱的AI工具付钱,而不只是玩玩。

    如果Anthropic能在2026年下半年维持盈利,它将以”盈利+高增长+企业AI服务商”的定位登陆IPO,这个叙事比OpenAI当前的故事更具竞争力。

    对普通人有什么影响?

    如果你在用Claude,可能会发现免费版的限制越来越多,付费版的定价越来越贵。Anthropic要维持盈利,就要从每个用户身上赚更多钱。

    但反过来说,一个盈利的Anthropic,比一个一直烧钱的Anthropic更有可能长期存在。如果你把Claude用在重要的工作上,盈利意味着这个产品不会突然消失。