标签： AI技术

Gemini Omni实测：我把deepfake视频发给老公，他信了

去年我做过一个实验：用 Gemini 把我们家小孩的毛绒玩偶”deepfake”成去度假的样子，看看 Google 广告里演示的那些功能到底靠不靠谱。当时我就觉得，AI 生成视频的工具已经好到让人有点不安了。

一年过去，Google 推出了新的生成模型家族，叫 Omni。官方说法是，它终有一天能把任意类型的输入（照片、视频、文字）转换成任意类型的输出。当然目前第一步还是生成视频。第一个公开发布的版本叫 Omni Flash，已经上线 Google 的 AI 视频平台 Flow。

本文所有图片和视频均由 Google Gemini 生成（图源：The Verge）

把 Buddy 玩偶送去”度假”

这次我请回了去年出镜的那只毛绒小鹿 Buddy，让它再跑一趟。给 Omni 的提示词是：”做一个蒙太奇，Buddy 打包行李准备登上邮轮去热带度假。氛围要可爱、好玩。Buddy 在行李箱里塞了件搞笑的东西，后面会在视频里用到。”

Omni 让 Buddy 塞了一罐蜂蜜进去。到了视频后面，Buddy 伸手去拿，拿的姿势像在拿防晒霜。”呃哦，”角色说了一句。

说实话（哦不行，我不能用这两个字），这段小幽默拍得还真不赖。但是——蜂蜜罐子在视频里一直在变：从玻璃罐，变成装水的透明挤压瓶，又变回装蜂蜜的挤压瓶。至于视频最后一帧那画面，我甚至不知道该怎么描述，就像模型把刚才生成的所有元素全吐出来堆在一起了。

Omni 生成视频的效果比5个月前我测 Veo 时要好，角色一致性提升了。但即使是最好的片段，也还是会有 AI 的”跳跃惊吓”——比如 Buddy 跳伞的时候突然整个朝向翻转了。

Deepfake 我自己

Omni 号称的强项之一，是能把 AI 生成的内容”贴”到真实视频上。于是我让 Buddy 休息，换自己上场。用一段面无表情的自拍视频当底子，让 Omni 生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。

结果让我有点措手不及。AI 告诉我的一些痕迹还是能看出来的：叉子碰碗的声音有点过于”制造”了；飞机视频背景里有个女性出现了两次（这显然不对）；埃菲尔铁塔那段，AI 版本的我把头发扎成了马尾——我平时根本不扎马尾。

但除了这些小毛病和一种说不清的”诡异感”，视频的逼真程度已经足够吓人。

连我老公都骗过了

我把吃意面的片段给我老公看了。他知道我在测 AI 视频工具，但我没告诉他画面里哪些部分是 AI 生成的。结果他没有看出来——他以为我就是对着一个摄像头在吃面，唯一觉得不对劲的地方是那个碗看着眼生。至于”吃面”这个动作本身，逼真到足以骗过跟我住了十年的人。

其他几个埃菲尔铁塔片段，有些看起来有点卡通，但其中有一个足够逼真，你可能要反复看几遍才能察觉是 AI 做的。我自己一看那个扎马尾的版本就知道不是我，但我不确定别人能不能看出来。这种感觉让我有点不舒服。

不是免费的，而且积分消耗挺快

当然，这一切都不是免费的。生成视频要消耗积分，根据场景长度和输入素材不同，消耗 15 到 40 积分不等。单次编辑要消耗 40 积分。我现在用的是每月 20 美元的 AI Pro 套餐，每月有 1000 积分。测了大约 20 个片段、部分做了编辑之后，我剩 145 积分。

如果你对视频有比较具体的想法，可能要跟模型来回折腾不少次才能接近你想要的效果——每次编辑都要烧积分。

我们确实已经深陷”恐怖谷”了。

麻木了，但不代表没事

说句实话（唉），我有点累了。几年前第一次测 Veo 3 的时候，我被它生成的真实感震惊了。过去几年，我一次又一次被 AI 生成假人、假照片的容易程度震惊。按理说 Omni 也应该让我震惊才对——我想它确实让我震惊了，但那种冲击力已经钝了。

做出”以假乱真”的 AI 视频，还没有 Google 想让你相信的那么容易。但 Omni 确实在某些肉眼可见的维度上比 Veo 强。只要你有一个 Google 账号和一张信用卡，你就能拍一段自己坐在家里的视频，然后让它看起来像你正坐在飞往毛伊岛的航班上——付出的努力几乎可以忽略不计。

我们可能还没到 Hassabis 说的”奇点的山麓”那么夸张，但确实已经深陷恐怖谷之中了。

📎 原文来源：The Verge – Google’s new anything-to-anything AI model is wild

2026年5月23日
AlphaFold拿诺奖才5年，Google就开始转向了

上个星期 Google I/O 的大会上，DeepMind CEO Demis Hassabis 上台说了一句话：”我们正站在奇点的 foothills（山麓）。”奇点嘛，就是那个 AI 智能超过人类、世界被彻底改变的理论时刻。听起来挺玄的。

但仔细看他说这话的语境，就有点意思了。当时台上在讲 Google 的 AI 科研工具，重点展示了一段视频——用 WeatherNext（Google 的天气预报 AI）提前预警了去年 Hurricane Melissa 在牙买加的灾难性登陆，可能救了不少人。这确实是了不起的成就，但它跟”奇点”还差得远呢。

Demis Hassabis 在 Google I/O 2026 上讲述 AI for Science 的新方向（图源：MIT Technology Review）

两条路线的分歧

这件事其实暴露了 Google 在”AI for Science”上的两条路线之争。一条是做专门的科研工具——比如 WeatherNext 预测天气、AlphaFold 预测蛋白质结构、AlphaGenome 做基因研究——这些工具针对特定科学问题设计，效果扎实，已经被全世界 300 多万研究人员在用。

另一条路线更有野心：做出能自主做科研的 AI 智能体。不需要人类一步一步指导，AI 自己就能提出假设、设计实验、得出结论。这就是今年 Google I/O 上发布的 Gemini for Science 包背后的逻辑——把好几个基于大语言模型的科研系统整合到一个品牌下面。

“我们正朝着这样的 AI 前进：它不只是辅助科学研究，而是开始自己做科学。”——Pushmeet Kohli，Google Cloud 首席科学家

AlphaFold 的诺贝尔奖得主，被调去搞 AI 编程了

这条新闻最让人玩味的地方来了。上个月《洛杉矶时报》曝出：Google Fellow John Jumper——就是靠 AlphaFold 拿了诺贝尔奖的那位——现在被调去搞 AI 编程，不再专门做科研 AI 工具了。

这不难理解。Google 最近在 AI 编程工具上被 Anthropic 的 Claude Code 和 OpenAI 的工具压了一头，声誉受损，当然要把最顶尖的人才调过去追赶。但这也释放了一个信号：Google 正在把资源和注意力从”专门科研 AI 工具”往”通用 AI 科研智能体”偏移。

AI 自己证伪数学猜想，意味着什么

就在本周，OpenAI 宣布他们的一个模型证伪了一个重要的数学猜想——据一些数学家说，这是生成式 AI 迄今对数学领域做出的最有意义的贡献。有意思的是，OpenAI 用的这个模型并不是专门为数学设计的，而是一个通用推理模型，属于 GPT-5.5 那个系列。

这说明通用 AI 智能体确实已经开始在科研领域做出实质性贡献了。如果它们能在数学上做到，那么在其他科学领域（当然要慢一些，因为科学结论需要实验验证）大概也只是时间问题。

Gemini for Science 现在能干什么

本次 I/O 发布的 Gemini for Science 包含两个主要工具：AI Co-Scientist（生成科研假设）和 AlphaEvolve（优化算法）。目前还没对公众开放，但 Google 已经允许研究人员申请试用权限了。

早期测试的反馈不错。斯坦福大学的遗传学家 Gary Peltz 在《自然·医学》上发文，把用 AI Co-Scientist 比作”咨询德尔菲神谕”——也就是问神的意思。这个比喻挺传神的：AI 给出的假设不一定对，但需要人类专家去判断和验证。

当然，专门的科研工具（比如 AlphaFold）和通用 AI 科研智能体并不是非此即彼的关系。智能体可以调用专门工具作为”工具库”的一部分。没有 AlphaFold 的帮助，任何 AI 系统目前都别想把蛋白质折叠结构预测准。但 Google 显然在把公众形象——以及至少一部分资源和人才——从专门工具的开发，转向更通用的方向。

“合作者”，而不是”替代者”

Google 在对外表态上很谨慎，一直强调这些科研 AI 智能体是”加速人类科学家工作的工具”，而不是取代他们。比如，这个工具叫”AI Co-Scientist”而不是”AI Scientist”，这个命名选择看起来相当刻意。

Hassabis 在采访里也用了类似的说法：”在未来十年左右，我们应该把 AI 看作帮助科学家的神奇工具。再往后，就很难有把握了，但也许这些系统会变得更像合作者。”

但问题在于：一个有效的科研合作者，本身必须先是一个合格的科研工作者。如果 Hassabis 说的”奇点的山麓”不是吹牛，那么 AI 科研智能体最终超过人类同行，并不是天方夜谭。

Hassabis 在 I/O 期间跟记者 Mike Allen 聊天时提到，他最早被 AI 吸引，是因为看到物理学在 1970 年代之后进展停滞了；他在想，人类心智是不是在这个领域已经触到了天花板，也许 AI 能帮我们突破这个壁垒。超人类的 AI 科研智能体，确实符合这个描述。

我们也许永远到不了那一步。但 Google 看起来正在往那个山顶爬。只是不知道，等到了之后，站在山顶的还会不会是我们人类。

📎 原文来源：MIT Technology Review – Google I/O showed how the path for AI-driven science is shifting

2026年5月23日
SpaceX星舰V3首飞实录：助推器回收失败，IPO前的关键一役
SpaceX本周搞了两个大动作：一边向SEC递交了IPO申请，准备6月中旬在纳斯达克上市；另一边把升级版的星舰V3送上了天。两个动作凑在一起，让这次试飞的意义不只是”又飞了一次”那么简单。

星舰V3从德州Starbase发射升空（图源：TechCrunch）

407英尺，人类最强火箭首飞

星舰V3高度407英尺（约124米），是人类历史上建造过的最强大的火箭。本次发射在德州Starbase进行，当地时间下午5:30准时升空。

发射几分钟后，上级星舰与超重型助推器分离，继续向太空飞行。助推器则调头准备返回，按计划应该在墨西哥湾模拟着陆。但问题来了——助推器的发动机没有正常重新点火，用来完成返回着陆的持续燃烧没能实现。结果助推器直接栽进了海里，大概率当场爆炸。

上级星舰的表现相对好一些：虽然6台猛禽发动机中有1台在空中熄火，但还是成功部署了全部20个星链卫星模拟器，外加2颗经过改装的、用来拍摄星舰外表面的星链卫星。

约1小时 after liftoff，星舰在印度洋模拟着陆，然后按预期翻倒爆炸。整个任务只能说勉强成功。

为什么这次试飞很重要

这是星舰V3硬件的首次实战测试，SpaceX已经研发了好几个月。同时，这次还测试了Starbase的全新发射台——这个发射台SpaceX自己建了好几年。

但更关键的背景是：SpaceX的IPO文件本周公开，预计6月中旬在纳斯达克上市，募资规模约750亿美元。这笔钱SpaceX打算用来：继续研发、推进庞大的AI野心、偿还与xAI和X（马斯克的社交媒体公司）相关的债务。
- 星舰是SpaceX实现”让生命多行星化”使命的核心载体
- 短期内的主要任务是部署更先进的星链卫星（星链是SpaceX唯一盈利的业务）
- 第三代猛禽发动机推力更大、设计更简化；新助推器设计支持更快的发射节奏和更便捷的发射塔回收
IPO前的这次失败，影响有多大？

这次试飞是2025年10月以来星舰的首次飞行。之前SpaceX本来计划更早试射V3，但2025年11月一台升级版助推器在测试中发生爆炸，计划被迫推迟。周四的发射尝试也因为发射塔臂上的液压销不肯收回而取消——马斯克本人说的。

助推器回收失败对IPO估值的影响，现在还不好说。SpaceX的招股书里肯定会把星舰作为未来业务的核心支柱之一来讲故事，但投资者更关心的可能是：星链业务的现金流、xAI的整合逻辑、以及马斯克的政治风险。

星舰V3这次没完全成功，但也没完全失败。对于一家即将上市、要讲”太空+AI”大故事的 company来说，这样的测试结果，刚好够用，但肯定不够漂亮。

📎 原文来源：TechCrunch – SpaceX launches Starship V3 for the first time, but loses booster on return
2026年5月23日
AI重建已故飞行员声音，NTSB紧急封锁公共档案访问
去年一起UPS货机坠毁事故中，遇难飞行员的声音最近被人用AI给”还原”出来了。这事儿听起来像科幻电影情节，但它真实发生了，而且就在美国国家运输安全委员会（NTSB）的公共档案系统里被人”淘”出来的。

声谱图变声音，AI做到了

事情是这样的。NTSB的公共文档系统里存着大量事故调查数据，按法律规定，驾驶舱录音是不能直接公开的。但这次UPS 2976航班（肯塔基州路易斯维尔坠毁）的调查文档里，包含了一份语音记录器的声谱图——简单说，就是把声音信号转换成图像的数学文件。

UPS 2976航班肯塔基州坠毁现场（图源：Getty Images）

知名YouTuber、精通物理和天文学的Scott Manley在X平台上指出：声谱图编码了数兆字节的数据，理论上可以从中重建出对应的音频。果然，有网友结合了这份声谱图和公开的文字记录，用Codex等AI工具，把驾驶舱语音记录器的近似音频给重建出来了，然后放到了互联网上传播。

声谱图本身不是音频，但AI工具可以从图像”逆向”出近似的声音。这就像给你一张钢琴键按下的照片，有人能帮你”听”出弹的是什么曲子。

NTSB紧急应对：史上首次关闭公共档案

NTSB发现这件事之后，做了一个史无前例的决定——临时封锁了公共档案系统的访问权限。原因很明确：他们担心这种技术被滥用，会侵犯事故相关人员的隐私，也会破坏调查记录的完整性。

上周五，NTSB恢复了文档系统的公共访问，但包括UPS 2976航班调查在内的42项调查暂时没有开放，正在等待进一步审查。也就是说，这些档案会不会重新公开、以什么形式公开，现在还是个问号。

技术跑在规则前面

这个事件暴露的问题挺值得想一想。NTSB的文档系统历史上一直对公众开放，声谱图文件本身也不包含可直接播放的音频，按之前的理解，这并不违反禁止公开驾驶舱录音的法律。

但AI改变了这个等式。原本”安全”的公开数据，在AI工具的作用下，可以被转换成原本受法律保护的敏感内容。这说明，很多机构的信息公开规则，可能需要重新评估一遍——哪些数据现在看起来没问题，但配上AI工具之后，就会变成隐私泄露的源头。
- 公共调查数据中的衍生数据（声谱图、频谱图等）是否需要重新分类？
- AI还原音频的准确性和伦理边界在哪里？
- 技术公司开发这类AI工具时，是否需要考虑滥用场景？
这件事还没有引起大规模公众讨论，但它是AI时代一个非常典型的困境：技术能力已经超出了规则制定的速度。NTSB的应对至少是迅速的，但下一次，可能就不会这么简单了。

📎 原文来源：TechCrunch – AI is being used to resurrect the voices of dead pilots
2026年5月23日
Waymo 的高速野心，被一段积水路拦住了
高速路上的Waymo，先停了

本周四，不少 Waymo 用户打开打车软件时发现：高速公路选项消失了。原本几分钟能走完的路程，现在系统提示要走地面道路，时间直接翻倍。

Waymo 后来确认了：出于对施工区域的担忧，全美所有运营市场的高速公路驾驶服务全部暂停。与此同时，亚特兰大和圣安东尼奥两个城市的全部服务也停了，原因是洪水退去后道路还有遗留问题。

Waymo 的自动驾驶出租车——高速公路服务现已暂停

导火索是德州的积水路

事情的直接起因挺尴尬：多辆 Waymo 自动驾驶出租车被拍到在德克萨斯州被淹的道路中高速行驶。视频在网上传开后，Waymo 不得不对整个车队发起软件召回。

我们致力于成为用户和社区的友好伙伴。作为承诺的一部分，我们会做出主动决策，包括暂时暂停部分服务。

—— Waymo 发言人 Chris Pappas

发言人说暂停是”出于对施工区域的担忧”，但没具体说车辆在施工区域遇到了什么问题。地面道路驾驶服务不受影响，但高速这块先按下暂停键。

高速公路是个关键能力

这事对 Waymo 的扩张计划影响不小。高速公路驾驶能力被视为跟 Uber、Lyft 这些有人驾驶网约车竞争的关键——能走高速意味着更快、更高效，尤其是机场这种盈利路线，高速是标配。
- 目前每周完成约 50 万次付费行程，目标是每周 100 万次
- 高速公路服务暂停前仅覆盖 4 个城市：旧金山、洛杉矶、凤凰城、迈阿密
- 即将部署新车：吉利旗下极氪打造的 Ojai 电动面包车，搭载第六代自动驾驶软件
最近有点水逆

这次暂停是 Waymo 近期一系列负面事件中的最新一起。尽管数据显示它的车在减少交通事故和伤亡方面确实有进步，但极端场景下的表现还是让人捏把汗。

前几天在亚特兰大，一辆空驶的 Waymo 堵在死胡同里，把整个社区的交通搞瘫痪了。达拉斯也有司机拍到一辆 Waymo 在繁忙路口闯红灯。虽然这些是个例，但凑在一起，给人的感觉是：技术还没完全准备好应对复杂现实。

目前 Waymo 没有给出恢复高速公路服务的时间表，亚特兰大和圣安东尼奥的服务恢复时间也一样。对于一家正在激进扩张、准备大规模商业化的公司来说，这种不确定性不是什么好信号。

📎 原文来源：The Verge – Waymo suspends freeway driving amid safety concerns
2026年5月23日
Chrome DevTools MCP 来了，AI 编程智能体终于能直接调试浏览器
Chrome 官方出手了

Chrome DevTools 团队这几天悄悄上线了一个新玩意——chrome-devtools-mcp。名字听起来很技术，但做的事其实挺有意思：让 AI 编程智能体能够直接”摸”到浏览器的开发工具。

以前 AI 写代码，基本就是在那儿纯文本推理，顶多看看静态代码。代码写出来能不能跑、跑起来有没有 bug、在浏览器里表现怎么样，AI 其实是不知道的。这个 MCP 项目就是来补这个短板的。

Chrome DevTools MCP 项目已开源发布

MCP 是个啥

MCP（模型上下文协议）是最近 AI 圈比较热的一个标准，用来让大模型和外部工具、数据源做标准化通信。Chrome 团队把这个协议用到了 DevTools 上，相当于给 AI 装了一双眼睛和一双手。

AI 智能体现在可以像人类开发者一样，实时检查 DOM 树、监控网络请求、分析控制台日志、调试 JavaScript 执行。

这意味着什么？意味着 AI 不光能写代码，还能在真实浏览器环境里验证代码对不对、哪出问题了、怎么修。这个闭环一旦打通，前端自动化开发和 AI 自修复代码的能力会直接上一个台阶。

为什么这事值得关注

Chrome 官方出来推这个，信号挺明确的：浏览器厂商开始认真看待 AI 编程这个场景了。不是做个插件凑热闹，而是把核心调试能力通过标准化协议开放出来。
- 权威性有保障，Chrome 团队自己在维护
- 已经上了 NPM，能直接装进现有工作流
- 兼容 Claude、GPT 这些主流大模型
- 前端自动化、Web 测试、爬虫调试这些场景直接受益
对开发者意味着什么

如果你在用 Claude Code、Cursor 这类 AI 编程工具，这个 MCP 服务可以让它们直接操作浏览器调试，不用你手动去 DevTools 里查问题再贴给 AI 分析。AI 自己就能看 DOM、抓网络请求、打断点调试。

项目现在在 GitHub 上开源，搜 ChromeDevTools/chrome-devtools-mcp 就能找到。NPM 上也有打包好的版本，装完配置一下就能用。

📎 原文来源：Chrome DevTools MCP – GitHub 官方仓库
2026年5月23日
ChatGPT杀进PowerPoint：打几个字，幻灯片自动生成
ChatGPT杀进PowerPoint：打几个字，幻灯片自动生成

微软和OpenAI又搞新动作了。最新推出的ChatGPT for PowerPoint集成功能，让你在侧边栏里打几句话，就能自动生成或编辑演示文稿。跟他家之前推出的Excel、Google Sheets插件差不多，都是把ChatGPT直接塞进办公软件里。

ChatGPT集成到PowerPoint侧边栏（图源：The Verge）

怎么用？

功能入口在PowerPoint的侧边栏，跟Excel那个插件的位置差不多。你可以直接打提示词让它生成幻灯片，也可以把文档、图片这些素材丢给它，让它帮你整理成演示文稿。

比如说你要做一个产品介绍PPT，以前得自己一页页排版、找图、调格式，现在可能只需要告诉ChatGPT”帮我做一个15页的产品介绍，包含市场分析、功能介绍和竞品对比”，它就能给你搭出个框架来。

“用户可以通过聊天提示词，结合文档、图片和其他素材，创建或编辑演示文稿。”——The Verge报道

谁能用到？

目前这个功能还在beta测试阶段，覆盖的用户群挺广：Business、Enterprise、Edu、Teacher、K-12、Free、Go、Pro、Plus订阅计划的ChatGPT用户都能用。也就是说，不管你是企业用户、教育工作者还是普通个人用户，只要用ChatGPT基本都能尝鲜。

办公软件+AI，这波趋势停不下来

微软在这件事上其实挺鸡贼的。一边是自己Copilot在推进，一边又允许OpenAI的ChatGPT直接集成进Office套件。表面上看是在开放生态，实际上不管用户用哪个，微软都能赚到钱——Copilot要订阅，ChatGPT for Microsoft 365也要走微软的渠道。

对普通用户来说，这确实能省不少时间。做PPT最烦的不是想内容，而是调格式、找模板、对齐元素这些琐碎活。AI帮你把框架搭好，你只需要改改内容、换个配色，效率至少提升一倍。

当然，生成的PPT质量怎么样还得实测。如果版式太死板、审美不过关，可能反而要花更多时间返工。不过从Excel插件的使用反馈看，OpenAI在这件事上还算靠谱，至少能帮你省掉最无聊的那部分工作。
- 功能：侧边栏集成，支持提示词生成/编辑PPT
- 支持素材：文档、图片及其他源文件
- 当前状态：beta测试阶段
- 可用计划：Business/Enterprise/Edu/Teacher/K-12/Free/Go/Pro/Plus
办公软件的AI化已经是大势所趋。再过两年，可能没人会手动从零开始做PPT了——就像现在没人会手动排版一封电子邮件一样。早适应，早省事。

📎 原文来源：ChatGPT for PowerPoint generates presentations with prompts（The Verge，2026-05-21）
2026年5月23日
英伟达又破纪录了：数据中心收入同比增长92%，AI芯片有多赚钱
英伟达又破纪录了：数据中心收入同比增长92%，AI芯片有多赚钱

英伟达刚发布的2027财年第一季度财报，数字简直离谱。总营收816亿美元，其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说，这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

英伟达财报再次刷新纪录（图源：The Verge）

AI数据中心的”印钞机”

752亿美元是什么概念？很多科技公司一整年的收入都达不到这个数字，而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片，从微软、谷歌到字节跳动、阿里，大家都在扩建算力基础设施。

“持续增长的AI数据中心芯片需求，推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

下一代芯片Vera Rubin要来了

财报电话会议上，英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出，从第三季度开始”。这意味着大概2026年7-9月之间，我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的，定位是替代当前Blackwell架构的下一代产品。

不过也有不那么亮眼的数字。受内存（RAM）短缺和价格上涨影响，英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上，成本涨了，消费者也不急着换电脑。

为什么这个数字很重要

92%的同比增长，说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破，但至少从现在的数据看，科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司，都需要英伟达的芯片来训练模型和跑推理。

而且这个趋势很可能还会持续——Vera Rubin一旦量产，性能会比现在的Blackwell更强，到时候又会引发新一轮的采购潮。对于英伟达来说，眼下的挑战可能不是需求不够，而是产能能不能跟上。
- 总营收：816亿美元（创纪录）
- 数据中心营收：752亿美元（同比增长92%）
- 下一代芯片：Vera Rubin将于2026年Q3推出
- 隐忧：PC业务受内存短缺影响销量下滑
AI这场仗，英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶，中国本土的芯片厂商也在崛起。不过按照现在的需求量，短期内英伟达的”印钞机”估计还停不下来。

📎 原文来源：Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year（The Verge，2026-05-20）
2026年5月23日
Meta悄悄做了个新App：Forum想让你在Facebook群组里用AI聊天

Meta前几天偷偷上架了一个iPhone应用，叫Forum。看名字你可能没感觉，但这东西其实就是把Facebook群组从主应用里”拆”出来，做了一个独立的地方，还塞了一个AI聊天机器人在里面。

Meta新推出的Forum应用，专为Facebook群组设计

为什么要把群组”拆”出来

这件事得从用户行为说起。不知道你有没有发现，现在很多人搜东西，会在谷歌搜索后面加个”Reddit”——因为他们想看真人怎么说的，而不是SEO优化过的营销内容。

Meta肯定也注意到这个趋势了。人们去Facebook群组，本质上也是在找”真实人类的观点”。但问题是，Facebook主应用太臃肿了，信息流、广告、推荐内容混在一起，找群组里的历史讨论真的累。

Forum的定位很明确：它想做一个”部分像Reddit、部分像Facebook、部分像谷歌AI概览”的东西。核心思路是——你要找信息，不用出Meta的生态。

AI聊天机器人是核心，不是摆设

Forum里内置了一个AI聊天机器人，这个设计挺聪明的。Facebook群组有个长期痛点：很多有价值的信息埋在几年前的对话串里，你根本翻不到。

这个AI机器人干的事，本质上就是帮你”搜”群组里的内容，但它不是给你一个搜索结果列表，而是直接用对话的方式把答案告诉你——就像谷歌的AI概览那样，只不过信息来源是你的群组。

对Meta来说，这个设计有个很大的好处：用户不用跳到外部搜索引擎或者Reddit去搜同样的问题了，他们直接在Forum里就能拿到”社区驱动的答案”。

这不是Meta第一次做群组独立App

有意思的是，Meta（那时候还叫Facebook）其实2017年就做过一个独立群组应用，后来给关了。这次的Forum，某种程度上是那个失败项目的”AI增强复活版”。

但这次的逻辑不太一样。2017年那个，基本上就是把群组功能原封不动搬到一个新应用里。这次的Forum，从设计思路上就是围绕”AI优先”来的——搜索、信息提取、内容导航，都是AI先上，然后才是传统的信息流。

而且Forum不会替代主Facebook应用里的群组功能。它是一种”分流”：想要沉浸式刷信息流的，继续用主应用；想要高效找信息、参与专业讨论的，来Forum。

竞争逻辑：守住自己的流量

如果把这件事放在更大的背景里看，Forum其实是Meta对Reddit和ChatGPT的一种防守反击。

Reddit这几年吃掉了大量”找真实答案”的搜索流量，很多人甚至已经不去谷歌了，直接去Reddit搜。而ChatGPT这类AI搜索工具，也在侵蚀传统搜索引擎的领土。

Meta的算盘是：我手里有几百万个Facebook群组，里面全是真实人类的讨论。如果我能用一个AI机器人把这些内容”激活”，让用户不用离开我的生态就能拿到他们想要的答案，那我不就同时挡住了Reddit和AI搜索工具的进攻吗？

这个逻辑能不能跑通，现在还不好说。但至少从战略意图上看，Forum是Meta在”社交+AI”这个方向上一次挺认真的尝试。

会有一些有意思的可能性

如果Forum真的做起来了，可能会出现一些挺有意思的场景。比如你加入一个摄影群组，不用翻几年的 old posts，直接问AI”这个镜头适合拍人像吗”，它就能把群组里所有相关的讨论帮你总结出来。

或者加入一个育儿群组，问”两岁宝宝不爱吃饭怎么办”，AI给你的是几百位真实家长的经验，而不是百度百科上冷冰冰的文字。

当然，这一切的前提是：Meta得让用户愿意下载一个额外的App。在2026年的今天，这件事本身就不容易。

📎 原文来源：The Verge – Meta launches Forum app for Facebook Groups

2026年5月23日
Anthropic Project Glasswing：用Claude揪出10000个漏洞，网络安全游戏规则变了

前几天翻到Anthropic的一个项目更新，有点震惊。他们搞了个叫Project Glasswing的东西，拿Claude Mythos Preview去扫那些”系统重要性软件”的代码，一个月不到，找出了一万多个高危和严重级别的漏洞。

Project Glasswing使用Claude Mythos Preview识别软件漏洞

一个月一万多个漏洞，这是什么概念

先说这个数字。一万多个高危/严重漏洞，不是那种”你的按钮颜色不对”级别的bug，是真正能被恶意利用、搞垮系统的那种。Anthropic说他们用的是”系统重要性软件”——就是那些全世界都在用、但你可能没意识到它存在的基础库和关键基础设施代码。

传统的安全审计，一个团队花几个月才能把一个大型项目扫一遍。Claude Mythos Preview这个速度，基本是把”发现漏洞”这个步骤给工业化了。

Claude Mythos Preview的能力在于理解复杂代码的结构，找出传统扫描器会漏掉的深层安全缺陷。这不是简单的模式匹配，而是真正的”理解”代码在做什么。

瓶颈转移了：从”找漏洞”到”修漏洞”

这个项目最让我感兴趣的地方，不是”AI找到了很多漏洞”这件事本身，而是它暴露出来的新问题：现在找漏洞已经不是瓶颈了，怎么验证、怎么披露、怎么修，这才是卡住的地方。

想象一下，你的AI一天给你报几百个可能的漏洞，你得一个个去看它是不是真的、危害有多大、怎么修。AI把”发现”的成本几乎降到了零，但”验证和修复”还是得人来干。Anthropic在更新里也承认了这一点——现在的瓶颈是人的速度，不是AI的速度。

50个机构一起上，但细节要等90天

Anthropic不是自己单干，他们拉了大概50个组织一起做这个项目。有开源社区的人，有软件厂商，也有安全机构。想法很简单：关键基础设施的安全是公共品，大家一起护。

但他们执行的是一个相当严格的”协同漏洞披露”政策：发现漏洞之后，最多90天（或者补丁发布后45天）才会公开细节。理由也很充分——如果Anthropic今天发现了一个漏洞，明天就把细节发出去，那在开发者把补丁做出来之前，黑客就能拿着这个信息去攻击那些还没更新的系统。

所以对普通人来说，你现在听到的关于Project Glasswing的消息，其实是个”滞后指标”。真正厉害的那些发现，得等几个月才能知道详情。

这件事的意义不止于”找漏洞”

我觉得这件事真正值得关注的，是它暗示了一个趋势：AI在安全领域的应用，正在从”辅助工具”变成”基础设施”。以前你请个安全团队来审计代码，是按人天收费的。现在Anthropic用AI把这个事情的规模拉上去了，成本结构就完全不一样了。

对于那些维护着关键开源项目、但没钱请安全团队的小团队来说，这种AI驱动的安全审计可能是个真正意义上的”救命稻草”。当然，前提是Anthropic愿意把这种能力开放出来，而不只是自己玩。

另外值得思考的是：当AI既能用来”找漏洞”也能用来”挖漏洞”的时候，这场军备竞赛会往哪个方向走？Anthropic现在是站在防守这一边的，但那些能力，换个角度也能用来进攻。

📎 原文来源：Anthropic Project Glasswing Initial Update

2026年5月23日