标签: AI技术

  • Gemini Omni实测:我把deepfake视频发给老公,他信了

    去年我做过一个实验:用 Gemini 把我们家小孩的毛绒玩偶”deepfake”成去度假的样子,看看 Google 广告里演示的那些功能到底靠不靠谱。当时我就觉得,AI 生成视频的工具已经好到让人有点不安了。

    一年过去,Google 推出了新的生成模型家族,叫 Omni。官方说法是,它终有一天能把任意类型的输入(照片、视频、文字)转换成任意类型的输出。当然目前第一步还是生成视频。第一个公开发布的版本叫 Omni Flash,已经上线 Google 的 AI 视频平台 Flow。

    Gemini Omni AI生成视频示例
    本文所有图片和视频均由 Google Gemini 生成(图源:The Verge)

    把 Buddy 玩偶送去”度假”

    这次我请回了去年出镜的那只毛绒小鹿 Buddy,让它再跑一趟。给 Omni 的提示词是:”做一个蒙太奇,Buddy 打包行李准备登上邮轮去热带度假。氛围要可爱、好玩。Buddy 在行李箱里塞了件搞笑的东西,后面会在视频里用到。”

    Omni 让 Buddy 塞了一罐蜂蜜进去。到了视频后面,Buddy 伸手去拿,拿的姿势像在拿防晒霜。”呃哦,”角色说了一句。

    说实话(哦不行,我不能用这两个字),这段小幽默拍得还真不赖。但是——蜂蜜罐子在视频里一直在变:从玻璃罐,变成装水的透明挤压瓶,又变回装蜂蜜的挤压瓶。至于视频最后一帧那画面,我甚至不知道该怎么描述,就像模型把刚才生成的所有元素全吐出来堆在一起了。

    Omni 生成视频的效果比5个月前我测 Veo 时要好,角色一致性提升了。但即使是最好的片段,也还是会有 AI 的”跳跃惊吓”——比如 Buddy 跳伞的时候突然整个朝向翻转了。

    Deepfake 我自己

    Omni 号称的强项之一,是能把 AI 生成的内容”贴”到真实视频上。于是我让 Buddy 休息,换自己上场。用一段面无表情的自拍视频当底子,让 Omni 生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。

    结果让我有点措手不及。AI 告诉我的一些痕迹还是能看出来的:叉子碰碗的声音有点过于”制造”了;飞机视频背景里有个女性出现了两次(这显然不对);埃菲尔铁塔那段,AI 版本的我把头发扎成了马尾——我平时根本不扎马尾。

    但除了这些小毛病和一种说不清的”诡异感”,视频的逼真程度已经足够吓人。


    连我老公都骗过了

    我把吃意面的片段给我老公看了。他知道我在测 AI 视频工具,但我没告诉他画面里哪些部分是 AI 生成的。结果他没有看出来——他以为我就是对着一个摄像头在吃面,唯一觉得不对劲的地方是那个碗看着眼生。至于”吃面”这个动作本身,逼真到足以骗过跟我住了十年的人

    其他几个埃菲尔铁塔片段,有些看起来有点卡通,但其中有一个足够逼真,你可能要反复看几遍才能察觉是 AI 做的。我自己一看那个扎马尾的版本就知道不是我,但我不确定别人能不能看出来。这种感觉让我有点不舒服。

    不是免费的,而且积分消耗挺快

    当然,这一切都不是免费的。生成视频要消耗积分,根据场景长度和输入素材不同,消耗 15 到 40 积分不等。单次编辑要消耗 40 积分。我现在用的是每月 20 美元的 AI Pro 套餐,每月有 1000 积分。测了大约 20 个片段、部分做了编辑之后,我剩 145 积分。

    如果你对视频有比较具体的想法,可能要跟模型来回折腾不少次才能接近你想要的效果——每次编辑都要烧积分。

    我们确实已经深陷”恐怖谷”了。

    麻木了,但不代表没事

    说句实话(唉),我有点累了。几年前第一次测 Veo 3 的时候,我被它生成的真实感震惊了。过去几年,我一次又一次被 AI 生成假人、假照片的容易程度震惊。按理说 Omni 也应该让我震惊才对——我想它确实让我震惊了,但那种冲击力已经钝了。

    做出”以假乱真”的 AI 视频,还没有 Google 想让你相信的那么容易。但 Omni 确实在某些肉眼可见的维度上比 Veo 强。只要你有一个 Google 账号和一张信用卡,你就能拍一段自己坐在家里的视频,然后让它看起来像你正坐在飞往毛伊岛的航班上——付出的努力几乎可以忽略不计。

    我们可能还没到 Hassabis 说的”奇点的山麓”那么夸张,但确实已经深陷恐怖谷之中了。

  • AlphaFold拿诺奖才5年,Google就开始转向了

    上个星期 Google I/O 的大会上,DeepMind CEO Demis Hassabis 上台说了一句话:”我们正站在奇点的 foothills(山麓)。”奇点嘛,就是那个 AI 智能超过人类、世界被彻底改变的理论时刻。听起来挺玄的。

    但仔细看他说这话的语境,就有点意思了。当时台上在讲 Google 的 AI 科研工具,重点展示了一段视频——用 WeatherNext(Google 的天气预报 AI)提前预警了去年 Hurricane Melissa 在牙买加的灾难性登陆,可能救了不少人。这确实是了不起的成就,但它跟”奇点”还差得远呢。

    Demis Hassabis at Google I/O
    Demis Hassabis 在 Google I/O 2026 上讲述 AI for Science 的新方向(图源:MIT Technology Review)

    两条路线的分歧

    这件事其实暴露了 Google 在”AI for Science”上的两条路线之争。一条是做专门的科研工具——比如 WeatherNext 预测天气、AlphaFold 预测蛋白质结构、AlphaGenome 做基因研究——这些工具针对特定科学问题设计,效果扎实,已经被全世界 300 多万研究人员在用。

    另一条路线更有野心:做出能自主做科研的 AI 智能体。不需要人类一步一步指导,AI 自己就能提出假设、设计实验、得出结论。这就是今年 Google I/O 上发布的 Gemini for Science 包背后的逻辑——把好几个基于大语言模型的科研系统整合到一个品牌下面。

    “我们正朝着这样的 AI 前进:它不只是辅助科学研究,而是开始自己做科学。”——Pushmeet Kohli,Google Cloud 首席科学家

    AlphaFold 的诺贝尔奖得主,被调去搞 AI 编程了

    这条新闻最让人玩味的地方来了。上个月《洛杉矶时报》曝出:Google Fellow John Jumper——就是靠 AlphaFold 拿了诺贝尔奖的那位——现在被调去搞 AI 编程,不再专门做科研 AI 工具了。

    这不难理解。Google 最近在 AI 编程工具上被 Anthropic 的 Claude Code 和 OpenAI 的工具压了一头,声誉受损,当然要把最顶尖的人才调过去追赶。但这也释放了一个信号:Google 正在把资源和注意力从”专门科研 AI 工具”往”通用 AI 科研智能体”偏移。


    AI 自己证伪数学猜想,意味着什么

    就在本周,OpenAI 宣布他们的一个模型证伪了一个重要的数学猜想——据一些数学家说,这是生成式 AI 迄今对数学领域做出的最有意义的贡献。有意思的是,OpenAI 用的这个模型并不是专门为数学设计的,而是一个通用推理模型,属于 GPT-5.5 那个系列。

    这说明通用 AI 智能体确实已经开始在科研领域做出实质性贡献了。如果它们能在数学上做到,那么在其他科学领域(当然要慢一些,因为科学结论需要实验验证)大概也只是时间问题。

    Gemini for Science 现在能干什么

    本次 I/O 发布的 Gemini for Science 包含两个主要工具:AI Co-Scientist(生成科研假设)和 AlphaEvolve(优化算法)。目前还没对公众开放,但 Google 已经允许研究人员申请试用权限了。

    早期测试的反馈不错。斯坦福大学的遗传学家 Gary Peltz 在《自然·医学》上发文,把用 AI Co-Scientist 比作”咨询德尔菲神谕”——也就是问神的意思。这个比喻挺传神的:AI 给出的假设不一定对,但需要人类专家去判断和验证。

    当然,专门的科研工具(比如 AlphaFold)和通用 AI 科研智能体并不是非此即彼的关系。智能体可以调用专门工具作为”工具库”的一部分。没有 AlphaFold 的帮助,任何 AI 系统目前都别想把蛋白质折叠结构预测准。但 Google 显然在把公众形象——以及至少一部分资源和人才——从专门工具的开发,转向更通用的方向。


    “合作者”,而不是”替代者”

    Google 在对外表态上很谨慎,一直强调这些科研 AI 智能体是”加速人类科学家工作的工具”,而不是取代他们。比如,这个工具叫”AI Co-Scientist”而不是”AI Scientist”,这个命名选择看起来相当刻意。

    Hassabis 在采访里也用了类似的说法:”在未来十年左右,我们应该把 AI 看作帮助科学家的神奇工具。再往后,就很难有把握了,但也许这些系统会变得更像合作者。”

    但问题在于:一个有效的科研合作者,本身必须先是一个合格的科研工作者。如果 Hassabis 说的”奇点的山麓”不是吹牛,那么 AI 科研智能体最终超过人类同行,并不是天方夜谭。

    Hassabis 在 I/O 期间跟记者 Mike Allen 聊天时提到,他最早被 AI 吸引,是因为看到物理学在 1970 年代之后进展停滞了;他在想,人类心智是不是在这个领域已经触到了天花板,也许 AI 能帮我们突破这个壁垒。超人类的 AI 科研智能体,确实符合这个描述。

    我们也许永远到不了那一步。但 Google 看起来正在往那个山顶爬。只是不知道,等到了之后,站在山顶的还会不会是我们人类。

  • SpaceX星舰V3首飞实录:助推器回收失败,IPO前的关键一役

    SpaceX本周搞了两个大动作:一边向SEC递交了IPO申请,准备6月中旬在纳斯达克上市;另一边把升级版的星舰V3送上了天。两个动作凑在一起,让这次试飞的意义不只是”又飞了一次”那么简单。

    SpaceX星舰V3发射
    星舰V3从德州Starbase发射升空(图源:TechCrunch)

    407英尺,人类最强火箭首飞

    星舰V3高度407英尺(约124米),是人类历史上建造过的最强大的火箭。本次发射在德州Starbase进行,当地时间下午5:30准时升空。

    发射几分钟后,上级星舰与超重型助推器分离,继续向太空飞行。助推器则调头准备返回,按计划应该在墨西哥湾模拟着陆。但问题来了——助推器的发动机没有正常重新点火,用来完成返回着陆的持续燃烧没能实现。结果助推器直接栽进了海里,大概率当场爆炸。

    上级星舰的表现相对好一些:虽然6台猛禽发动机中有1台在空中熄火,但还是成功部署了全部20个星链卫星模拟器,外加2颗经过改装的、用来拍摄星舰外表面的星链卫星。

    约1小时 after liftoff,星舰在印度洋模拟着陆,然后按预期翻倒爆炸。整个任务只能说勉强成功


    为什么这次试飞很重要

    这是星舰V3硬件的首次实战测试,SpaceX已经研发了好几个月。同时,这次还测试了Starbase的全新发射台——这个发射台SpaceX自己建了好几年。

    但更关键的背景是:SpaceX的IPO文件本周公开,预计6月中旬在纳斯达克上市,募资规模约750亿美元。这笔钱SpaceX打算用来:继续研发、推进庞大的AI野心、偿还与xAI和X(马斯克的社交媒体公司)相关的债务。

    • 星舰是SpaceX实现”让生命多行星化”使命的核心载体
    • 短期内的主要任务是部署更先进的星链卫星(星链是SpaceX唯一盈利的业务)
    • 第三代猛禽发动机推力更大、设计更简化;新助推器设计支持更快的发射节奏和更便捷的发射塔回收

    IPO前的这次失败,影响有多大?

    这次试飞是2025年10月以来星舰的首次飞行。之前SpaceX本来计划更早试射V3,但2025年11月一台升级版助推器在测试中发生爆炸,计划被迫推迟。周四的发射尝试也因为发射塔臂上的液压销不肯收回而取消——马斯克本人说的。

    助推器回收失败对IPO估值的影响,现在还不好说。SpaceX的招股书里肯定会把星舰作为未来业务的核心支柱之一来讲故事,但投资者更关心的可能是:星链业务的现金流、xAI的整合逻辑、以及马斯克的政治风险。

    星舰V3这次没完全成功,但也没完全失败。对于一家即将上市、要讲”太空+AI”大故事的 company来说,这样的测试结果,刚好够用,但肯定不够漂亮。

  • AI重建已故飞行员声音,NTSB紧急封锁公共档案访问

    去年一起UPS货机坠毁事故中,遇难飞行员的声音最近被人用AI给”还原”出来了。这事儿听起来像科幻电影情节,但它真实发生了,而且就在美国国家运输安全委员会(NTSB)的公共档案系统里被人”淘”出来的。

    声谱图变声音,AI做到了

    事情是这样的。NTSB的公共文档系统里存着大量事故调查数据,按法律规定,驾驶舱录音是不能直接公开的。但这次UPS 2976航班(肯塔基州路易斯维尔坠毁)的调查文档里,包含了一份语音记录器的声谱图——简单说,就是把声音信号转换成图像的数学文件。

    UPS货机坠毁事故现场
    UPS 2976航班肯塔基州坠毁现场(图源:Getty Images)

    知名YouTuber、精通物理和天文学的Scott Manley在X平台上指出:声谱图编码了数兆字节的数据,理论上可以从中重建出对应的音频。果然,有网友结合了这份声谱图和公开的文字记录,用Codex等AI工具,把驾驶舱语音记录器的近似音频给重建出来了,然后放到了互联网上传播。

    声谱图本身不是音频,但AI工具可以从图像”逆向”出近似的声音。这就像给你一张钢琴键按下的照片,有人能帮你”听”出弹的是什么曲子。

    NTSB紧急应对:史上首次关闭公共档案

    NTSB发现这件事之后,做了一个史无前例的决定——临时封锁了公共档案系统的访问权限。原因很明确:他们担心这种技术被滥用,会侵犯事故相关人员的隐私,也会破坏调查记录的完整性。

    上周五,NTSB恢复了文档系统的公共访问,但包括UPS 2976航班调查在内的42项调查暂时没有开放,正在等待进一步审查。也就是说,这些档案会不会重新公开、以什么形式公开,现在还是个问号。


    技术跑在规则前面

    这个事件暴露的问题挺值得想一想。NTSB的文档系统历史上一直对公众开放,声谱图文件本身也不包含可直接播放的音频,按之前的理解,这并不违反禁止公开驾驶舱录音的法律。

    但AI改变了这个等式。原本”安全”的公开数据,在AI工具的作用下,可以被转换成原本受法律保护的敏感内容。这说明,很多机构的信息公开规则,可能需要重新评估一遍——哪些数据现在看起来没问题,但配上AI工具之后,就会变成隐私泄露的源头。

    • 公共调查数据中的衍生数据(声谱图、频谱图等)是否需要重新分类?
    • AI还原音频的准确性和伦理边界在哪里?
    • 技术公司开发这类AI工具时,是否需要考虑滥用场景?

    这件事还没有引起大规模公众讨论,但它是AI时代一个非常典型的困境:技术能力已经超出了规则制定的速度。NTSB的应对至少是迅速的,但下一次,可能就不会这么简单了。

  • Waymo 的高速野心,被一段积水路拦住了

    高速路上的Waymo,先停了

    本周四,不少 Waymo 用户打开打车软件时发现:高速公路选项消失了。原本几分钟能走完的路程,现在系统提示要走地面道路,时间直接翻倍。

    Waymo 后来确认了:出于对施工区域的担忧,全美所有运营市场的高速公路驾驶服务全部暂停。与此同时,亚特兰大和圣安东尼奥两个城市的全部服务也停了,原因是洪水退去后道路还有遗留问题。

    Waymo 自动驾驶出租车在高速公路上
    Waymo 的自动驾驶出租车——高速公路服务现已暂停

    导火索是德州的积水路

    事情的直接起因挺尴尬:多辆 Waymo 自动驾驶出租车被拍到在德克萨斯州被淹的道路中高速行驶。视频在网上传开后,Waymo 不得不对整个车队发起软件召回。

    我们致力于成为用户和社区的友好伙伴。作为承诺的一部分,我们会做出主动决策,包括暂时暂停部分服务。

    —— Waymo 发言人 Chris Pappas

    发言人说暂停是”出于对施工区域的担忧”,但没具体说车辆在施工区域遇到了什么问题。地面道路驾驶服务不受影响,但高速这块先按下暂停键。

    高速公路是个关键能力

    这事对 Waymo 的扩张计划影响不小。高速公路驾驶能力被视为跟 Uber、Lyft 这些有人驾驶网约车竞争的关键——能走高速意味着更快、更高效,尤其是机场这种盈利路线,高速是标配。

    • 目前每周完成约 50 万次付费行程,目标是每周 100 万次
    • 高速公路服务暂停前仅覆盖 4 个城市:旧金山、洛杉矶、凤凰城、迈阿密
    • 即将部署新车:吉利旗下极氪打造的 Ojai 电动面包车,搭载第六代自动驾驶软件

    最近有点水逆

    这次暂停是 Waymo 近期一系列负面事件中的最新一起。尽管数据显示它的车在减少交通事故和伤亡方面确实有进步,但极端场景下的表现还是让人捏把汗。

    前几天在亚特兰大,一辆空驶的 Waymo 堵在死胡同里,把整个社区的交通搞瘫痪了。达拉斯也有司机拍到一辆 Waymo 在繁忙路口闯红灯。虽然这些是个例,但凑在一起,给人的感觉是:技术还没完全准备好应对复杂现实。

    目前 Waymo 没有给出恢复高速公路服务的时间表,亚特兰大和圣安东尼奥的服务恢复时间也一样。对于一家正在激进扩张、准备大规模商业化的公司来说,这种不确定性不是什么好信号。

  • Chrome DevTools MCP 来了,AI 编程智能体终于能直接调试浏览器

    Chrome 官方出手了

    Chrome DevTools 团队这几天悄悄上线了一个新玩意——chrome-devtools-mcp。名字听起来很技术,但做的事其实挺有意思:让 AI 编程智能体能够直接”摸”到浏览器的开发工具。

    以前 AI 写代码,基本就是在那儿纯文本推理,顶多看看静态代码。代码写出来能不能跑、跑起来有没有 bug、在浏览器里表现怎么样,AI 其实是不知道的。这个 MCP 项目就是来补这个短板的。

    Chrome DevTools MCP GitHub 仓库
    Chrome DevTools MCP 项目已开源发布

    MCP 是个啥

    MCP(模型上下文协议)是最近 AI 圈比较热的一个标准,用来让大模型和外部工具、数据源做标准化通信。Chrome 团队把这个协议用到了 DevTools 上,相当于给 AI 装了一双眼睛和一双手。

    AI 智能体现在可以像人类开发者一样,实时检查 DOM 树、监控网络请求、分析控制台日志、调试 JavaScript 执行。

    这意味着什么?意味着 AI 不光能写代码,还能在真实浏览器环境里验证代码对不对、哪出问题了、怎么修。这个闭环一旦打通,前端自动化开发和 AI 自修复代码的能力会直接上一个台阶。

    为什么这事值得关注

    Chrome 官方出来推这个,信号挺明确的:浏览器厂商开始认真看待 AI 编程这个场景了。不是做个插件凑热闹,而是把核心调试能力通过标准化协议开放出来。

    • 权威性有保障,Chrome 团队自己在维护
    • 已经上了 NPM,能直接装进现有工作流
    • 兼容 Claude、GPT 这些主流大模型
    • 前端自动化、Web 测试、爬虫调试这些场景直接受益

    对开发者意味着什么

    如果你在用 Claude Code、Cursor 这类 AI 编程工具,这个 MCP 服务可以让它们直接操作浏览器调试,不用你手动去 DevTools 里查问题再贴给 AI 分析。AI 自己就能看 DOM、抓网络请求、打断点调试。

    项目现在在 GitHub 上开源,搜 ChromeDevTools/chrome-devtools-mcp 就能找到。NPM 上也有打包好的版本,装完配置一下就能用。

  • ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    微软和OpenAI又搞新动作了。最新推出的ChatGPT for PowerPoint集成功能,让你在侧边栏里打几句话,就能自动生成或编辑演示文稿。跟他家之前推出的Excel、Google Sheets插件差不多,都是把ChatGPT直接塞进办公软件里。

    ChatGPT for PowerPoint
    ChatGPT集成到PowerPoint侧边栏(图源:The Verge)

    怎么用?

    功能入口在PowerPoint的侧边栏,跟Excel那个插件的位置差不多。你可以直接打提示词让它生成幻灯片,也可以把文档、图片这些素材丢给它,让它帮你整理成演示文稿。

    比如说你要做一个产品介绍PPT,以前得自己一页页排版、找图、调格式,现在可能只需要告诉ChatGPT”帮我做一个15页的产品介绍,包含市场分析、功能介绍和竞品对比”,它就能给你搭出个框架来。

    “用户可以通过聊天提示词,结合文档、图片和其他素材,创建或编辑演示文稿。”——The Verge报道

    谁能用到?

    目前这个功能还在beta测试阶段,覆盖的用户群挺广:Business、Enterprise、Edu、Teacher、K-12、Free、Go、Pro、Plus订阅计划的ChatGPT用户都能用。也就是说,不管你是企业用户、教育工作者还是普通个人用户,只要用ChatGPT基本都能尝鲜。


    办公软件+AI,这波趋势停不下来

    微软在这件事上其实挺鸡贼的。一边是自己Copilot在推进,一边又允许OpenAI的ChatGPT直接集成进Office套件。表面上看是在开放生态,实际上不管用户用哪个,微软都能赚到钱——Copilot要订阅,ChatGPT for Microsoft 365也要走微软的渠道。

    对普通用户来说,这确实能省不少时间。做PPT最烦的不是想内容,而是调格式、找模板、对齐元素这些琐碎活。AI帮你把框架搭好,你只需要改改内容、换个配色,效率至少提升一倍。

    当然,生成的PPT质量怎么样还得实测。如果版式太死板、审美不过关,可能反而要花更多时间返工。不过从Excel插件的使用反馈看,OpenAI在这件事上还算靠谱,至少能帮你省掉最无聊的那部分工作。

    • 功能:侧边栏集成,支持提示词生成/编辑PPT
    • 支持素材:文档、图片及其他源文件
    • 当前状态:beta测试阶段
    • 可用计划:Business/Enterprise/Edu/Teacher/K-12/Free/Go/Pro/Plus

    办公软件的AI化已经是大势所趋。再过两年,可能没人会手动从零开始做PPT了——就像现在没人会手动排版一封电子邮件一样。早适应,早省事。

    📎 原文来源:ChatGPT for PowerPoint generates presentations with prompts(The Verge,2026-05-21)
  • 英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达刚发布的2027财年第一季度财报,数字简直离谱。总营收816亿美元,其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说,这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

    Nvidia财报创纪录
    英伟达财报再次刷新纪录(图源:The Verge)

    AI数据中心的”印钞机”

    752亿美元是什么概念?很多科技公司一整年的收入都达不到这个数字,而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片,从微软、谷歌到字节跳动、阿里,大家都在扩建算力基础设施。

    “持续增长的AI数据中心芯片需求,推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

    下一代芯片Vera Rubin要来了

    财报电话会议上,英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出,从第三季度开始”。这意味着大概2026年7-9月之间,我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的,定位是替代当前Blackwell架构的下一代产品。

    不过也有不那么亮眼的数字。受内存(RAM)短缺和价格上涨影响,英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上,成本涨了,消费者也不急着换电脑。


    为什么这个数字很重要

    92%的同比增长,说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破,但至少从现在的数据看,科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司,都需要英伟达的芯片来训练模型和跑推理。

    而且这个趋势很可能还会持续——Vera Rubin一旦量产,性能会比现在的Blackwell更强,到时候又会引发新一轮的采购潮。对于英伟达来说,眼下的挑战可能不是需求不够,而是产能能不能跟上。

    • 总营收:816亿美元(创纪录)
    • 数据中心营收:752亿美元(同比增长92%)
    • 下一代芯片:Vera Rubin将于2026年Q3推出
    • 隐忧:PC业务受内存短缺影响销量下滑

    AI这场仗,英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶,中国本土的芯片厂商也在崛起。不过按照现在的需求量,短期内英伟达的”印钞机”估计还停不下来。

    📎 原文来源:Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year(The Verge,2026-05-20)
  • Meta悄悄做了个新App:Forum想让你在Facebook群组里用AI聊天

    Meta前几天偷偷上架了一个iPhone应用,叫Forum。看名字你可能没感觉,但这东西其实就是把Facebook群组从主应用里”拆”出来,做了一个独立的地方,还塞了一个AI聊天机器人在里面。

    Meta Forum App
    Meta新推出的Forum应用,专为Facebook群组设计

    为什么要把群组”拆”出来

    这件事得从用户行为说起。不知道你有没有发现,现在很多人搜东西,会在谷歌搜索后面加个”Reddit”——因为他们想看真人怎么说的,而不是SEO优化过的营销内容。

    Meta肯定也注意到这个趋势了。人们去Facebook群组,本质上也是在找”真实人类的观点”。但问题是,Facebook主应用太臃肿了,信息流、广告、推荐内容混在一起,找群组里的历史讨论真的累。

    Forum的定位很明确:它想做一个”部分像Reddit、部分像Facebook、部分像谷歌AI概览”的东西。核心思路是——你要找信息,不用出Meta的生态。

    AI聊天机器人是核心,不是摆设

    Forum里内置了一个AI聊天机器人,这个设计挺聪明的。Facebook群组有个长期痛点:很多有价值的信息埋在几年前的对话串里,你根本翻不到。

    这个AI机器人干的事,本质上就是帮你”搜”群组里的内容,但它不是给你一个搜索结果列表,而是直接用对话的方式把答案告诉你——就像谷歌的AI概览那样,只不过信息来源是你的群组。

    对Meta来说,这个设计有个很大的好处:用户不用跳到外部搜索引擎或者Reddit去搜同样的问题了,他们直接在Forum里就能拿到”社区驱动的答案”。


    这不是Meta第一次做群组独立App

    有意思的是,Meta(那时候还叫Facebook)其实2017年就做过一个独立群组应用,后来给关了。这次的Forum,某种程度上是那个失败项目的”AI增强复活版”。

    但这次的逻辑不太一样。2017年那个,基本上就是把群组功能原封不动搬到一个新应用里。这次的Forum,从设计思路上就是围绕”AI优先”来的——搜索、信息提取、内容导航,都是AI先上,然后才是传统的信息流。

    而且Forum不会替代主Facebook应用里的群组功能。它是一种”分流”:想要沉浸式刷信息流的,继续用主应用;想要高效找信息、参与专业讨论的,来Forum。

    竞争逻辑:守住自己的流量

    如果把这件事放在更大的背景里看,Forum其实是Meta对Reddit和ChatGPT的一种防守反击。

    Reddit这几年吃掉了大量”找真实答案”的搜索流量,很多人甚至已经不去谷歌了,直接去Reddit搜。而ChatGPT这类AI搜索工具,也在侵蚀传统搜索引擎的领土。

    Meta的算盘是:我手里有几百万个Facebook群组,里面全是真实人类的讨论。如果我能用一个AI机器人把这些内容”激活”,让用户不用离开我的生态就能拿到他们想要的答案,那我不就同时挡住了Reddit和AI搜索工具的进攻吗?

    这个逻辑能不能跑通,现在还不好说。但至少从战略意图上看,Forum是Meta在”社交+AI”这个方向上一次挺认真的尝试。

    会有一些有意思的可能性

    如果Forum真的做起来了,可能会出现一些挺有意思的场景。比如你加入一个摄影群组,不用翻几年的 old posts,直接问AI”这个镜头适合拍人像吗”,它就能把群组里所有相关的讨论帮你总结出来。

    或者加入一个育儿群组,问”两岁宝宝不爱吃饭怎么办”,AI给你的是几百位真实家长的经验,而不是百度百科上冷冰冰的文字。

    当然,这一切的前提是:Meta得让用户愿意下载一个额外的App。在2026年的今天,这件事本身就不容易。

  • Anthropic Project Glasswing:用Claude揪出10000个漏洞,网络安全游戏规则变了

    前几天翻到Anthropic的一个项目更新,有点震惊。他们搞了个叫Project Glasswing的东西,拿Claude Mythos Preview去扫那些”系统重要性软件”的代码,一个月不到,找出了一万多个高危和严重级别的漏洞。

    Anthropic Project Glasswing
    Project Glasswing使用Claude Mythos Preview识别软件漏洞

    一个月一万多个漏洞,这是什么概念

    先说这个数字。一万多个高危/严重漏洞,不是那种”你的按钮颜色不对”级别的bug,是真正能被恶意利用、搞垮系统的那种。Anthropic说他们用的是”系统重要性软件”——就是那些全世界都在用、但你可能没意识到它存在的基础库和关键基础设施代码。

    传统的安全审计,一个团队花几个月才能把一个大型项目扫一遍。Claude Mythos Preview这个速度,基本是把”发现漏洞”这个步骤给工业化了。

    Claude Mythos Preview的能力在于理解复杂代码的结构,找出传统扫描器会漏掉的深层安全缺陷。这不是简单的模式匹配,而是真正的”理解”代码在做什么。

    瓶颈转移了:从”找漏洞”到”修漏洞”

    这个项目最让我感兴趣的地方,不是”AI找到了很多漏洞”这件事本身,而是它暴露出来的新问题:现在找漏洞已经不是瓶颈了,怎么验证、怎么披露、怎么修,这才是卡住的地方。

    想象一下,你的AI一天给你报几百个可能的漏洞,你得一个个去看它是不是真的、危害有多大、怎么修。AI把”发现”的成本几乎降到了零,但”验证和修复”还是得人来干。Anthropic在更新里也承认了这一点——现在的瓶颈是人的速度,不是AI的速度。


    50个机构一起上,但细节要等90天

    Anthropic不是自己单干,他们拉了大概50个组织一起做这个项目。有开源社区的人,有软件厂商,也有安全机构。想法很简单:关键基础设施的安全是公共品,大家一起护。

    但他们执行的是一个相当严格的”协同漏洞披露”政策:发现漏洞之后,最多90天(或者补丁发布后45天)才会公开细节。理由也很充分——如果Anthropic今天发现了一个漏洞,明天就把细节发出去,那在开发者把补丁做出来之前,黑客就能拿着这个信息去攻击那些还没更新的系统。

    所以对普通人来说,你现在听到的关于Project Glasswing的消息,其实是个”滞后指标”。真正厉害的那些发现,得等几个月才能知道详情。

    这件事的意义不止于”找漏洞”

    我觉得这件事真正值得关注的,是它暗示了一个趋势:AI在安全领域的应用,正在从”辅助工具”变成”基础设施”。以前你请个安全团队来审计代码,是按人天收费的。现在Anthropic用AI把这个事情的规模拉上去了,成本结构就完全不一样了。

    对于那些维护着关键开源项目、但没钱请安全团队的小团队来说,这种AI驱动的安全审计可能是个真正意义上的”救命稻草”。当然,前提是Anthropic愿意把这种能力开放出来,而不只是自己玩。

    另外值得思考的是:当AI既能用来”找漏洞”也能用来”挖漏洞”的时候,这场军备竞赛会往哪个方向走?Anthropic现在是站在防守这一边的,但那些能力,换个角度也能用来进攻。