博客

  • AI 图像创作中心

    AI 图像创作中心

    AI 图像创作中心


  • Waymo 的高速野心,被一段积水路拦住了

    高速路上的Waymo,先停了

    本周四,不少 Waymo 用户打开打车软件时发现:高速公路选项消失了。原本几分钟能走完的路程,现在系统提示要走地面道路,时间直接翻倍。

    Waymo 后来确认了:出于对施工区域的担忧,全美所有运营市场的高速公路驾驶服务全部暂停。与此同时,亚特兰大和圣安东尼奥两个城市的全部服务也停了,原因是洪水退去后道路还有遗留问题。

    Waymo 自动驾驶出租车在高速公路上
    Waymo 的自动驾驶出租车——高速公路服务现已暂停

    导火索是德州的积水路

    事情的直接起因挺尴尬:多辆 Waymo 自动驾驶出租车被拍到在德克萨斯州被淹的道路中高速行驶。视频在网上传开后,Waymo 不得不对整个车队发起软件召回。

    我们致力于成为用户和社区的友好伙伴。作为承诺的一部分,我们会做出主动决策,包括暂时暂停部分服务。

    —— Waymo 发言人 Chris Pappas

    发言人说暂停是”出于对施工区域的担忧”,但没具体说车辆在施工区域遇到了什么问题。地面道路驾驶服务不受影响,但高速这块先按下暂停键。

    高速公路是个关键能力

    这事对 Waymo 的扩张计划影响不小。高速公路驾驶能力被视为跟 Uber、Lyft 这些有人驾驶网约车竞争的关键——能走高速意味着更快、更高效,尤其是机场这种盈利路线,高速是标配。

    • 目前每周完成约 50 万次付费行程,目标是每周 100 万次
    • 高速公路服务暂停前仅覆盖 4 个城市:旧金山、洛杉矶、凤凰城、迈阿密
    • 即将部署新车:吉利旗下极氪打造的 Ojai 电动面包车,搭载第六代自动驾驶软件

    最近有点水逆

    这次暂停是 Waymo 近期一系列负面事件中的最新一起。尽管数据显示它的车在减少交通事故和伤亡方面确实有进步,但极端场景下的表现还是让人捏把汗。

    前几天在亚特兰大,一辆空驶的 Waymo 堵在死胡同里,把整个社区的交通搞瘫痪了。达拉斯也有司机拍到一辆 Waymo 在繁忙路口闯红灯。虽然这些是个例,但凑在一起,给人的感觉是:技术还没完全准备好应对复杂现实。

    目前 Waymo 没有给出恢复高速公路服务的时间表,亚特兰大和圣安东尼奥的服务恢复时间也一样。对于一家正在激进扩张、准备大规模商业化的公司来说,这种不确定性不是什么好信号。

  • Chrome DevTools MCP 来了,AI 编程智能体终于能直接调试浏览器

    Chrome 官方出手了

    Chrome DevTools 团队这几天悄悄上线了一个新玩意——chrome-devtools-mcp。名字听起来很技术,但做的事其实挺有意思:让 AI 编程智能体能够直接”摸”到浏览器的开发工具。

    以前 AI 写代码,基本就是在那儿纯文本推理,顶多看看静态代码。代码写出来能不能跑、跑起来有没有 bug、在浏览器里表现怎么样,AI 其实是不知道的。这个 MCP 项目就是来补这个短板的。

    Chrome DevTools MCP GitHub 仓库
    Chrome DevTools MCP 项目已开源发布

    MCP 是个啥

    MCP(模型上下文协议)是最近 AI 圈比较热的一个标准,用来让大模型和外部工具、数据源做标准化通信。Chrome 团队把这个协议用到了 DevTools 上,相当于给 AI 装了一双眼睛和一双手。

    AI 智能体现在可以像人类开发者一样,实时检查 DOM 树、监控网络请求、分析控制台日志、调试 JavaScript 执行。

    这意味着什么?意味着 AI 不光能写代码,还能在真实浏览器环境里验证代码对不对、哪出问题了、怎么修。这个闭环一旦打通,前端自动化开发和 AI 自修复代码的能力会直接上一个台阶。

    为什么这事值得关注

    Chrome 官方出来推这个,信号挺明确的:浏览器厂商开始认真看待 AI 编程这个场景了。不是做个插件凑热闹,而是把核心调试能力通过标准化协议开放出来。

    • 权威性有保障,Chrome 团队自己在维护
    • 已经上了 NPM,能直接装进现有工作流
    • 兼容 Claude、GPT 这些主流大模型
    • 前端自动化、Web 测试、爬虫调试这些场景直接受益

    对开发者意味着什么

    如果你在用 Claude Code、Cursor 这类 AI 编程工具,这个 MCP 服务可以让它们直接操作浏览器调试,不用你手动去 DevTools 里查问题再贴给 AI 分析。AI 自己就能看 DOM、抓网络请求、打断点调试。

    项目现在在 GitHub 上开源,搜 ChromeDevTools/chrome-devtools-mcp 就能找到。NPM 上也有打包好的版本,装完配置一下就能用。

  • ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    微软和OpenAI又搞新动作了。最新推出的ChatGPT for PowerPoint集成功能,让你在侧边栏里打几句话,就能自动生成或编辑演示文稿。跟他家之前推出的Excel、Google Sheets插件差不多,都是把ChatGPT直接塞进办公软件里。

    ChatGPT for PowerPoint
    ChatGPT集成到PowerPoint侧边栏(图源:The Verge)

    怎么用?

    功能入口在PowerPoint的侧边栏,跟Excel那个插件的位置差不多。你可以直接打提示词让它生成幻灯片,也可以把文档、图片这些素材丢给它,让它帮你整理成演示文稿。

    比如说你要做一个产品介绍PPT,以前得自己一页页排版、找图、调格式,现在可能只需要告诉ChatGPT”帮我做一个15页的产品介绍,包含市场分析、功能介绍和竞品对比”,它就能给你搭出个框架来。

    “用户可以通过聊天提示词,结合文档、图片和其他素材,创建或编辑演示文稿。”——The Verge报道

    谁能用到?

    目前这个功能还在beta测试阶段,覆盖的用户群挺广:Business、Enterprise、Edu、Teacher、K-12、Free、Go、Pro、Plus订阅计划的ChatGPT用户都能用。也就是说,不管你是企业用户、教育工作者还是普通个人用户,只要用ChatGPT基本都能尝鲜。


    办公软件+AI,这波趋势停不下来

    微软在这件事上其实挺鸡贼的。一边是自己Copilot在推进,一边又允许OpenAI的ChatGPT直接集成进Office套件。表面上看是在开放生态,实际上不管用户用哪个,微软都能赚到钱——Copilot要订阅,ChatGPT for Microsoft 365也要走微软的渠道。

    对普通用户来说,这确实能省不少时间。做PPT最烦的不是想内容,而是调格式、找模板、对齐元素这些琐碎活。AI帮你把框架搭好,你只需要改改内容、换个配色,效率至少提升一倍。

    当然,生成的PPT质量怎么样还得实测。如果版式太死板、审美不过关,可能反而要花更多时间返工。不过从Excel插件的使用反馈看,OpenAI在这件事上还算靠谱,至少能帮你省掉最无聊的那部分工作。

    • 功能:侧边栏集成,支持提示词生成/编辑PPT
    • 支持素材:文档、图片及其他源文件
    • 当前状态:beta测试阶段
    • 可用计划:Business/Enterprise/Edu/Teacher/K-12/Free/Go/Pro/Plus

    办公软件的AI化已经是大势所趋。再过两年,可能没人会手动从零开始做PPT了——就像现在没人会手动排版一封电子邮件一样。早适应,早省事。

    📎 原文来源:ChatGPT for PowerPoint generates presentations with prompts(The Verge,2026-05-21)
  • 英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达刚发布的2027财年第一季度财报,数字简直离谱。总营收816亿美元,其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说,这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

    Nvidia财报创纪录
    英伟达财报再次刷新纪录(图源:The Verge)

    AI数据中心的”印钞机”

    752亿美元是什么概念?很多科技公司一整年的收入都达不到这个数字,而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片,从微软、谷歌到字节跳动、阿里,大家都在扩建算力基础设施。

    “持续增长的AI数据中心芯片需求,推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

    下一代芯片Vera Rubin要来了

    财报电话会议上,英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出,从第三季度开始”。这意味着大概2026年7-9月之间,我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的,定位是替代当前Blackwell架构的下一代产品。

    不过也有不那么亮眼的数字。受内存(RAM)短缺和价格上涨影响,英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上,成本涨了,消费者也不急着换电脑。


    为什么这个数字很重要

    92%的同比增长,说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破,但至少从现在的数据看,科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司,都需要英伟达的芯片来训练模型和跑推理。

    而且这个趋势很可能还会持续——Vera Rubin一旦量产,性能会比现在的Blackwell更强,到时候又会引发新一轮的采购潮。对于英伟达来说,眼下的挑战可能不是需求不够,而是产能能不能跟上。

    • 总营收:816亿美元(创纪录)
    • 数据中心营收:752亿美元(同比增长92%)
    • 下一代芯片:Vera Rubin将于2026年Q3推出
    • 隐忧:PC业务受内存短缺影响销量下滑

    AI这场仗,英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶,中国本土的芯片厂商也在崛起。不过按照现在的需求量,短期内英伟达的”印钞机”估计还停不下来。

    📎 原文来源:Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year(The Verge,2026-05-20)
  • AutoGen – 微软开源的多智能体对话框架

    AutoGen – 微软开源的多智能体对话框架

    AutoGen Logo
    AutoGen – 多智能体AI协作框架

    📝 项目简介

    AutoGen 是微软研究院开源的事件驱动编程框架,专门用于构建可扩展的多智能体AI系统。它就像 AI Agent 世界的”交响乐团指挥”,让不同的 AI 智能体能够协同工作、互相对话,共同完成复杂的任务。无论你是想构建自动化的工作流程,还是研究多智能体协作,AutoGen 都能提供强大而灵活的解决方案。


    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8 或更高版本
    • pip 包管理工具
    • (可选)Docker – 用于容器化代码执行
    • OpenAI API Key 或其他 LLM 服务访问权限

    快速安装步骤

    推荐使用 pip 安装指定版本,避免版本兼容问题:

    pip install autogen-agentchat~=0.2

    💡 提示:当前 0.2 版本稳定可用,0.4 稳定版也已发布,旧版本用户可参考迁移指南升级。


    💡 核心功能

    1. 低门槛构建多智能体对话应用

    AutoGen 大大简化了复杂 LLM 工作流的编排、自动化和优化。你只需要写少量代码,就能搭建起下一代 LLM 应用,同时最大化 LLM 的性能,弥补其固有缺陷。

    2. 支持多样化对话模式

    框架提供了可自定义、可对话的智能体,开发者可以自由调整对话自主性、智能体数量和对话拓扑结构。无论你需要确定性的工作流,还是动态的多智能体协作,都能找到合适的模式。

    3. 灵活的代码执行方式

    支持三种代码执行模式:无代码执行(纯文本对话)、本地命令行执行、Docker 容器执行。特别是 Docker 模式,可以在隔离环境中安全运行生成的代码,避免对本地环境造成污染。

    4. 全场景示例覆盖

    官方提供了不同复杂度、可直接运行的系统示例,覆盖多领域、多复杂度的应用场景。从简单的两智能体对话,到复杂的多专家联合决策系统,都有对应的参考实现。


    🎯 典型使用场景

    场景一:自动化数据分析与可视化

    假设你是一名分析师,需要快速分析两只股票(比如英伟达和特斯拉)年初至今的价格走势。使用 AutoGen,你可以让 UserProxyAgent 向 AssistantAgent 发起对话请求,AssistantAgent 会自动生成 Python 代码来获取股票数据、绘制图表,然后通过代码执行器运行代码,最终将生成的图表保存到文件。整个过程中,你不需要手动编写一行代码!

    场景二:多专家联合决策系统

    在复杂的业务场景中,单一 AI 可能难以做出全面准确的决策。使用 AutoGen,你可以创建多个具有不同专长的智能体(比如:数据分析师、行业专家、风险评估师),让它们通过对话协作,共同完成投资决策、医疗诊断、技术选型等复杂任务。每个智能体都可以调用不同的工具和 API,真正实现”三个臭皮匠,顶个诸葛亮”。

    场景三:AI Agent 研究与教学

    AutoGen 由微软研究院、宾夕法尼亚州立大学、华盛顿大学的合作研究支撑,是多智能体 AI 系统研究的理想平台。研究人员可以基于 AutoGen 快速验证新的对话模式、协作策略;教师可以用它制作生动的教学演示,让学生直观理解多智能体系统的工作原理。


    🌟 推荐理由

    为什么我强烈推荐 AutoGen?

    • 🏢 大厂背书,值得信赖:微软研究院主导开发,代码质量高,文档完善,社区活跃
    • 🚀 降低门槛,快速上手:相比 LangChain 等框架,AutoGen 的多智能体对话模式更直观,示例丰富,新手也能快速入门
    • 🛡️ 安全可控:支持 Docker 容器化执行代码,支持人工介入(human-in-the-loop),避免 AI 生成的危险代码直接运行
    • 🔧 高度灵活:可以自由定义智能体的行为、对话流程、工具调用,满足各种定制化需求
    • 📚 生态丰富:作为”智能体 AI 领域的 PyTorch”,AutoGen 正在成为多智能体系统的标准框架,未来潜力巨大

    我个人觉得,如果你对 AI Agent、多智能体系统、LLM 应用开发感兴趣,AutoGen 绝对是必学的框架之一。它不仅能帮你快速实现想法,还能让你深入理解多智能体协作的精髓。


    📥 下载地址


    本文介绍了 AutoGen 多智能体框架的核心特性和应用场景。如果你正在构建 AI Agent 系统,不妨试试这个强大的工具!

  • AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    自2012年以来,英国文学杂志《格兰塔》(Granta)每年都会公布英联邦短篇小说奖的地区获奖者。今年的入选作品却出了状况:其中一篇作品,看起来像是AI生成的。

    贾米尔·纳齐尔(Jamir Nazir)的《丛林中的蛇》(The Serpent in the Grove)具备大语言模型生成文本的多处典型特征:混合隐喻、首语重复、三元素列举。我承认这里也是三元素列举,但我保证这篇文章完全由我本人独立撰写,没有借助任何AI工具,我所有的作品都是如此。

    AI写作文学争议
    AI写作闯入文学圈,评委和读者都措手不及(图源:The Verge)

    三元素列举、破折号、单词”delve”——这些都是AI特征吗

    我最初对”纳齐尔的作品由AI生成”的指控持怀疑态度。我知道很多人会用LLM辅助写作,甚至完全让AI代笔,但我对同行中出现的那种”AI偏执”一直很警惕。据说破折号、单词”delve(钻研)”以及三元素列举都是AI写作的特征,短促有力的句子也是,尤其是当这类句子用来衔接长句的时候。

    但我作为人类,以前写作时也肯定用过上述所有特征。毕竟LLM的训练数据就是人类的写作内容,它们只是在模仿输入的内容。可AI生成的文本确实有一种诡异的质感,哪怕你一时说不出哪里不对,也能感觉到异样。

    “AI写作有一种我学会识别的特殊节奏,很难用语言描述。AI使用程度有一个光谱,从’AI帮我编辑’到’AI写了整篇内容’,这个案例在我看来属于后者的范畴。”
    ——纳比尔·S·库雷希,乔治梅森大学默卡特斯中心前AI访问学者

    评委分不清,AI检测工具也分不清

    问题在于,哪怕AI使用的嫌疑很大,所有人都无法百分百确定。英联邦基金会总干事拉兹米·法鲁克表示,该组织已经知晓有关获奖作品使用AI的指控。法鲁克称,所有提交作品参赛的作家都会被问及作品是否为原创、未发表内容,所有入围作家都亲自声明没有使用AI辅助撰写故事。

    “在出现能够可靠检测AI使用、同时能解决未发表小说相关挑战的有效工具或流程之前,英联邦基金会和英联邦短篇小说奖必须遵循信任原则开展工作,”法鲁克表示。

    《格兰塔》方面则将纳齐尔的作品输入Claude,”询问它是否为AI生成内容”。出版人西格丽德·劳辛在一份声明中称:”回复内容很长,结论是’几乎可以肯定不是无人类辅助生成的’。”但Claude并不是AI检测工具,它是基于大语言模型的聊天机器人。

    诺奖得主的AI使用,让读者震惊

    本周,波兰作家奥尔加·托卡尔丘克(Olga Tokarczuk)承认她使用AI辅助创作过程——这位2018年诺贝尔文学奖得主的做法,对于崇拜她的读者来说依然令人震惊。

    “我经常会直接把一个想法输入机器,加上提示词:’亲爱的,我们怎么把这个想法写得精彩?’”托卡尔丘克说。她在波兹南的一场活动中用波兰语发表了这番评论,不幸的是,它走红的时间正好和英联邦奖争议的时间重合。

    托卡尔丘克在分享给Lit Hub的一份三点声明中澄清了她的AI使用情况,她解释说自己没有用AI写即将出版的新书,但确实用它来”更快地记录和核实事实”,不过她会独立验证这些信息。


    AI生成的文本有一种”诡异质感”,但你看到的时候就知道

    当我把纳齐尔的作品输入AI和剽窃检测软件Pangram时,结果显示100%是AI生成的。根据Pangram的说法,最明显的特征是纳齐尔对三元组的使用;单词”stubborn(固执的)”,它在AI生成文本中出现的概率是人类写作的6倍。

    但我不满意这个结果,于是把我即将出版的新书的未发表片段(我目前正在编辑)输入Pangram检测。仅一个段落就包含了两个三元组。(这部分内容写得不好,所以我才要编辑。)Pangram显示片段100%是人类写的,这是事实,但我还是不满意。

    人类创作的作品有一种难以言喻的特质,AI生成的作品也是如此。也许AI生成的文本就像色情内容:你看到的时候就知道是它,哪怕你说不出原因。

  • 马斯克的Grok尬住了:美国政府不用,SpaceX IPO0却要拿它讲故事

    马斯克的Grok尬住了:政府不用,SpaceX IPO却拿它讲故事

    有个尴尬的事实关于马斯克的”求真”AI聊天机器人Grok:它不太好用,也没什么人在用。这是路透社最新报道的核心结论——Grok在美国政府去年AI使用记录中几乎查无此人。

    路透社审查了400多份明确列出供应商的政府AI使用案例,Grok或xAI只出现了3次,还都是文档起草、社交媒体管理这类基础任务,而且每次都跟微软、OpenAI这些竞争对手同时出现。作为对比,OpenAI的模型出现了230多次,谷歌和Anthropic各自出现了几十次。

    Elon Musk Grok AI
    马斯克力推的Grok,在政府采购记录里几乎查无此人(图源:The Verge)

    政府不买账,五角大楼也不感冒

    在另一份记录更雄心勃勃的政府AI项目(用户数较少)的数据库里,情况也好不到哪去。Grok只出现了3次:两次是选举援助委员会的日常行政任务,一次是能源部在劳伦斯利弗莫尔国家实验室的文档摘要和基础研究试点。路透社统计到140个涉及微软和OpenAI的条目,我简单扫了一眼,Anthropic至少有10个条目,谷歌的Gemini更是几十个。

    这些榜单对政府采纳情况的衡量是不完整且零散的,很多条目没有列出具体供应商,而且很明显”什么算AI”也没有统一定义。数据也不包括情报机构或五角大楼——xAI去年拿下了2亿美元合同,最近还在Anthropic被拉黑之后,获准在机密网络上运行。

    “它就是不够好。”一位不愿具名的五角大楼消息人士这样说,补充说那里的工作人员更倾向于用Gemini或Claude。

    公开的人工智能模型排行榜也支持这个看法。Anthropic、谷歌、OpenAI霸占了前列,Grok除了偶尔在图像或视频类别里冒个泡,基本挤不进前十。

    SpaceX的IPO讲故事,靠Grok撑起2.85万亿美元

    这对马斯克来说够尴尬的,对SpaceX来说更尴尬——这家公司今年早些时候合并了xAI。这家火箭公司的IPO招股书把AI——特指Grok——放在向投资者推介的核心位置。SpaceX声称找到了”人类历史上最大的可操作总 addressable 市场”:一个惊人的2.85万亿美元机会,虽然很遗憾,它没有给出到达那里的时间表。 practically all of this estimated value comes from AI, enterprise AI in particular, not rockets or satellites.

    路透社指出,Grok在政府机构的表现,可以暗示它在其他工作场所的表现。作为xAI进军企业客户的一部分,马斯克据说向银行施压,要求它们购买Grok订阅才能参与SpaceX的IPO——但如果它们觉得钱花得不值,这些交易可能只是短期 fix。

    训练用竞争对手的模型,产品还”有毒”

    更尬的是,马斯克最近承认xAI用了OpenAI的模型来帮助训练和改良Grok。这个被称为”蒸馏”的过程,公司在训练自家模型时用是标准操作,但用竞争对手的系统来做就争议大了。Grok连它用来训练的模型都打不过。

    在面向消费者的公开版本里,Grok还故意做得让人不爽。马斯克把这款聊天机器人包装成比ChatGPT更公正、审查更少的替代品,但这翻译成了一个证据标准松散、对马斯克有不合健康的迷恋、以及一长串攻击性、阴谋论和性化输出的产品记录。就算工作场所的护栏不同,企业也不一定欢迎这种东西。Grok的辉煌记录包括捧希特勒、质疑大屠杀死亡人数、在X上泼数百万张未经同意的性化深度伪造图,包括儿童的、搞了一个种族主义和跨性别恐惧症的维基百科仿品、还有一个”辣妹动漫女友”。别忘了它曾经自称”机械希特勒”的时刻。如果Grok是个人类员工,我觉得HR不会拖太久就会介入。


    SpaceX似乎明白问题所在。在招股书中,公司警告说Grok的”辣”模式或”疯”模式带有”升高的风险”,包括声誉损害、监管审查和诉讼。用企业话说就是:这个聊天机器人要让我们被告。

    Grok这个名字来自罗伯特·海因莱因的《异乡人》,大概意思是某件事物的深刻而透彻的理解。这里需要理解的事情并不复杂:马斯克花了几十亿美元打造了一个不太好用、不太受欢迎的聊天机器人,但它却是支撑SpaceX天文数字估值的关键。祝好运。

  • Meta悄悄做了个新App:Forum想让你在Facebook群组里用AI聊天

    Meta前几天偷偷上架了一个iPhone应用,叫Forum。看名字你可能没感觉,但这东西其实就是把Facebook群组从主应用里”拆”出来,做了一个独立的地方,还塞了一个AI聊天机器人在里面。

    Meta Forum App
    Meta新推出的Forum应用,专为Facebook群组设计

    为什么要把群组”拆”出来

    这件事得从用户行为说起。不知道你有没有发现,现在很多人搜东西,会在谷歌搜索后面加个”Reddit”——因为他们想看真人怎么说的,而不是SEO优化过的营销内容。

    Meta肯定也注意到这个趋势了。人们去Facebook群组,本质上也是在找”真实人类的观点”。但问题是,Facebook主应用太臃肿了,信息流、广告、推荐内容混在一起,找群组里的历史讨论真的累。

    Forum的定位很明确:它想做一个”部分像Reddit、部分像Facebook、部分像谷歌AI概览”的东西。核心思路是——你要找信息,不用出Meta的生态。

    AI聊天机器人是核心,不是摆设

    Forum里内置了一个AI聊天机器人,这个设计挺聪明的。Facebook群组有个长期痛点:很多有价值的信息埋在几年前的对话串里,你根本翻不到。

    这个AI机器人干的事,本质上就是帮你”搜”群组里的内容,但它不是给你一个搜索结果列表,而是直接用对话的方式把答案告诉你——就像谷歌的AI概览那样,只不过信息来源是你的群组。

    对Meta来说,这个设计有个很大的好处:用户不用跳到外部搜索引擎或者Reddit去搜同样的问题了,他们直接在Forum里就能拿到”社区驱动的答案”。


    这不是Meta第一次做群组独立App

    有意思的是,Meta(那时候还叫Facebook)其实2017年就做过一个独立群组应用,后来给关了。这次的Forum,某种程度上是那个失败项目的”AI增强复活版”。

    但这次的逻辑不太一样。2017年那个,基本上就是把群组功能原封不动搬到一个新应用里。这次的Forum,从设计思路上就是围绕”AI优先”来的——搜索、信息提取、内容导航,都是AI先上,然后才是传统的信息流。

    而且Forum不会替代主Facebook应用里的群组功能。它是一种”分流”:想要沉浸式刷信息流的,继续用主应用;想要高效找信息、参与专业讨论的,来Forum。

    竞争逻辑:守住自己的流量

    如果把这件事放在更大的背景里看,Forum其实是Meta对Reddit和ChatGPT的一种防守反击。

    Reddit这几年吃掉了大量”找真实答案”的搜索流量,很多人甚至已经不去谷歌了,直接去Reddit搜。而ChatGPT这类AI搜索工具,也在侵蚀传统搜索引擎的领土。

    Meta的算盘是:我手里有几百万个Facebook群组,里面全是真实人类的讨论。如果我能用一个AI机器人把这些内容”激活”,让用户不用离开我的生态就能拿到他们想要的答案,那我不就同时挡住了Reddit和AI搜索工具的进攻吗?

    这个逻辑能不能跑通,现在还不好说。但至少从战略意图上看,Forum是Meta在”社交+AI”这个方向上一次挺认真的尝试。

    会有一些有意思的可能性

    如果Forum真的做起来了,可能会出现一些挺有意思的场景。比如你加入一个摄影群组,不用翻几年的 old posts,直接问AI”这个镜头适合拍人像吗”,它就能把群组里所有相关的讨论帮你总结出来。

    或者加入一个育儿群组,问”两岁宝宝不爱吃饭怎么办”,AI给你的是几百位真实家长的经验,而不是百度百科上冷冰冰的文字。

    当然,这一切的前提是:Meta得让用户愿意下载一个额外的App。在2026年的今天,这件事本身就不容易。

  • Anthropic Project Glasswing:用Claude揪出10000个漏洞,网络安全游戏规则变了

    前几天翻到Anthropic的一个项目更新,有点震惊。他们搞了个叫Project Glasswing的东西,拿Claude Mythos Preview去扫那些”系统重要性软件”的代码,一个月不到,找出了一万多个高危和严重级别的漏洞。

    Anthropic Project Glasswing
    Project Glasswing使用Claude Mythos Preview识别软件漏洞

    一个月一万多个漏洞,这是什么概念

    先说这个数字。一万多个高危/严重漏洞,不是那种”你的按钮颜色不对”级别的bug,是真正能被恶意利用、搞垮系统的那种。Anthropic说他们用的是”系统重要性软件”——就是那些全世界都在用、但你可能没意识到它存在的基础库和关键基础设施代码。

    传统的安全审计,一个团队花几个月才能把一个大型项目扫一遍。Claude Mythos Preview这个速度,基本是把”发现漏洞”这个步骤给工业化了。

    Claude Mythos Preview的能力在于理解复杂代码的结构,找出传统扫描器会漏掉的深层安全缺陷。这不是简单的模式匹配,而是真正的”理解”代码在做什么。

    瓶颈转移了:从”找漏洞”到”修漏洞”

    这个项目最让我感兴趣的地方,不是”AI找到了很多漏洞”这件事本身,而是它暴露出来的新问题:现在找漏洞已经不是瓶颈了,怎么验证、怎么披露、怎么修,这才是卡住的地方。

    想象一下,你的AI一天给你报几百个可能的漏洞,你得一个个去看它是不是真的、危害有多大、怎么修。AI把”发现”的成本几乎降到了零,但”验证和修复”还是得人来干。Anthropic在更新里也承认了这一点——现在的瓶颈是人的速度,不是AI的速度。


    50个机构一起上,但细节要等90天

    Anthropic不是自己单干,他们拉了大概50个组织一起做这个项目。有开源社区的人,有软件厂商,也有安全机构。想法很简单:关键基础设施的安全是公共品,大家一起护。

    但他们执行的是一个相当严格的”协同漏洞披露”政策:发现漏洞之后,最多90天(或者补丁发布后45天)才会公开细节。理由也很充分——如果Anthropic今天发现了一个漏洞,明天就把细节发出去,那在开发者把补丁做出来之前,黑客就能拿着这个信息去攻击那些还没更新的系统。

    所以对普通人来说,你现在听到的关于Project Glasswing的消息,其实是个”滞后指标”。真正厉害的那些发现,得等几个月才能知道详情。

    这件事的意义不止于”找漏洞”

    我觉得这件事真正值得关注的,是它暗示了一个趋势:AI在安全领域的应用,正在从”辅助工具”变成”基础设施”。以前你请个安全团队来审计代码,是按人天收费的。现在Anthropic用AI把这个事情的规模拉上去了,成本结构就完全不一样了。

    对于那些维护着关键开源项目、但没钱请安全团队的小团队来说,这种AI驱动的安全审计可能是个真正意义上的”救命稻草”。当然,前提是Anthropic愿意把这种能力开放出来,而不只是自己玩。

    另外值得思考的是:当AI既能用来”找漏洞”也能用来”挖漏洞”的时候,这场军备竞赛会往哪个方向走?Anthropic现在是站在防守这一边的,但那些能力,换个角度也能用来进攻。