博客

  • AI重建已故飞行员声音,NTSB紧急封锁公共档案访问

    去年一起UPS货机坠毁事故中,遇难飞行员的声音最近被人用AI给”还原”出来了。这事儿听起来像科幻电影情节,但它真实发生了,而且就在美国国家运输安全委员会(NTSB)的公共档案系统里被人”淘”出来的。

    声谱图变声音,AI做到了

    事情是这样的。NTSB的公共文档系统里存着大量事故调查数据,按法律规定,驾驶舱录音是不能直接公开的。但这次UPS 2976航班(肯塔基州路易斯维尔坠毁)的调查文档里,包含了一份语音记录器的声谱图——简单说,就是把声音信号转换成图像的数学文件。

    UPS货机坠毁事故现场
    UPS 2976航班肯塔基州坠毁现场(图源:Getty Images)

    知名YouTuber、精通物理和天文学的Scott Manley在X平台上指出:声谱图编码了数兆字节的数据,理论上可以从中重建出对应的音频。果然,有网友结合了这份声谱图和公开的文字记录,用Codex等AI工具,把驾驶舱语音记录器的近似音频给重建出来了,然后放到了互联网上传播。

    声谱图本身不是音频,但AI工具可以从图像”逆向”出近似的声音。这就像给你一张钢琴键按下的照片,有人能帮你”听”出弹的是什么曲子。

    NTSB紧急应对:史上首次关闭公共档案

    NTSB发现这件事之后,做了一个史无前例的决定——临时封锁了公共档案系统的访问权限。原因很明确:他们担心这种技术被滥用,会侵犯事故相关人员的隐私,也会破坏调查记录的完整性。

    上周五,NTSB恢复了文档系统的公共访问,但包括UPS 2976航班调查在内的42项调查暂时没有开放,正在等待进一步审查。也就是说,这些档案会不会重新公开、以什么形式公开,现在还是个问号。


    技术跑在规则前面

    这个事件暴露的问题挺值得想一想。NTSB的文档系统历史上一直对公众开放,声谱图文件本身也不包含可直接播放的音频,按之前的理解,这并不违反禁止公开驾驶舱录音的法律。

    但AI改变了这个等式。原本”安全”的公开数据,在AI工具的作用下,可以被转换成原本受法律保护的敏感内容。这说明,很多机构的信息公开规则,可能需要重新评估一遍——哪些数据现在看起来没问题,但配上AI工具之后,就会变成隐私泄露的源头。

    • 公共调查数据中的衍生数据(声谱图、频谱图等)是否需要重新分类?
    • AI还原音频的准确性和伦理边界在哪里?
    • 技术公司开发这类AI工具时,是否需要考虑滥用场景?

    这件事还没有引起大规模公众讨论,但它是AI时代一个非常典型的困境:技术能力已经超出了规则制定的速度。NTSB的应对至少是迅速的,但下一次,可能就不会这么简单了。

  • OpenNana提示词图库

    OpenNana提示词图库


  • AI 图像创作中心

    AI 图像创作中心

    AI 图像创作中心


  • Waymo 的高速野心,被一段积水路拦住了

    高速路上的Waymo,先停了

    本周四,不少 Waymo 用户打开打车软件时发现:高速公路选项消失了。原本几分钟能走完的路程,现在系统提示要走地面道路,时间直接翻倍。

    Waymo 后来确认了:出于对施工区域的担忧,全美所有运营市场的高速公路驾驶服务全部暂停。与此同时,亚特兰大和圣安东尼奥两个城市的全部服务也停了,原因是洪水退去后道路还有遗留问题。

    Waymo 自动驾驶出租车在高速公路上
    Waymo 的自动驾驶出租车——高速公路服务现已暂停

    导火索是德州的积水路

    事情的直接起因挺尴尬:多辆 Waymo 自动驾驶出租车被拍到在德克萨斯州被淹的道路中高速行驶。视频在网上传开后,Waymo 不得不对整个车队发起软件召回。

    我们致力于成为用户和社区的友好伙伴。作为承诺的一部分,我们会做出主动决策,包括暂时暂停部分服务。

    —— Waymo 发言人 Chris Pappas

    发言人说暂停是”出于对施工区域的担忧”,但没具体说车辆在施工区域遇到了什么问题。地面道路驾驶服务不受影响,但高速这块先按下暂停键。

    高速公路是个关键能力

    这事对 Waymo 的扩张计划影响不小。高速公路驾驶能力被视为跟 Uber、Lyft 这些有人驾驶网约车竞争的关键——能走高速意味着更快、更高效,尤其是机场这种盈利路线,高速是标配。

    • 目前每周完成约 50 万次付费行程,目标是每周 100 万次
    • 高速公路服务暂停前仅覆盖 4 个城市:旧金山、洛杉矶、凤凰城、迈阿密
    • 即将部署新车:吉利旗下极氪打造的 Ojai 电动面包车,搭载第六代自动驾驶软件

    最近有点水逆

    这次暂停是 Waymo 近期一系列负面事件中的最新一起。尽管数据显示它的车在减少交通事故和伤亡方面确实有进步,但极端场景下的表现还是让人捏把汗。

    前几天在亚特兰大,一辆空驶的 Waymo 堵在死胡同里,把整个社区的交通搞瘫痪了。达拉斯也有司机拍到一辆 Waymo 在繁忙路口闯红灯。虽然这些是个例,但凑在一起,给人的感觉是:技术还没完全准备好应对复杂现实。

    目前 Waymo 没有给出恢复高速公路服务的时间表,亚特兰大和圣安东尼奥的服务恢复时间也一样。对于一家正在激进扩张、准备大规模商业化的公司来说,这种不确定性不是什么好信号。

  • Chrome DevTools MCP 来了,AI 编程智能体终于能直接调试浏览器

    Chrome 官方出手了

    Chrome DevTools 团队这几天悄悄上线了一个新玩意——chrome-devtools-mcp。名字听起来很技术,但做的事其实挺有意思:让 AI 编程智能体能够直接”摸”到浏览器的开发工具。

    以前 AI 写代码,基本就是在那儿纯文本推理,顶多看看静态代码。代码写出来能不能跑、跑起来有没有 bug、在浏览器里表现怎么样,AI 其实是不知道的。这个 MCP 项目就是来补这个短板的。

    Chrome DevTools MCP GitHub 仓库
    Chrome DevTools MCP 项目已开源发布

    MCP 是个啥

    MCP(模型上下文协议)是最近 AI 圈比较热的一个标准,用来让大模型和外部工具、数据源做标准化通信。Chrome 团队把这个协议用到了 DevTools 上,相当于给 AI 装了一双眼睛和一双手。

    AI 智能体现在可以像人类开发者一样,实时检查 DOM 树、监控网络请求、分析控制台日志、调试 JavaScript 执行。

    这意味着什么?意味着 AI 不光能写代码,还能在真实浏览器环境里验证代码对不对、哪出问题了、怎么修。这个闭环一旦打通,前端自动化开发和 AI 自修复代码的能力会直接上一个台阶。

    为什么这事值得关注

    Chrome 官方出来推这个,信号挺明确的:浏览器厂商开始认真看待 AI 编程这个场景了。不是做个插件凑热闹,而是把核心调试能力通过标准化协议开放出来。

    • 权威性有保障,Chrome 团队自己在维护
    • 已经上了 NPM,能直接装进现有工作流
    • 兼容 Claude、GPT 这些主流大模型
    • 前端自动化、Web 测试、爬虫调试这些场景直接受益

    对开发者意味着什么

    如果你在用 Claude Code、Cursor 这类 AI 编程工具,这个 MCP 服务可以让它们直接操作浏览器调试,不用你手动去 DevTools 里查问题再贴给 AI 分析。AI 自己就能看 DOM、抓网络请求、打断点调试。

    项目现在在 GitHub 上开源,搜 ChromeDevTools/chrome-devtools-mcp 就能找到。NPM 上也有打包好的版本,装完配置一下就能用。

  • ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    微软和OpenAI又搞新动作了。最新推出的ChatGPT for PowerPoint集成功能,让你在侧边栏里打几句话,就能自动生成或编辑演示文稿。跟他家之前推出的Excel、Google Sheets插件差不多,都是把ChatGPT直接塞进办公软件里。

    ChatGPT for PowerPoint
    ChatGPT集成到PowerPoint侧边栏(图源:The Verge)

    怎么用?

    功能入口在PowerPoint的侧边栏,跟Excel那个插件的位置差不多。你可以直接打提示词让它生成幻灯片,也可以把文档、图片这些素材丢给它,让它帮你整理成演示文稿。

    比如说你要做一个产品介绍PPT,以前得自己一页页排版、找图、调格式,现在可能只需要告诉ChatGPT”帮我做一个15页的产品介绍,包含市场分析、功能介绍和竞品对比”,它就能给你搭出个框架来。

    “用户可以通过聊天提示词,结合文档、图片和其他素材,创建或编辑演示文稿。”——The Verge报道

    谁能用到?

    目前这个功能还在beta测试阶段,覆盖的用户群挺广:Business、Enterprise、Edu、Teacher、K-12、Free、Go、Pro、Plus订阅计划的ChatGPT用户都能用。也就是说,不管你是企业用户、教育工作者还是普通个人用户,只要用ChatGPT基本都能尝鲜。


    办公软件+AI,这波趋势停不下来

    微软在这件事上其实挺鸡贼的。一边是自己Copilot在推进,一边又允许OpenAI的ChatGPT直接集成进Office套件。表面上看是在开放生态,实际上不管用户用哪个,微软都能赚到钱——Copilot要订阅,ChatGPT for Microsoft 365也要走微软的渠道。

    对普通用户来说,这确实能省不少时间。做PPT最烦的不是想内容,而是调格式、找模板、对齐元素这些琐碎活。AI帮你把框架搭好,你只需要改改内容、换个配色,效率至少提升一倍。

    当然,生成的PPT质量怎么样还得实测。如果版式太死板、审美不过关,可能反而要花更多时间返工。不过从Excel插件的使用反馈看,OpenAI在这件事上还算靠谱,至少能帮你省掉最无聊的那部分工作。

    • 功能:侧边栏集成,支持提示词生成/编辑PPT
    • 支持素材:文档、图片及其他源文件
    • 当前状态:beta测试阶段
    • 可用计划:Business/Enterprise/Edu/Teacher/K-12/Free/Go/Pro/Plus

    办公软件的AI化已经是大势所趋。再过两年,可能没人会手动从零开始做PPT了——就像现在没人会手动排版一封电子邮件一样。早适应,早省事。

    📎 原文来源:ChatGPT for PowerPoint generates presentations with prompts(The Verge,2026-05-21)
  • 英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达刚发布的2027财年第一季度财报,数字简直离谱。总营收816亿美元,其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说,这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

    Nvidia财报创纪录
    英伟达财报再次刷新纪录(图源:The Verge)

    AI数据中心的”印钞机”

    752亿美元是什么概念?很多科技公司一整年的收入都达不到这个数字,而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片,从微软、谷歌到字节跳动、阿里,大家都在扩建算力基础设施。

    “持续增长的AI数据中心芯片需求,推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

    下一代芯片Vera Rubin要来了

    财报电话会议上,英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出,从第三季度开始”。这意味着大概2026年7-9月之间,我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的,定位是替代当前Blackwell架构的下一代产品。

    不过也有不那么亮眼的数字。受内存(RAM)短缺和价格上涨影响,英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上,成本涨了,消费者也不急着换电脑。


    为什么这个数字很重要

    92%的同比增长,说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破,但至少从现在的数据看,科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司,都需要英伟达的芯片来训练模型和跑推理。

    而且这个趋势很可能还会持续——Vera Rubin一旦量产,性能会比现在的Blackwell更强,到时候又会引发新一轮的采购潮。对于英伟达来说,眼下的挑战可能不是需求不够,而是产能能不能跟上。

    • 总营收:816亿美元(创纪录)
    • 数据中心营收:752亿美元(同比增长92%)
    • 下一代芯片:Vera Rubin将于2026年Q3推出
    • 隐忧:PC业务受内存短缺影响销量下滑

    AI这场仗,英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶,中国本土的芯片厂商也在崛起。不过按照现在的需求量,短期内英伟达的”印钞机”估计还停不下来。

    📎 原文来源:Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year(The Verge,2026-05-20)
  • AutoGen – 微软开源的多智能体对话框架

    AutoGen – 微软开源的多智能体对话框架

    AutoGen Logo
    AutoGen – 多智能体AI协作框架

    📝 项目简介

    AutoGen 是微软研究院开源的事件驱动编程框架,专门用于构建可扩展的多智能体AI系统。它就像 AI Agent 世界的”交响乐团指挥”,让不同的 AI 智能体能够协同工作、互相对话,共同完成复杂的任务。无论你是想构建自动化的工作流程,还是研究多智能体协作,AutoGen 都能提供强大而灵活的解决方案。


    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8 或更高版本
    • pip 包管理工具
    • (可选)Docker – 用于容器化代码执行
    • OpenAI API Key 或其他 LLM 服务访问权限

    快速安装步骤

    推荐使用 pip 安装指定版本,避免版本兼容问题:

    pip install autogen-agentchat~=0.2

    💡 提示:当前 0.2 版本稳定可用,0.4 稳定版也已发布,旧版本用户可参考迁移指南升级。


    💡 核心功能

    1. 低门槛构建多智能体对话应用

    AutoGen 大大简化了复杂 LLM 工作流的编排、自动化和优化。你只需要写少量代码,就能搭建起下一代 LLM 应用,同时最大化 LLM 的性能,弥补其固有缺陷。

    2. 支持多样化对话模式

    框架提供了可自定义、可对话的智能体,开发者可以自由调整对话自主性、智能体数量和对话拓扑结构。无论你需要确定性的工作流,还是动态的多智能体协作,都能找到合适的模式。

    3. 灵活的代码执行方式

    支持三种代码执行模式:无代码执行(纯文本对话)、本地命令行执行、Docker 容器执行。特别是 Docker 模式,可以在隔离环境中安全运行生成的代码,避免对本地环境造成污染。

    4. 全场景示例覆盖

    官方提供了不同复杂度、可直接运行的系统示例,覆盖多领域、多复杂度的应用场景。从简单的两智能体对话,到复杂的多专家联合决策系统,都有对应的参考实现。


    🎯 典型使用场景

    场景一:自动化数据分析与可视化

    假设你是一名分析师,需要快速分析两只股票(比如英伟达和特斯拉)年初至今的价格走势。使用 AutoGen,你可以让 UserProxyAgent 向 AssistantAgent 发起对话请求,AssistantAgent 会自动生成 Python 代码来获取股票数据、绘制图表,然后通过代码执行器运行代码,最终将生成的图表保存到文件。整个过程中,你不需要手动编写一行代码!

    场景二:多专家联合决策系统

    在复杂的业务场景中,单一 AI 可能难以做出全面准确的决策。使用 AutoGen,你可以创建多个具有不同专长的智能体(比如:数据分析师、行业专家、风险评估师),让它们通过对话协作,共同完成投资决策、医疗诊断、技术选型等复杂任务。每个智能体都可以调用不同的工具和 API,真正实现”三个臭皮匠,顶个诸葛亮”。

    场景三:AI Agent 研究与教学

    AutoGen 由微软研究院、宾夕法尼亚州立大学、华盛顿大学的合作研究支撑,是多智能体 AI 系统研究的理想平台。研究人员可以基于 AutoGen 快速验证新的对话模式、协作策略;教师可以用它制作生动的教学演示,让学生直观理解多智能体系统的工作原理。


    🌟 推荐理由

    为什么我强烈推荐 AutoGen?

    • 🏢 大厂背书,值得信赖:微软研究院主导开发,代码质量高,文档完善,社区活跃
    • 🚀 降低门槛,快速上手:相比 LangChain 等框架,AutoGen 的多智能体对话模式更直观,示例丰富,新手也能快速入门
    • 🛡️ 安全可控:支持 Docker 容器化执行代码,支持人工介入(human-in-the-loop),避免 AI 生成的危险代码直接运行
    • 🔧 高度灵活:可以自由定义智能体的行为、对话流程、工具调用,满足各种定制化需求
    • 📚 生态丰富:作为”智能体 AI 领域的 PyTorch”,AutoGen 正在成为多智能体系统的标准框架,未来潜力巨大

    我个人觉得,如果你对 AI Agent、多智能体系统、LLM 应用开发感兴趣,AutoGen 绝对是必学的框架之一。它不仅能帮你快速实现想法,还能让你深入理解多智能体协作的精髓。


    📥 下载地址


    本文介绍了 AutoGen 多智能体框架的核心特性和应用场景。如果你正在构建 AI Agent 系统,不妨试试这个强大的工具!

  • AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    自2012年以来,英国文学杂志《格兰塔》(Granta)每年都会公布英联邦短篇小说奖的地区获奖者。今年的入选作品却出了状况:其中一篇作品,看起来像是AI生成的。

    贾米尔·纳齐尔(Jamir Nazir)的《丛林中的蛇》(The Serpent in the Grove)具备大语言模型生成文本的多处典型特征:混合隐喻、首语重复、三元素列举。我承认这里也是三元素列举,但我保证这篇文章完全由我本人独立撰写,没有借助任何AI工具,我所有的作品都是如此。

    AI写作文学争议
    AI写作闯入文学圈,评委和读者都措手不及(图源:The Verge)

    三元素列举、破折号、单词”delve”——这些都是AI特征吗

    我最初对”纳齐尔的作品由AI生成”的指控持怀疑态度。我知道很多人会用LLM辅助写作,甚至完全让AI代笔,但我对同行中出现的那种”AI偏执”一直很警惕。据说破折号、单词”delve(钻研)”以及三元素列举都是AI写作的特征,短促有力的句子也是,尤其是当这类句子用来衔接长句的时候。

    但我作为人类,以前写作时也肯定用过上述所有特征。毕竟LLM的训练数据就是人类的写作内容,它们只是在模仿输入的内容。可AI生成的文本确实有一种诡异的质感,哪怕你一时说不出哪里不对,也能感觉到异样。

    “AI写作有一种我学会识别的特殊节奏,很难用语言描述。AI使用程度有一个光谱,从’AI帮我编辑’到’AI写了整篇内容’,这个案例在我看来属于后者的范畴。”
    ——纳比尔·S·库雷希,乔治梅森大学默卡特斯中心前AI访问学者

    评委分不清,AI检测工具也分不清

    问题在于,哪怕AI使用的嫌疑很大,所有人都无法百分百确定。英联邦基金会总干事拉兹米·法鲁克表示,该组织已经知晓有关获奖作品使用AI的指控。法鲁克称,所有提交作品参赛的作家都会被问及作品是否为原创、未发表内容,所有入围作家都亲自声明没有使用AI辅助撰写故事。

    “在出现能够可靠检测AI使用、同时能解决未发表小说相关挑战的有效工具或流程之前,英联邦基金会和英联邦短篇小说奖必须遵循信任原则开展工作,”法鲁克表示。

    《格兰塔》方面则将纳齐尔的作品输入Claude,”询问它是否为AI生成内容”。出版人西格丽德·劳辛在一份声明中称:”回复内容很长,结论是’几乎可以肯定不是无人类辅助生成的’。”但Claude并不是AI检测工具,它是基于大语言模型的聊天机器人。

    诺奖得主的AI使用,让读者震惊

    本周,波兰作家奥尔加·托卡尔丘克(Olga Tokarczuk)承认她使用AI辅助创作过程——这位2018年诺贝尔文学奖得主的做法,对于崇拜她的读者来说依然令人震惊。

    “我经常会直接把一个想法输入机器,加上提示词:’亲爱的,我们怎么把这个想法写得精彩?’”托卡尔丘克说。她在波兹南的一场活动中用波兰语发表了这番评论,不幸的是,它走红的时间正好和英联邦奖争议的时间重合。

    托卡尔丘克在分享给Lit Hub的一份三点声明中澄清了她的AI使用情况,她解释说自己没有用AI写即将出版的新书,但确实用它来”更快地记录和核实事实”,不过她会独立验证这些信息。


    AI生成的文本有一种”诡异质感”,但你看到的时候就知道

    当我把纳齐尔的作品输入AI和剽窃检测软件Pangram时,结果显示100%是AI生成的。根据Pangram的说法,最明显的特征是纳齐尔对三元组的使用;单词”stubborn(固执的)”,它在AI生成文本中出现的概率是人类写作的6倍。

    但我不满意这个结果,于是把我即将出版的新书的未发表片段(我目前正在编辑)输入Pangram检测。仅一个段落就包含了两个三元组。(这部分内容写得不好,所以我才要编辑。)Pangram显示片段100%是人类写的,这是事实,但我还是不满意。

    人类创作的作品有一种难以言喻的特质,AI生成的作品也是如此。也许AI生成的文本就像色情内容:你看到的时候就知道是它,哪怕你说不出原因。

  • 马斯克的Grok尬住了:美国政府不用,SpaceX IPO0却要拿它讲故事

    马斯克的Grok尬住了:政府不用,SpaceX IPO却拿它讲故事

    有个尴尬的事实关于马斯克的”求真”AI聊天机器人Grok:它不太好用,也没什么人在用。这是路透社最新报道的核心结论——Grok在美国政府去年AI使用记录中几乎查无此人。

    路透社审查了400多份明确列出供应商的政府AI使用案例,Grok或xAI只出现了3次,还都是文档起草、社交媒体管理这类基础任务,而且每次都跟微软、OpenAI这些竞争对手同时出现。作为对比,OpenAI的模型出现了230多次,谷歌和Anthropic各自出现了几十次。

    Elon Musk Grok AI
    马斯克力推的Grok,在政府采购记录里几乎查无此人(图源:The Verge)

    政府不买账,五角大楼也不感冒

    在另一份记录更雄心勃勃的政府AI项目(用户数较少)的数据库里,情况也好不到哪去。Grok只出现了3次:两次是选举援助委员会的日常行政任务,一次是能源部在劳伦斯利弗莫尔国家实验室的文档摘要和基础研究试点。路透社统计到140个涉及微软和OpenAI的条目,我简单扫了一眼,Anthropic至少有10个条目,谷歌的Gemini更是几十个。

    这些榜单对政府采纳情况的衡量是不完整且零散的,很多条目没有列出具体供应商,而且很明显”什么算AI”也没有统一定义。数据也不包括情报机构或五角大楼——xAI去年拿下了2亿美元合同,最近还在Anthropic被拉黑之后,获准在机密网络上运行。

    “它就是不够好。”一位不愿具名的五角大楼消息人士这样说,补充说那里的工作人员更倾向于用Gemini或Claude。

    公开的人工智能模型排行榜也支持这个看法。Anthropic、谷歌、OpenAI霸占了前列,Grok除了偶尔在图像或视频类别里冒个泡,基本挤不进前十。

    SpaceX的IPO讲故事,靠Grok撑起2.85万亿美元

    这对马斯克来说够尴尬的,对SpaceX来说更尴尬——这家公司今年早些时候合并了xAI。这家火箭公司的IPO招股书把AI——特指Grok——放在向投资者推介的核心位置。SpaceX声称找到了”人类历史上最大的可操作总 addressable 市场”:一个惊人的2.85万亿美元机会,虽然很遗憾,它没有给出到达那里的时间表。 practically all of this estimated value comes from AI, enterprise AI in particular, not rockets or satellites.

    路透社指出,Grok在政府机构的表现,可以暗示它在其他工作场所的表现。作为xAI进军企业客户的一部分,马斯克据说向银行施压,要求它们购买Grok订阅才能参与SpaceX的IPO——但如果它们觉得钱花得不值,这些交易可能只是短期 fix。

    训练用竞争对手的模型,产品还”有毒”

    更尬的是,马斯克最近承认xAI用了OpenAI的模型来帮助训练和改良Grok。这个被称为”蒸馏”的过程,公司在训练自家模型时用是标准操作,但用竞争对手的系统来做就争议大了。Grok连它用来训练的模型都打不过。

    在面向消费者的公开版本里,Grok还故意做得让人不爽。马斯克把这款聊天机器人包装成比ChatGPT更公正、审查更少的替代品,但这翻译成了一个证据标准松散、对马斯克有不合健康的迷恋、以及一长串攻击性、阴谋论和性化输出的产品记录。就算工作场所的护栏不同,企业也不一定欢迎这种东西。Grok的辉煌记录包括捧希特勒、质疑大屠杀死亡人数、在X上泼数百万张未经同意的性化深度伪造图,包括儿童的、搞了一个种族主义和跨性别恐惧症的维基百科仿品、还有一个”辣妹动漫女友”。别忘了它曾经自称”机械希特勒”的时刻。如果Grok是个人类员工,我觉得HR不会拖太久就会介入。


    SpaceX似乎明白问题所在。在招股书中,公司警告说Grok的”辣”模式或”疯”模式带有”升高的风险”,包括声誉损害、监管审查和诉讼。用企业话说就是:这个聊天机器人要让我们被告。

    Grok这个名字来自罗伯特·海因莱因的《异乡人》,大概意思是某件事物的深刻而透彻的理解。这里需要理解的事情并不复杂:马斯克花了几十亿美元打造了一个不太好用、不太受欢迎的聊天机器人,但它却是支撑SpaceX天文数字估值的关键。祝好运。