博客

  • 英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达刚发布的2027财年第一季度财报,数字简直离谱。总营收816亿美元,其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说,这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

    Nvidia财报创纪录
    英伟达财报再次刷新纪录(图源:The Verge)

    AI数据中心的”印钞机”

    752亿美元是什么概念?很多科技公司一整年的收入都达不到这个数字,而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片,从微软、谷歌到字节跳动、阿里,大家都在扩建算力基础设施。

    “持续增长的AI数据中心芯片需求,推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

    下一代芯片Vera Rubin要来了

    财报电话会议上,英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出,从第三季度开始”。这意味着大概2026年7-9月之间,我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的,定位是替代当前Blackwell架构的下一代产品。

    不过也有不那么亮眼的数字。受内存(RAM)短缺和价格上涨影响,英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上,成本涨了,消费者也不急着换电脑。


    为什么这个数字很重要

    92%的同比增长,说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破,但至少从现在的数据看,科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司,都需要英伟达的芯片来训练模型和跑推理。

    而且这个趋势很可能还会持续——Vera Rubin一旦量产,性能会比现在的Blackwell更强,到时候又会引发新一轮的采购潮。对于英伟达来说,眼下的挑战可能不是需求不够,而是产能能不能跟上。

    • 总营收:816亿美元(创纪录)
    • 数据中心营收:752亿美元(同比增长92%)
    • 下一代芯片:Vera Rubin将于2026年Q3推出
    • 隐忧:PC业务受内存短缺影响销量下滑

    AI这场仗,英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶,中国本土的芯片厂商也在崛起。不过按照现在的需求量,短期内英伟达的”印钞机”估计还停不下来。

    📎 原文来源:Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year(The Verge,2026-05-20)
  • AutoGen – 微软开源的多智能体对话框架

    AutoGen – 微软开源的多智能体对话框架

    AutoGen Logo
    AutoGen – 多智能体AI协作框架

    📝 项目简介

    AutoGen 是微软研究院开源的事件驱动编程框架,专门用于构建可扩展的多智能体AI系统。它就像 AI Agent 世界的”交响乐团指挥”,让不同的 AI 智能体能够协同工作、互相对话,共同完成复杂的任务。无论你是想构建自动化的工作流程,还是研究多智能体协作,AutoGen 都能提供强大而灵活的解决方案。


    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8 或更高版本
    • pip 包管理工具
    • (可选)Docker – 用于容器化代码执行
    • OpenAI API Key 或其他 LLM 服务访问权限

    快速安装步骤

    推荐使用 pip 安装指定版本,避免版本兼容问题:

    pip install autogen-agentchat~=0.2

    💡 提示:当前 0.2 版本稳定可用,0.4 稳定版也已发布,旧版本用户可参考迁移指南升级。


    💡 核心功能

    1. 低门槛构建多智能体对话应用

    AutoGen 大大简化了复杂 LLM 工作流的编排、自动化和优化。你只需要写少量代码,就能搭建起下一代 LLM 应用,同时最大化 LLM 的性能,弥补其固有缺陷。

    2. 支持多样化对话模式

    框架提供了可自定义、可对话的智能体,开发者可以自由调整对话自主性、智能体数量和对话拓扑结构。无论你需要确定性的工作流,还是动态的多智能体协作,都能找到合适的模式。

    3. 灵活的代码执行方式

    支持三种代码执行模式:无代码执行(纯文本对话)、本地命令行执行、Docker 容器执行。特别是 Docker 模式,可以在隔离环境中安全运行生成的代码,避免对本地环境造成污染。

    4. 全场景示例覆盖

    官方提供了不同复杂度、可直接运行的系统示例,覆盖多领域、多复杂度的应用场景。从简单的两智能体对话,到复杂的多专家联合决策系统,都有对应的参考实现。


    🎯 典型使用场景

    场景一:自动化数据分析与可视化

    假设你是一名分析师,需要快速分析两只股票(比如英伟达和特斯拉)年初至今的价格走势。使用 AutoGen,你可以让 UserProxyAgent 向 AssistantAgent 发起对话请求,AssistantAgent 会自动生成 Python 代码来获取股票数据、绘制图表,然后通过代码执行器运行代码,最终将生成的图表保存到文件。整个过程中,你不需要手动编写一行代码!

    场景二:多专家联合决策系统

    在复杂的业务场景中,单一 AI 可能难以做出全面准确的决策。使用 AutoGen,你可以创建多个具有不同专长的智能体(比如:数据分析师、行业专家、风险评估师),让它们通过对话协作,共同完成投资决策、医疗诊断、技术选型等复杂任务。每个智能体都可以调用不同的工具和 API,真正实现”三个臭皮匠,顶个诸葛亮”。

    场景三:AI Agent 研究与教学

    AutoGen 由微软研究院、宾夕法尼亚州立大学、华盛顿大学的合作研究支撑,是多智能体 AI 系统研究的理想平台。研究人员可以基于 AutoGen 快速验证新的对话模式、协作策略;教师可以用它制作生动的教学演示,让学生直观理解多智能体系统的工作原理。


    🌟 推荐理由

    为什么我强烈推荐 AutoGen?

    • 🏢 大厂背书,值得信赖:微软研究院主导开发,代码质量高,文档完善,社区活跃
    • 🚀 降低门槛,快速上手:相比 LangChain 等框架,AutoGen 的多智能体对话模式更直观,示例丰富,新手也能快速入门
    • 🛡️ 安全可控:支持 Docker 容器化执行代码,支持人工介入(human-in-the-loop),避免 AI 生成的危险代码直接运行
    • 🔧 高度灵活:可以自由定义智能体的行为、对话流程、工具调用,满足各种定制化需求
    • 📚 生态丰富:作为”智能体 AI 领域的 PyTorch”,AutoGen 正在成为多智能体系统的标准框架,未来潜力巨大

    我个人觉得,如果你对 AI Agent、多智能体系统、LLM 应用开发感兴趣,AutoGen 绝对是必学的框架之一。它不仅能帮你快速实现想法,还能让你深入理解多智能体协作的精髓。


    📥 下载地址


    本文介绍了 AutoGen 多智能体框架的核心特性和应用场景。如果你正在构建 AI Agent 系统,不妨试试这个强大的工具!

  • AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    自2012年以来,英国文学杂志《格兰塔》(Granta)每年都会公布英联邦短篇小说奖的地区获奖者。今年的入选作品却出了状况:其中一篇作品,看起来像是AI生成的。

    贾米尔·纳齐尔(Jamir Nazir)的《丛林中的蛇》(The Serpent in the Grove)具备大语言模型生成文本的多处典型特征:混合隐喻、首语重复、三元素列举。我承认这里也是三元素列举,但我保证这篇文章完全由我本人独立撰写,没有借助任何AI工具,我所有的作品都是如此。

    AI写作文学争议
    AI写作闯入文学圈,评委和读者都措手不及(图源:The Verge)

    三元素列举、破折号、单词”delve”——这些都是AI特征吗

    我最初对”纳齐尔的作品由AI生成”的指控持怀疑态度。我知道很多人会用LLM辅助写作,甚至完全让AI代笔,但我对同行中出现的那种”AI偏执”一直很警惕。据说破折号、单词”delve(钻研)”以及三元素列举都是AI写作的特征,短促有力的句子也是,尤其是当这类句子用来衔接长句的时候。

    但我作为人类,以前写作时也肯定用过上述所有特征。毕竟LLM的训练数据就是人类的写作内容,它们只是在模仿输入的内容。可AI生成的文本确实有一种诡异的质感,哪怕你一时说不出哪里不对,也能感觉到异样。

    “AI写作有一种我学会识别的特殊节奏,很难用语言描述。AI使用程度有一个光谱,从’AI帮我编辑’到’AI写了整篇内容’,这个案例在我看来属于后者的范畴。”
    ——纳比尔·S·库雷希,乔治梅森大学默卡特斯中心前AI访问学者

    评委分不清,AI检测工具也分不清

    问题在于,哪怕AI使用的嫌疑很大,所有人都无法百分百确定。英联邦基金会总干事拉兹米·法鲁克表示,该组织已经知晓有关获奖作品使用AI的指控。法鲁克称,所有提交作品参赛的作家都会被问及作品是否为原创、未发表内容,所有入围作家都亲自声明没有使用AI辅助撰写故事。

    “在出现能够可靠检测AI使用、同时能解决未发表小说相关挑战的有效工具或流程之前,英联邦基金会和英联邦短篇小说奖必须遵循信任原则开展工作,”法鲁克表示。

    《格兰塔》方面则将纳齐尔的作品输入Claude,”询问它是否为AI生成内容”。出版人西格丽德·劳辛在一份声明中称:”回复内容很长,结论是’几乎可以肯定不是无人类辅助生成的’。”但Claude并不是AI检测工具,它是基于大语言模型的聊天机器人。

    诺奖得主的AI使用,让读者震惊

    本周,波兰作家奥尔加·托卡尔丘克(Olga Tokarczuk)承认她使用AI辅助创作过程——这位2018年诺贝尔文学奖得主的做法,对于崇拜她的读者来说依然令人震惊。

    “我经常会直接把一个想法输入机器,加上提示词:’亲爱的,我们怎么把这个想法写得精彩?’”托卡尔丘克说。她在波兹南的一场活动中用波兰语发表了这番评论,不幸的是,它走红的时间正好和英联邦奖争议的时间重合。

    托卡尔丘克在分享给Lit Hub的一份三点声明中澄清了她的AI使用情况,她解释说自己没有用AI写即将出版的新书,但确实用它来”更快地记录和核实事实”,不过她会独立验证这些信息。


    AI生成的文本有一种”诡异质感”,但你看到的时候就知道

    当我把纳齐尔的作品输入AI和剽窃检测软件Pangram时,结果显示100%是AI生成的。根据Pangram的说法,最明显的特征是纳齐尔对三元组的使用;单词”stubborn(固执的)”,它在AI生成文本中出现的概率是人类写作的6倍。

    但我不满意这个结果,于是把我即将出版的新书的未发表片段(我目前正在编辑)输入Pangram检测。仅一个段落就包含了两个三元组。(这部分内容写得不好,所以我才要编辑。)Pangram显示片段100%是人类写的,这是事实,但我还是不满意。

    人类创作的作品有一种难以言喻的特质,AI生成的作品也是如此。也许AI生成的文本就像色情内容:你看到的时候就知道是它,哪怕你说不出原因。

  • 马斯克的Grok尬住了:美国政府不用,SpaceX IPO0却要拿它讲故事

    马斯克的Grok尬住了:政府不用,SpaceX IPO却拿它讲故事

    有个尴尬的事实关于马斯克的”求真”AI聊天机器人Grok:它不太好用,也没什么人在用。这是路透社最新报道的核心结论——Grok在美国政府去年AI使用记录中几乎查无此人。

    路透社审查了400多份明确列出供应商的政府AI使用案例,Grok或xAI只出现了3次,还都是文档起草、社交媒体管理这类基础任务,而且每次都跟微软、OpenAI这些竞争对手同时出现。作为对比,OpenAI的模型出现了230多次,谷歌和Anthropic各自出现了几十次。

    Elon Musk Grok AI
    马斯克力推的Grok,在政府采购记录里几乎查无此人(图源:The Verge)

    政府不买账,五角大楼也不感冒

    在另一份记录更雄心勃勃的政府AI项目(用户数较少)的数据库里,情况也好不到哪去。Grok只出现了3次:两次是选举援助委员会的日常行政任务,一次是能源部在劳伦斯利弗莫尔国家实验室的文档摘要和基础研究试点。路透社统计到140个涉及微软和OpenAI的条目,我简单扫了一眼,Anthropic至少有10个条目,谷歌的Gemini更是几十个。

    这些榜单对政府采纳情况的衡量是不完整且零散的,很多条目没有列出具体供应商,而且很明显”什么算AI”也没有统一定义。数据也不包括情报机构或五角大楼——xAI去年拿下了2亿美元合同,最近还在Anthropic被拉黑之后,获准在机密网络上运行。

    “它就是不够好。”一位不愿具名的五角大楼消息人士这样说,补充说那里的工作人员更倾向于用Gemini或Claude。

    公开的人工智能模型排行榜也支持这个看法。Anthropic、谷歌、OpenAI霸占了前列,Grok除了偶尔在图像或视频类别里冒个泡,基本挤不进前十。

    SpaceX的IPO讲故事,靠Grok撑起2.85万亿美元

    这对马斯克来说够尴尬的,对SpaceX来说更尴尬——这家公司今年早些时候合并了xAI。这家火箭公司的IPO招股书把AI——特指Grok——放在向投资者推介的核心位置。SpaceX声称找到了”人类历史上最大的可操作总 addressable 市场”:一个惊人的2.85万亿美元机会,虽然很遗憾,它没有给出到达那里的时间表。 practically all of this estimated value comes from AI, enterprise AI in particular, not rockets or satellites.

    路透社指出,Grok在政府机构的表现,可以暗示它在其他工作场所的表现。作为xAI进军企业客户的一部分,马斯克据说向银行施压,要求它们购买Grok订阅才能参与SpaceX的IPO——但如果它们觉得钱花得不值,这些交易可能只是短期 fix。

    训练用竞争对手的模型,产品还”有毒”

    更尬的是,马斯克最近承认xAI用了OpenAI的模型来帮助训练和改良Grok。这个被称为”蒸馏”的过程,公司在训练自家模型时用是标准操作,但用竞争对手的系统来做就争议大了。Grok连它用来训练的模型都打不过。

    在面向消费者的公开版本里,Grok还故意做得让人不爽。马斯克把这款聊天机器人包装成比ChatGPT更公正、审查更少的替代品,但这翻译成了一个证据标准松散、对马斯克有不合健康的迷恋、以及一长串攻击性、阴谋论和性化输出的产品记录。就算工作场所的护栏不同,企业也不一定欢迎这种东西。Grok的辉煌记录包括捧希特勒、质疑大屠杀死亡人数、在X上泼数百万张未经同意的性化深度伪造图,包括儿童的、搞了一个种族主义和跨性别恐惧症的维基百科仿品、还有一个”辣妹动漫女友”。别忘了它曾经自称”机械希特勒”的时刻。如果Grok是个人类员工,我觉得HR不会拖太久就会介入。


    SpaceX似乎明白问题所在。在招股书中,公司警告说Grok的”辣”模式或”疯”模式带有”升高的风险”,包括声誉损害、监管审查和诉讼。用企业话说就是:这个聊天机器人要让我们被告。

    Grok这个名字来自罗伯特·海因莱因的《异乡人》,大概意思是某件事物的深刻而透彻的理解。这里需要理解的事情并不复杂:马斯克花了几十亿美元打造了一个不太好用、不太受欢迎的聊天机器人,但它却是支撑SpaceX天文数字估值的关键。祝好运。

  • Meta悄悄做了个新App:Forum想让你在Facebook群组里用AI聊天

    Meta前几天偷偷上架了一个iPhone应用,叫Forum。看名字你可能没感觉,但这东西其实就是把Facebook群组从主应用里”拆”出来,做了一个独立的地方,还塞了一个AI聊天机器人在里面。

    Meta Forum App
    Meta新推出的Forum应用,专为Facebook群组设计

    为什么要把群组”拆”出来

    这件事得从用户行为说起。不知道你有没有发现,现在很多人搜东西,会在谷歌搜索后面加个”Reddit”——因为他们想看真人怎么说的,而不是SEO优化过的营销内容。

    Meta肯定也注意到这个趋势了。人们去Facebook群组,本质上也是在找”真实人类的观点”。但问题是,Facebook主应用太臃肿了,信息流、广告、推荐内容混在一起,找群组里的历史讨论真的累。

    Forum的定位很明确:它想做一个”部分像Reddit、部分像Facebook、部分像谷歌AI概览”的东西。核心思路是——你要找信息,不用出Meta的生态。

    AI聊天机器人是核心,不是摆设

    Forum里内置了一个AI聊天机器人,这个设计挺聪明的。Facebook群组有个长期痛点:很多有价值的信息埋在几年前的对话串里,你根本翻不到。

    这个AI机器人干的事,本质上就是帮你”搜”群组里的内容,但它不是给你一个搜索结果列表,而是直接用对话的方式把答案告诉你——就像谷歌的AI概览那样,只不过信息来源是你的群组。

    对Meta来说,这个设计有个很大的好处:用户不用跳到外部搜索引擎或者Reddit去搜同样的问题了,他们直接在Forum里就能拿到”社区驱动的答案”。


    这不是Meta第一次做群组独立App

    有意思的是,Meta(那时候还叫Facebook)其实2017年就做过一个独立群组应用,后来给关了。这次的Forum,某种程度上是那个失败项目的”AI增强复活版”。

    但这次的逻辑不太一样。2017年那个,基本上就是把群组功能原封不动搬到一个新应用里。这次的Forum,从设计思路上就是围绕”AI优先”来的——搜索、信息提取、内容导航,都是AI先上,然后才是传统的信息流。

    而且Forum不会替代主Facebook应用里的群组功能。它是一种”分流”:想要沉浸式刷信息流的,继续用主应用;想要高效找信息、参与专业讨论的,来Forum。

    竞争逻辑:守住自己的流量

    如果把这件事放在更大的背景里看,Forum其实是Meta对Reddit和ChatGPT的一种防守反击。

    Reddit这几年吃掉了大量”找真实答案”的搜索流量,很多人甚至已经不去谷歌了,直接去Reddit搜。而ChatGPT这类AI搜索工具,也在侵蚀传统搜索引擎的领土。

    Meta的算盘是:我手里有几百万个Facebook群组,里面全是真实人类的讨论。如果我能用一个AI机器人把这些内容”激活”,让用户不用离开我的生态就能拿到他们想要的答案,那我不就同时挡住了Reddit和AI搜索工具的进攻吗?

    这个逻辑能不能跑通,现在还不好说。但至少从战略意图上看,Forum是Meta在”社交+AI”这个方向上一次挺认真的尝试。

    会有一些有意思的可能性

    如果Forum真的做起来了,可能会出现一些挺有意思的场景。比如你加入一个摄影群组,不用翻几年的 old posts,直接问AI”这个镜头适合拍人像吗”,它就能把群组里所有相关的讨论帮你总结出来。

    或者加入一个育儿群组,问”两岁宝宝不爱吃饭怎么办”,AI给你的是几百位真实家长的经验,而不是百度百科上冷冰冰的文字。

    当然,这一切的前提是:Meta得让用户愿意下载一个额外的App。在2026年的今天,这件事本身就不容易。

  • Anthropic Project Glasswing:用Claude揪出10000个漏洞,网络安全游戏规则变了

    前几天翻到Anthropic的一个项目更新,有点震惊。他们搞了个叫Project Glasswing的东西,拿Claude Mythos Preview去扫那些”系统重要性软件”的代码,一个月不到,找出了一万多个高危和严重级别的漏洞。

    Anthropic Project Glasswing
    Project Glasswing使用Claude Mythos Preview识别软件漏洞

    一个月一万多个漏洞,这是什么概念

    先说这个数字。一万多个高危/严重漏洞,不是那种”你的按钮颜色不对”级别的bug,是真正能被恶意利用、搞垮系统的那种。Anthropic说他们用的是”系统重要性软件”——就是那些全世界都在用、但你可能没意识到它存在的基础库和关键基础设施代码。

    传统的安全审计,一个团队花几个月才能把一个大型项目扫一遍。Claude Mythos Preview这个速度,基本是把”发现漏洞”这个步骤给工业化了。

    Claude Mythos Preview的能力在于理解复杂代码的结构,找出传统扫描器会漏掉的深层安全缺陷。这不是简单的模式匹配,而是真正的”理解”代码在做什么。

    瓶颈转移了:从”找漏洞”到”修漏洞”

    这个项目最让我感兴趣的地方,不是”AI找到了很多漏洞”这件事本身,而是它暴露出来的新问题:现在找漏洞已经不是瓶颈了,怎么验证、怎么披露、怎么修,这才是卡住的地方。

    想象一下,你的AI一天给你报几百个可能的漏洞,你得一个个去看它是不是真的、危害有多大、怎么修。AI把”发现”的成本几乎降到了零,但”验证和修复”还是得人来干。Anthropic在更新里也承认了这一点——现在的瓶颈是人的速度,不是AI的速度。


    50个机构一起上,但细节要等90天

    Anthropic不是自己单干,他们拉了大概50个组织一起做这个项目。有开源社区的人,有软件厂商,也有安全机构。想法很简单:关键基础设施的安全是公共品,大家一起护。

    但他们执行的是一个相当严格的”协同漏洞披露”政策:发现漏洞之后,最多90天(或者补丁发布后45天)才会公开细节。理由也很充分——如果Anthropic今天发现了一个漏洞,明天就把细节发出去,那在开发者把补丁做出来之前,黑客就能拿着这个信息去攻击那些还没更新的系统。

    所以对普通人来说,你现在听到的关于Project Glasswing的消息,其实是个”滞后指标”。真正厉害的那些发现,得等几个月才能知道详情。

    这件事的意义不止于”找漏洞”

    我觉得这件事真正值得关注的,是它暗示了一个趋势:AI在安全领域的应用,正在从”辅助工具”变成”基础设施”。以前你请个安全团队来审计代码,是按人天收费的。现在Anthropic用AI把这个事情的规模拉上去了,成本结构就完全不一样了。

    对于那些维护着关键开源项目、但没钱请安全团队的小团队来说,这种AI驱动的安全审计可能是个真正意义上的”救命稻草”。当然,前提是Anthropic愿意把这种能力开放出来,而不只是自己玩。

    另外值得思考的是:当AI既能用来”找漏洞”也能用来”挖漏洞”的时候,这场军备竞赛会往哪个方向走?Anthropic现在是站在防守这一边的,但那些能力,换个角度也能用来进攻。

  • 特朗普按下暂停键:AI安全行政令为什么黄了

    特朗普按下暂停键:AI安全行政令为什么黄了

    昨天有件事挺有意思。特朗普本来要签一个AI安全行政令,结果临门一脚给推迟了。

    这个行政令如果签了,会是美国AI监管史上挺重要的一个节点。它要求AI公司在发布先进模型前14到90天,把模型提交给政府做安全评估。逻辑很简单:你造了一把更锋利的刀,总得让监管看看这刀会不会伤到自己人。

    特朗普发表讲话
    特朗普推迟签署AI安全行政令(来源:Getty Images/TechCrunch)

    特朗普自己的解释

    特朗普对白宫记者团说的是:”我不喜欢里面的某些内容。我们在AI上领先中国,领先所有人,我不想做任何可能阻碍我们领先地位的事情。”

    这个表态其实挺直白的。翻译一下就是:监管可以要,但不能影响美国AI公司的竞争力。尤其是在和中国竞争的大背景下,任何可能让美国公司”束手束脚”的规则,都要慎重。

    “我们领先中国,我们领先所有人,我不想做任何会阻碍我们领先地位的事情。”
    ——唐纳德·特朗普

    非官方原因更有意思

    多家媒体透露了一个更”真实”的版本:没有足够多的科技行业CEO能在短时间内赶到华盛顿特区参加签署仪式。

    你品品这个逻辑。一个总统行政令的签署仪式,如果没有一堆科技大佬站在背后举着签字笔拍照,那这个仪式还有什么意义?AI监管这种事,本质上是要给企业界看的——你看,政府和我(特朗普)是站在你们这边的。

    如果CEO们都不来,这场秀就不好看了。所以推迟,等大家都有空了再搞。


    这个行政令到底要干什么

    说回行政令本身。它要求国家网络主管办公室(Office of the National Cyber Director)和其他相关机构,制定一套流程,在AI模型发布前对其安全性进行评估。

    这个要求的背景是:过去一年,Anthropic发布了Mythos,OpenAI发布了GPT-5.5 Cyber,这两款模型都具备快速发现并利用安全漏洞的能力。用大白话说就是:这些AI已经能自己找Bug、自己写攻击代码了

    监管者的问题很直接:如果AI能自己发现漏洞,那它会不会被坏人拿去干坏事?如果模型在发布前能被政府”过一遍安全检测”,是不是能减少这种风险?

    • 14-90天前置审查:AI公司需要在模型发布前最多提前90天、最少4天向政府提交模型
    • 安全评估流程:由政府机构评估模型是否存在被滥用于网络攻击、生物武器研发等风险
    • 跨机构协作:国家网络主管办公室牵头,联合其他相关机构共同制定标准

    为什么这个行政令有争议

    支持者会说:这是必要的安全护栏。AI能力越强,出事后的后果越严重。政府有必要在模型发布前看一眼。

    反对者(主要是AI公司和他们的支持者)会说:这会导致美国AI研发速度变慢。如果OpenAI要多等90天才能发布GPT-5.7,而中国的AI公司不需要等,那美国的技术领先优势就会被稀释。

    特朗普的表态显然站在了反对者这一边。他说行政令的措辞”可能成为阻碍”(could have been a blocker),这个表述很有意思——他不是说”这个行政令本身不好”,而是说”现在的版本有问题,要改”。

    网络安全与AI
    AI安全评估涉及多个政府机构的协作(来源:TechCrunch)

    这件事的背后逻辑

    把这件事放在更大的背景里看,有几个趋势值得注意:

    第一,美国AI监管正在进入”务实优先”阶段。拜登政府时期推过一些AI监管倡议,但特朗普2.0版本的核心逻辑是:监管不能影响竞争力。这次行政令推迟,就是这个逻辑的体现。

    第二,”拍照外交”仍然是政治秀的重要部分。科技CEO们的到场与否,能直接影响一个政策仪式的推进节奏。这说明AI行业和政府的互动,仍然高度依赖个人关系和公开示好。

    第三,AI安全问题的紧迫性没有被否认,只是被”优先级排序”了。特朗普没有说”AI安全不重要”,他说的是”现在的版本可能会阻碍发展”。这意味着未来还是会有一个版本的AI安全行政令出台,只是会更照顾产业界的感受。


    接下来会怎样

    按照华盛顿的办事节奏,这个行政令不会就此消失。白宫会重新修改措辞,把那些”可能阻碍发展”的条款弱化或者删除,然后挑一个CEO们都有空的日子,再搞一次签署仪式。

    但对于AI行业来说,这次推迟释放了一个明确信号:在特朗普2.0时代,AI公司的自由度会比很多人预期的要大。只要你能证明监管会影响美国的技术领先地位,那监管就很可能会为你让步。

    至于AI安全本身,可能就要靠行业自律了。

  • 谷歌AI眼镜上手:差一口气就成正经产品了

    谷歌I/O的”几乎时刻”:AI眼镜终于像个正经产品了

    上周谷歌I/O大会我摸到那个Android XR眼镜了。说”摸到”而不是”看到”,是因为终于有个大厂把AI眼镜做得不像科幻片道具,而是像个你能日常戴出门的东西。

    先说清楚,这次体验的还是原型机。但和往年那些”展示柜里的概念品”不一样,这次的完成度已经到了”差点就能卖”的程度。TechCrunch的Sarah Perez在现场试戴后写了一篇文章,标题就很诚实:We tried Google’s AI glasses and they’re almost there

    Google Android XR AI眼镜原型机
    谷歌Android XR眼镜原型机,与Gentle Monster合作设计(来源:Google/TechCrunch)

    两条腿走路:先卖音频版,再推显示版

    谷歌这次的策略挺聪明。他们说今年秋天先推仅音频版本的眼镜,就是没有显示屏、只靠耳机和Gemini语音交互的那个版本。然后晚些时候再推带显示屏的AR版。

    为什么要分两步走?我理解的原因有两个:一是音频版技术门槛低,供应链和品控更容易搞定,能赶在Meta Ray-Ban继续蚕食市场之前先占个坑;二是显示版确实需要再多打磨一阵,这次原型机的显示效果还不够锐利,长时间戴容易眼疲劳。

    谷歌和Warby Parker、Gentle Monster、三星一起做的这个眼镜,外观上已经不像”极客玩具”了。Gentle Monster那款的造型,普通年轻人戴着逛街完全不违和。

    实际戴起来怎么样

    我挑几个最有感的场景说:

    实时翻译是最好用的功能。演示人员说西班牙语,眼镜在我右眼上方显示英文文本,同时Gemini用英语在我耳边”悄悄话”。那个感觉……就像一个随身同声传译,而且不用低头看手机。对于经常出国的人来说,这个功能本身就值回票价了。

    导航也做得挺好。你告诉Gemini”导航到最近的咖啡店”,眼镜会在你视野里显示下一个转弯的信息。低头能看到地图上的蓝点,抬头走路的时候导航提示不会挡视线。这个设计细节说明谷歌真的想过”日常使用”的场景,而不是堆功能。

    拍照+AI处理这个组合有点意思。你可以直接说”拍张照片,把这个人变成动漫角色”,眼镜拍完照,传给Gemini和Nano Banana的服务器,几十秒后返回处理好的版本。当然现场Wi-Fi负载太高,来回花了45秒,但这个工作流本身是通顺的。

    Android XR眼镜显示界面演示
    眼镜显示界面可以叠加天气、导航、翻译等信息(来源:Google)

    但缺点也挺明显

    先说显示版的问题。原型机只有右眼有显示屏,图像有点模糊(TechCrunch的记者认为是他戴了左右眼度数不同的隐形眼镜导致的,但也有可能就是分辨率还不够)。更关键的是,戴了几分钟后右眼上方开始有疲劳感。这个问题如果不解决,没人能戴着它超过半小时。

    音频版的问题在于音质。现场太吵,音乐开到最大还是听不清细节。谷歌显然也没打算让它替代高端耳塞,它的定位就是”走路、做家务、骑车的时候能听个响,同时还听得清别人说话”。这个定位和Meta Ray-Ban是一样的。

    还有一个细节:原型机不能自动检测你是否戴着眼镜。量产版会有这个传感器,摘下来就暂停,戴上去继续。这种小功能看似不起眼,但日常用起来差别很大。


    谷歌的算盘

    为什么谷歌在这个时间点推AI眼镜?我理解有几个原因:

    • Meta Ray-Ban卖得不错,证明”眼镜+AI”这个形态是有市场需求的,谷歌不想再错过一波硬件浪潮
    • Gemini需要更多的”入口”。手机、网页、智能音箱都有了,眼镜是最自然的”始终在线”的场景
    • 安卓生态需要一个新的差异化卖点,尤其是在和苹果竞争的时候

    但谷歌也要面对一个现实:Meta已经在市面上卖了一年多,Snap也在做类似的事情。谷歌选择先推音频版”占坑”,再把显示版慢慢打磨到真正能用的程度,这个节奏是合理的。

    现场体验完我最直观的感受是:这款眼镜距离”能日常戴”还差最后那一小步。显示效果再锐利一点、续航再长一点、重量再轻一点,就够了。按照谷歌的节奏,显示版大概率要到2027年才会真正上市。

    到那时候,AI眼镜会不会已经是一片红海了?

  • Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI 特色图

    📌 项目简介

    Gemini CLI 是 Google 官方开源的终端 AI 智能体,把 Gemini 大模型的能力直接搬进了你的命令行。它不只是一个聊天工具——它能读你的代码库、帮你写代码、调试 Bug、执行终端命令,甚至直接操作文件,真正实现了「在终端里有一个懂你项目的 AI 搭档」。


    ⚙️ 安装要求和过程

    📦 环境要求

    • Node.js >= 18(必须!)
    • npm 或 npx(自带)
    • Google 账号(登录获取免费额度)
    • 终端:支持 macOS / Linux / Windows

    🚀 快速安装(3步搞定)

    最简单的方式,一步安装:

    npm install -g @google/gemini-cli

    或者用 npx 直接运行(无需安装):

    npx @google/gemini-cli

    安装完成后,在终端输入以下命令启动:

    gemini

    首次使用会用浏览器打开 Google 登录页面,授权后即可开始使用,免费版有每天 1000 次请求额度,对个人使用完全够用。


    💡 核心功能

    🔍 1. 全代码库理解

    Gemini CLI 不是「瞎猜」你的代码,它能真正读取和理解整个项目目录。你问它「这个函数的逻辑是什么」,它会去读对应的文件,给你准确的答案,而不是泛泛而谈。

    🛠️ 2. 代码生成与执行

    直接让它写代码、改 Bug、重构函数,它生成完还能直接帮你写到文件里。更厉害的是它可以在沙箱环境里执行代码,验证结果后再提交,减少低级错误。

    🔗 3. 内置 Google 工具集成

    因为是第一方工具,Gemini CLI 可以直接调用 Google 的生态:搜索网页、读取 Gmail、管理日历、操作 Google Drive 文件……这些都不需要额外配置,登录账号就能用,真正的一体化体验。

    📋 4. 多模态支持

    不只处理文字——你可以把截图、设计图、PDF 文档直接丢给它,它能看懂图片内容、提取 PDF 里的文字、分析表格数据。写前端的时候直接把设计稿截图发过去,它能帮你写出对应的 HTML/CSS,这体验真的很丝滑。

    ⚡ 5. 超长上下文窗口

    Gemini 的杀手锏就是上下文长度,CLI 版本同样支持最高 100 万 token 的上下文窗口(付费版)。什么概念?你可以把整个中型项目的代码库全部塞进去,它都能记住,不需要像其他工具那样担心「忘记前面的对话」。


    🎯 典型使用场景

    场景一:接手陌生项目,快速上手

    刚 clone 下来一个开源项目,看不懂项目结构?在终端里直接输入 gemini 启动,然后问它:「这个项目的入口文件在哪?主要业务逻辑是怎么流转的?」它会读一遍整个目录,给你画出一张「项目地图」,比自己瞎看文档快太多了。

    场景二:写代码卡壳,AI 当结对编程伙伴

    正在写一个复杂的正则表达式或者递归算法,脑子转不动了?不用切换窗口去网页版 ChatGPT,直接在终端里问 Gemini CLI,它看着你的代码上下文给建议,甚至直接帮你写完整个函数。最关键是——它知道你项目里已有的工具和风格,不会给你写出风格迥异的代码。

    场景三:自动化日常开发任务

    需要批量重命名文件、生成项目的 README、写单元测试、或者分析 git log 找出是谁引入了某个 Bug?这些琐碎但耗时的任务,直接告诉 Gemini CLI 去做,它能在终端里直接执行,你只需要最后确认一下结果就行。


    🌟 推荐理由

    我推荐 Gemini CLI,最直接的原因就是:它是真的「懂终端」的 AI 工具

    之前用过不少 AI 编程助手,但大多要么是在网页里聊天(切换窗口很打断思路),要么是 VS Code 插件(离开编辑器就用不了)。Gemini CLI 不一样——它就在你的终端里,和你日常的 cdgitnpm 命令待在一起,想问什么直接问,完全不需要切换上下文。

    另一个很打动我的点是免费额度够大方。每天 1000 次请求,对个人开发者来说基本上用不完。当然如果你需要 100 万 token 的超长上下文,那就要开付费了,但普通使用免费版完全够用。

    当然它也有不足——相比 Claude Code,Gemini CLI 的代码生成质量偶尔会稍逊一筹,复杂逻辑可能需要多轮对话才能搞定。但作为一款终端原生的免费 AI 助手,它已经足够好用,特别是如果你本来就在用 Google 生态(Gmail、Drive 等),整合体验会很流畅。


    📥 下载地址

    🌐 官方网站:geminicli.com

    🐙 GitHub 仓库:github.com/google-gemini/gemini-cli(104.5k ⭐)

    📦 npm 安装:npm install -g @google/gemini-cli

    📚 官方文档:查看 GitHub README

    🚀 如果你每天都在用终端,Gemini CLI 值得一试。
    把它当成你的「终端里的 AI 结对编程伙伴」,你会发现开发效率提升不止一点点。

  • AI初创公司的ARR造假游戏:VC和创始人如何联手”造神”

    上个月,一家法律AI初创公司的CEO在X平台发了一篇帖子,直接把AI圈炸开了锅。他揭露了一个很多人心知肚明却不敢明说的秘密:很多AI初创公司公开宣布的收入数据,水分大到离谱。

    ARR造假隐喻
    ARR造假就像匹诺曹的长鼻子(图源:TechCrunch/ChatGPT AI生成)

    还远不是真正的收入

    这里说的ARR,全称是Annual Recurring Revenue(年经常性收入),本来是用来统计按订阅模式收费的SaaS公司的核心指标。但现在的AI初创圈,这个概念已经被玩坏了。

    最主要的混淆手段,是把”合同ARR”(有时候也叫”承诺ARR”,即CARR)直接当成ARR来报。这两者之间的差别,就像你签了一份为期三年的健身房合同,和你已经连续三年每周都去健身房并把钱结清了之间的差别——前者是承诺,后者是实绩。

    有投资者透露,他见过一些公司的CARR比真实的ARR高出70%。这些合同里很大一部分收入,可能永远都不会真正到账。

    CARR最大的问题,是在产品尚未落地时就计入收入。如果实施周期很长或者出了岔子,客户可能在试用期就取消合作,导致全部或部分合同收入无法收取。有前员工爆料,他所在的公司甚至把一个为期一年的大型免费试点项目也算进了ARR。

    使用CARR却称之为ARR的明显问题,是它比传统ARR更容易被”操纵”。如果初创公司不切实际地计算流失率和降级销售,CARR就可能被虚高到离谱的程度。

    另一种更有问题的”ARR”

    除了CARR,还有另一种同样有争议的”ARR”指标:年化运行率收入(annualized run-rate revenue)。这种算法更离谱,它是根据某一时期的收入(比如一个季度、一个月、甚至一周或一天)来推算未来12个月的收入。

    由于很多AI公司按使用量或效果收费,这种计算年化运行率ARR的方法可能产生严重误导,因为收入不再是锁定在可预测的合同里。今天你的AI工具突然爆火,收入飙升,明天可能就跌回原点。


    VC的真实想法

    接受采访的投资者表示,VC没有理由主动曝光这些虚报行为。通过对外公布的虚高ARR视而不见,VC实际上是在帮助”造神”自己的portfolio公司。

    当一家初创公司公开报告高收入时,更有可能吸引到最优秀的人才和相信该公司是其品类中无可争议的赢家的客户。这是一场精心设计的叙事游戏,而ARR数字就是游戏里最关键的筹码。

    • 估值越来越高,造假的激励也更强
    • AI时代初创公司被期望比以往增长快得多
    • 展示快速增长的压力促使一些VC支持虚高数据
    • “造神”成功后,VC和公司创始人都获利颇丰

    当然,并非所有初创公司都愿意用CARR代替ARR来展示增长。他们更喜欢清晰透明地公布数字,部分原因是他们明白公开市场是用ARR而非CARR来衡量软件公司的。这些创始人优先考虑透明度,不愿意为了短期收益而牺牲长期信誉。

    但现实是,那些选择透明度的公司,在融资时可能会处于劣势。当同行都在用CARR来”美化”自己的收入数据,坚持只用真实ARR的公司看起来就像增长乏力一样。这是一个典型的”劣币驱逐良币”的局面。

    我认为这是短视的,为了短期收益做这种事,你会让本来就高的倍数变得更高、更疯狂。这是非常糟糕的操作,迟早会反噬你。

    对于外部观察者和普通投资者来说,分辨这些数字的真假并不容易。ARR、CARR、年化运行率ARR,这些术语本身就足够让人眼花缭乱,更不用说每家公司在计算时都可能使用不同的标准和假设。

    下一次看到某家AI初创公司宣布”ARR突破1亿美元”的新闻时,或许我们应该多问一句:这个数字是真的ARR,还是CARR,或者干脆就是年化运行率?答案可能会让你大吃一惊。