分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • iOS 27的AI功能不只是Siri:账单拆分、密码自动更新,苹果把AI织进了系统深处

    iOS 27的AI功能不只是Siri:账单拆分、密码自动更新,苹果把AI织进了系统深处

    iOS 27 AI功能
    iOS 27把AI藏进了系统的各个角落,不再是只能对话的Siri

    WWDC 2026上,苹果发布了AI版Siri的重磅更新,这个消息抢走了大部分注意力。但如果你仔细看iOS 27的整套软件,会发现苹果对AI的布局远不止一个”更聪明的Siri”。

    苹果的思路跟Google和OpenAI不太一样。它不指望你每天跟一个聊天机器人对话,而是把AI悄悄织进你已经在用的那些 app 里。效果就是:你的iPhone用起来感觉更聪明了,但你不一定能直接感觉到”哦,这是AI在干活”。

    账单拆分,扫一下就行

    iOS 27里有个很实用的功能:用Apple Cash拆分餐厅账单。你拍一张收据照片(或者从相册里选一张),Apple Intelligence就会自动识别上面的菜品、数量、小费和总额,然后帮你算出每个人该付多少钱。

    更细致的是,它还会把税费和小费也按人头分摊,不是只算菜品钱。算好之后,你直接在信息 app 里群发给一起吃饭的人,每个人选自己吃了什么就行,甚至支持”半个菜品”的这种分法。

    整个流程不需要你打开专门的账单拆分 app,也不需要手动输入金额。它出现在你刚好需要它的地方,用完就走。

    密码被泄露?iPhone帮你自动换

    用了密码管理器,你的密码已经比别人强多了。但问题是,现在数据泄露天天有,哪怕你的密码再复杂,一旦数据库被拖走,你的账号还是危险。

    iOS 27的新功能会帮你自动更新那些已经泄露或者被标记为”弱密码”的账号密码。不是给你一个提示让你自己去改,而是AI直接帮你操作——它自己打开网站,登录,然后把密码换成一段新的、更安全的随机密码。

    整个过程是安全的,iPhone会在本地处理,不需要你把密码明文交给任何人。

    信息 app 里的一键建议

    如果你觉得之前”短信验证码自动出现在键盘上方”这个功能很好用,那iOS 27在信息 app 里的升级会让你更惊喜。

    现在,信息 app 会根据你们聊天的内容,主动给出一些建议。朋友让你帮忙带东西?它会问你要不要加到提醒事项里。有人让你把活动的照片发过去?它能直接帮你找出相关的照片,不需要你自己在相册里翻半天。

    约饭局或者工作会议的时候,它还会提示你把这件事加到日历里。这些建议都是以按钮的形式出现,点一下就行,不用额外操作。

    打电话时,关键信息自动显示

    iOS 27还有一个很贴心的功能:打电话给公司客服的时候,屏幕上会自动显示你可能需要提供的信息。

    比如你打给航空公司查航班,你的确认码会直接出现在通话屏幕上,不需要你去邮件里翻半天。这个功能是通过Apple Intelligence从你的邮件里提取信息实现的,而且全部在设备本地完成,不会把你的数据发给苹果。

    用自然语言添加日历事件

    第三方日历 app 比如Fantastical早就支持这个功能了,现在苹果日历也跟上了。你只需要用自然语言描述一下,比如”明天下午3点和小明喝咖啡”,Apple Intelligence就会自动识别联系人、地点、时间,帮你创建好日历事件。

    不需要你手动去填标题、时间、地点这些字段,直接说就行。

    用说话创建快捷指令

    快捷指令这个 app 一直很强大,但对普通用户来说门槛太高——你得知道怎么拖拽那些方块,还得理解各种变量和逻辑。

    iOS 27里,你只需要用说话描述你想要什么,Apple Intelligence就会帮你把快捷指令搭好。比如你说”每天晚上根据我第二天的日程自动设置闹钟”,它就能理解你的意思并创建对应的快捷指令。

    当然,你也可以做更日常的事情,比如”下班的时候自动发消息告诉伴侣我几点到”,或者”外卖到了的时候自动打开门廊灯”。

    智能家居通知不再烦人

    如果你用苹果的智能家居,你可能经常被通知刷屏——你家那位回到家、车库门打开、邮件到了、门开了,每一个动作都来一条通知,其实都是同一件事。

    iOS 27里,家庭 app 会用AI把这一系列动作理解成一个整体活动,然后只发一条通知:”有人回到家,车库门已关闭”。干净多了。

    AI还会帮你筛选出值得看的录像片段,比如快递投递或者有人按门铃,直接放在家庭 app 的顶部让你 review。

    Safari标签页自动整理

    最后一个小功能,但很实用:Safari现在可以用AI帮你整理打开的标签页了。它会理解你在浏览什么内容,然后自动把相关的标签页归类到一个标签页组里。

    比如你打开了好几个关于旅行计划的页面,Safari就会把它们归到一个”旅行”的标签页组里,显示在浏览器顶部,方便你稍后继续研究。

    同样,这个过程也是在设备本地完成的,苹果说它不会把你的浏览数据暴露给任何人——包括苹果自己。


    整体来看,iOS 27的AI功能传达了一个很清晰的信号:苹果不想做一个”你必须主动去聊天的AI助手”,它想让整个系统本身变得更聪明。你不一定能感觉到AI的存在,但你用iPhone的时候会觉得——它好像更懂你了。

  • 特朗普政府封杀Anthropic最强模型,这场”坏男孩”营销反而帮了它?

    特朗普政府封杀Anthropic最强模型,这场”坏男孩”营销反而帮了它?

    AI监管与政府封杀
    特朗普政府对Anthropic的封杀,反而让这家公司看起来更危险、也更吸引人

    6月中旬,Anthropic被迫把刚发布的两款最强模型Fable 5和Mythos 5从市场上撤下来。原因是特朗普政府发了一纸出口管制令,理由是”国家安全”。至于具体是什么安全威胁,政府没说,外界也不知道。

    这件事在过去几天引发了AI圈持续热议。TechCrunch的Equity播客最近专门做了一期讨论:当政府对着Anthropic动手的时候,到底谁在受益?

    一场”出口管制”,闹得很大

    事情发酵得很快。那个周五下午,大多数美国人准备过周末的时候,Anthropic收到了政府的信函,要求确保这两款模型不能被任何”外国国民”使用。

    Anthropic的处境很尴尬——你让一家公司去核实每一个用户是不是外国公民?这根本做不到。而且他们自己员工里就有外国人。最后没办法,只能把模型整体下架。

    后来有报道说,这事跟亚马逊有关。亚马逊CEO Andy Jassy据称向白宫反映了Fable 5的护栏可以被绕过的问题,然后事情就一路滚起来了。

    “Anthropic和特朗普政府的关系,一直比其他AI实验室都要紧张”——TechCrunch记者Sean O’Kane在播客里这样说。

    网络安全专家的公开信

    这事儿有个挺讽刺的地方。一批资深网络安全专家写了一封公开信,要求特朗普撤回这道命令。他们的理由是:把Anthropic的先进网络安全能力从美国网络防御者手里拿走,实际上是让美国更不安全。

    专家们认为,Fable 5和Mythos 5里集成的那些安全能力,本来可以帮助美国公司更好地发现并修补漏洞。现在政府说撤就撤,对手可没跟着停下。

    而且,独立安全专家的分析显示,Anthropic模型里发现的那些安全风险,并不是它独有的。其他主流模型也有类似问题。如果真的因为安全风险就要封杀,那得封杀一大片。

    “坏男孩”效应

    这事还有一个出人意料的走向。之前的经验显示,每当Anthropic和特朗普政府起冲突,它的品牌反而更响。

    上次双方闹矛盾的时候,Claude的下载量反而飙升。很多人原来只知ChatGPT,那次之后开始把Claude当成”更有责任感的AI选择”,甚至带点”抵抗”色彩。

    这次也一样。政府说Anthropic的模型”太危险”,反而给外界传递了一个信号:这家公司的技术确实强,强到让政府都紧张。结果就是——大家更想试试了。

    播客里有人开玩笑说:”人人都爱坏男孩,对吧?”Anthropic一边说”我们的模型太危险,不能随便发布”,一边又被政府强制下架,这种叠加效应让它看起来既强大又有点悲情,对一部分用户来说反而更有吸引力。

    竞争对手在看戏吗?

    那么,这场风波里谁在受益?OpenAI?Google?还是其他AI公司?

    短期来看,Anthropic的模型下架,确实给其他公司留出了市场空间。但长期来说,这种”政府随意封杀AI模型”的监管环境,对谁都没好处。

    今天针对Anthropic,明天可能就轮到别人。整个行业都看在眼里:你的模型再强,上面一句话就能让它消失。

    Anthropic自己的态度也挺微妙。它过去一直在说AI发展太快、需要监管、需要慢下来。结果自己刚发布最强模型,政府就来”帮它慢下来”了。批评者说,这不是很讽刺吗——你一边喊着要刹车,一边又发布了”史上最强、危险到不能随便发布”的模型。


    • 特朗普政府以”国家安全”为由,要求Anthropic下架Fable 5和Mythos 5两款模型
    • 网络安全专家公开反对,认为撤除先进AI安全能力反而危害美国网络安全
    • Anthropic与特朗普政府关系长期紧张,此次事件可能反而提升其品牌号召力
    • 监管环境的不确定性,对整个AI行业都是警示
  • Nvidia说数据中心水问题”基本解决了”,但算盘打错了地方

    Nvidia数据中心水冷却系统
    Nvidia推出新型温水冷却系统

    Nvidia最近高调宣布了一套温水冷却系统,声称能大幅减少数据中心的水消耗——按照Nvidia一位高管的说法,这套系统能消除数据中心内部”几乎所有的水消耗”。听起来很美,对吧?

    Nvidia的首席可持续发展官Josh Parker甚至直接跟Axios说:”数据中心的水消耗挑战基本解决了。”这话挺大的。

    数据的”边界游戏”

    问题出在哪儿?关键在于Nvidia怎么算数据中心的耗水。按照这家公司的算法,它们给数据中心画了个圈——圈里面的算,圈外面的不算。

    说白了,Nvidia这套系统确实能在数据中心内部兑现承诺——冷却液在封闭循环里跑,只需要加一次水,然后就能一直循环使用下去,芯片冷却不需要消耗新水。在气候合适的地方,这一招能做到现场耗水减少100%。

    但数据中心外面呢?主要是发电和芯片制造这两个环节,它们消耗的水可能会让整个设施的总水足迹翻倍甚至三倍。这意味着,Nvidia的解决方案大概只能覆盖AI数据中心总耗水量的四分之一到三分之一。

    发电才是耗水大户

    这套系统的巧妙之处在于,它把冷却液泵进机架时的温度设在了45°C。对人类来说这挺热的,但对芯片来说不算啥。冷却液穿过服务器之后,出来的时候已经升到了55°C,带走了大量热量。

    在这个温度下,大多数气候区的室外空气都能通过被动散热器把热量带走,不需要蒸发冷却,在某些情况下连风扇都不需要。没有风扇和冷水机组的数据中心不仅更省水,效率更高,也更安静。

    可问题是,任何数据中心都离不开电力供应,而许多类型的发电厂本身就是耗水大户。美国的化石燃料发电厂是最大的水用户之一,每天消耗27亿加仑水,大部分都用来做蒸发冷却了。

    天然气发电厂每发一度电要消耗1.17升水,煤炭电厂更夸张,要2.2升。根据IEA的数据,化石燃料发电厂目前约占数据中心总供电量的一半。

    可再生能源才是真解

    水电大坝供了大约10%的数据中心电力,它消耗水的方式不太一样——水库蒸发掉的水,平均每度电要损失6.8升。地热能的数字则差异很大,取决于具体技术路线。

    相比之下,风能和太阳能的水消耗小到可以忽略——分别只有每度电0.01升和0.03升,这还包括了制造和清洗面板用掉的水。

    IEA预测,虽然可再生能源在新装机容量中的占比在不断提升,但到2030年,天然气和煤炭仍将满足超过40%的数据中心新增电力需求。如果这条轨迹不出现重大变化,那么无论Nvidia在数据中心围墙里面做什么,数据中心整体还是会消耗大量水。

    Nvidia的冷却系统是个不错的进步,但它解决的是局部问题。要想真正把AI的水足迹降下来,得从电力供应这个根子上动刀。

  • OpenAI要给开源社区当”安全医生”,这个”Patch the Planet”计划到底想干啥

    OpenAI Patch the Planet倡议
    OpenAI启动”Patch the Planet”安全倡议

    OpenAI这两天搞了个新动作,叫”Patch the Planet”——名字玩了个梗,致敬1995年那部黑客电影《Hackers》里的经典台词”Hack the Planet”。不过这次他们不是来黑系统的,是来帮开源社区补漏洞的。

    具体来说,OpenAI找了家叫Trail of Bits的安全公司一起干。这家公司的安全工程师会直接跟开源项目的维护者对接,帮他们审查代码里可能存在的问题。当然,OpenAI自己的安全工具也会上阵,比如那个Codex Security。

    开源软件的安全困境

    为啥要搞这个?OpenAI的说法挺实在的:现在很多开源维护者本来就忙得要死,结果还要面对越来越多的安全报告,时间和资源都有限,根本处理不过来。

    “Patch the Planet”就是来减轻这个负担的,不是来添乱的——安全工程师会先把发现的问题过一遍,再交给维护者,还会帮忙写补丁和测试,甚至建立可复用的流程,让项目团队在第一次修复之后也能继续改进安全性。

    这话听起来,Trail of Bits的工程师更像是代码的”急救员”——帮维护者识别问题、分类处理,背后还有OpenAI的软件撑腰。

    log4j的教训还在眼前

    说回开源软件的问题。开源项目可以说是整个商业软件行业的地基,但因为它的结构太分散、监控也不到位,很多开源软件其实并不安全。一旦开源项目里出了漏洞,用到它的商业代码也就跟着遭殃。

    几年前那个log4j漏洞就是个典型例子——一个广泛使用的开源工具里发现了严重漏洞,结果整个互联网都跟着抖三抖。

    AI让攻击变得更简单

    更让人担心的是,像Anthropic的Mythos这类工具出来之后,AI现在已经能自动识别代码里的现有漏洞,甚至还能琢磨怎么利用这些漏洞搞事情。网络攻击的自动化可不是什么新鲜事,但这些AI工具确实有可能让坏人干坏事变得容易得多。

    OpenAI这个”Patch the Planet”能不能真的帮到开源社区,还得走着瞧。但至少,有人开始认真看待这个问题了。

  • 亚马逊在印度测试Alexa+,这次要攻下印地语市场

    亚马逊在印度测试Alexa+,这次要攻下印地语市场

    Alexa+在印度测试
    亚马逊在印度测试支持印地语的Alexa+(概念图)

    亚马逊最近给一些印度用户发了封邮件,邀请他们参加Alexa+的 Hindi 语言测试。邮件里说得很直白:公司在做一个新的Alexa体验,用户的反馈对打磨产品很重要。想参加的话,得在6月22日之前填一份印地语表格。

    这不是亚马逊第一次在印度推语音助手。2017年,Alexa就登陆了印度,不过那时候只支持英语。2019年,亚马逊给Alexa Skills Kit加上了印地语支持。现在,轮到Alexa+了。

    “您被邀请加入印度Alexa+ Beta计划。我们正在创造一个全新的Alexa体验,您的反馈对于完善Alexa+的功能至关重要。加入Alexa+ Beta计划后,当印地语(印度)测试体验可用时,您将收到通知。”

    亚马逊在邮件里也提前打了预防针:beta版肯定有bug,可能会给出不准确的信息,也可能把本地的一些细微差别念错。公司确认了正在印度测试Alexa+,但没提供更多评论。

    为什么要盯上印地语?

    印度有超过6亿人讲印地语。对亚马逊来说,这是一个巨大的市场。而且,这些用户很多时候是”code-mixing”——就是说一句话的时候,印地语和英语混着用。

    公司们都清楚,在印度,语音可能会成为AI工具使用的一大因素。就在几天前,印度富豪Ambani还说过,要把AI塞进每一通电话、每一个App、每一个家庭。大家都在找让印度用户开口说话的方式。

    Alexa+是亚马逊在2025年推出的生成式AI对话助手。不过,它的推出速度挺慢的。今年2月,这个新体验才向所有美国用户开放。2026年,亚马逊把Alexa+的版图扩张到了英国、加拿大、巴西、墨西哥、意大利和德国,都加上了本地化支持。

    Prime用户免费,其他人要掏钱

    亚马逊给Prime会员提供免费的Alexa+,非Prime用户则得按月付费才能用上这个升级版助手。

    目前,Alexa+在印度还没正式上线,什么时候会推出也没个准信。不过,从开始beta测试来看,亚马逊应该是想在印度市场发力了。

    语音助手这个赛道,现在可不缺玩家。谷歌有Assistant,苹果有Siri,微软有Copilot。亚马逊的算盘是,靠印地语支持和对印度市场的理解,能抢到一块蛋糕。

    不过,要在印度把语音AI做好,难度不小。口音、方言、code-mixing,这些都是挑战。beta测试的用户反馈,会决定Alexa+在印度到底能走多远。


  • 从手写代码到AI循环:程序员的工作方式正在发生第三次跃迁

    从手写代码到AI循环:程序员的工作方式正在发生第三次跃迁

    AI agents循环概念图
    AI agents相互提示形成循环结构(概念图)

    上周五,Claude Code的创始人Boris Cherny出现在Meta的@Scale会议上。出乎意料的是,观众提出的第一个问题竟然是关于”循环”的。

    “循环是下一个炒作周期,还是真的有用?”提问者问道。

    Cherny的回答很干脆:”没错,它们是真实存在的。”

    “两年前,我们手写源代码。我们开始过渡到由agents来写代码。现在我们正在过渡到这样一个阶段:agents在提示其他agents,然后由后者来写代码。从源代码到agents这一步有多大,循环就是同样重要、同样大的一步。”

    在演讲的后面部分(大约32分钟标记处),Cherny具体谈到了他在自己工作中持续运行的循环。一个agent持续寻找改进代码架构的方法,而另一个则在寻找可以统一的重复抽象。它们像其他程序员一样提交pull requests,而且由于代码在不断变化,它们永远不会停止运行。

    循环到底是什么?

    随着向agentic AI的转变,大多数用户的焦点一直是尽可能好地管理他们的agents:建立明确的目标,检查离散的进度单元,不要让它们偏离提示太远。循环则更进一步,它授权一群agents在后台持续不断地工作。

    这是对AI的极大信任——但随着模型快速变好,这可能是让AI处理真实工作的下一步。

    首先要认识到,这并不完全是新东西。递归循环——调用自身以重复动作的函数,加上一个停止循环的条件——是计算机科学入门课程的主要内容。这些循环遵循的是非确定性逻辑,也就是说,是由一个子agent来选择何时停止循环,而不是一个明确的条件。但同样的基本方法正在发挥作用。

    一旦程序员开始使用AI来完成任务,AI监督AI的某种版本的递归循环就必然会出现。

    简单到令人抓狂

    与经典计算不同,agentic循环可以简单到令人抓狂。最流行的技巧之一是Ralph Loop(以Ralph Wiggum命名),它基本上总结了模型所做的所有工作,并询问是否完成了目标。这是处理AI模型运行时间过长而迷失方向的一种方式——本质上是在模型之间来回弹跳,直到任务完成。

    另一种思考循环的方式是,将其视为推动更多测试时计算的一部分。正如OpenAI研究员Noam Brown本月早些时候观察到的,如果你向当代模型投入足够的计算资源,它们几乎可以解决任何问题。这意味着确保问题得到解决的一种方法是,不断地向它投入计算资源,直到完成为止。

    这对于像改进代码库这样的爬山问题尤其适用,模型可以不断做出增量改进,直到达到给定的阈值。或者,就像Cherny的例子一样,只要有计算资源可以花费,它就可以不断做出增量改进。

    代价不菲,但可能值得

    如果这听起来很昂贵,那确实如此。就像之前的agentic AI一样,AI循环比简单的问答聊天机器人更快地消耗tokens——而且因为重点是让循环一直运行,所以你可以花费的金额没有上限。

    对于Anthropic来说,这没问题,因为它归根结底是在做tokens销售生意。但对于其他所有人来说,这可能是一种昂贵的工作方式。

    尽管如此,取决于agentic循环试图解决的问题,以及允许监督tokens支出、漂移和其他经典AI问题的正确设置,好处可能大到足以超过成本。


  • Google DeepMind豪掷7500万美元联手A24,AI工具敲开好莱坞大门

    7500万美元,Google DeepMind要向好莱坞证明AI不是来砸场子的

    AI进军创意产业的消息不少,但大多数时候,创作者们的反应是这样的:警惕、抗拒、或者干脆发起诉讼。Google DeepMind这回换了个思路——不先做了再求原谅,而是直接找好莱坞的”品味担当”A24坐下来谈合作。

    6月22日,Google DeepMind宣布向独立电影公司A24投资7500万美元,双方称这将是一个”首创性”的合作伙伴关系。合作内容是联合开发用于电影制作的AI工具,而Google DeepMind这边会”从顶尖艺术家那里获得反馈和指导”。

    AI与电影制作融合概念图
    Google DeepMind携手A24,AI工具正在进入电影制作流程 © 配图

    A24是谁?为什么是它?

    A24可能不是大众最熟悉的电影公司,但在影迷和从业者眼里,它是过去十年最有影响力的独立制片公司之一。《瞬息全宇宙》《仲夏夜惊魂》《遗传厄运》,还有最近的《Backrooms》,都是A24出品的。Timothée Chalamet和Anne Hathaway这些一线演员也和A24有过合作。

    选A24而不是 Disney 或者 Netflix,这个选择本身就很说明问题。A24在创作者群体里信誉度高,它愿意给导演和编剧留空间,这种文化和Google DeepMind想推的”赋能艺术家”叙事是吻合的。

    “我们相信,开发赋能艺术家的工具的最好方式,就是直接和他们一起工作。”——Demis Hassabis,Google DeepMind联合创始人兼CEO

    好莱坞的AI焦虑,不是一天两天了

    过去两年,AI和好莱坞的关系可以用”剑拔弩张”来形容。编剧工会在2023年大罢工时的核心诉求之一就是限制AI在剧本创作中的使用。导演和演员也担心,AI生成的内容和深度伪造技术会抢走他们的饭碗。

    但资本和技术的方向已经确定了。Netflix今年早些时候收购了Ben Affleck创办的AI工具公司InterPositive,专门给电影人开发AI辅助工具。Amazon的MGM Studios也在今年2月宣布成立AI部门,做电视剧和电影制作工具的研发。

    Google DeepMind这7500万美元的赌注,本质上是想在”AI+影视”这个叙事里抢占高地。它不是偷偷摸摸地做,而是公开地和一家受尊敬的电影公司绑定,让艺术家参与到工具开发的过程中来——这个姿态本身,就比直接推出一个”AI电影生成器”要聪明得多。

    工具还是替代品?这道线还没划清楚

    合作归合作,疑问还在。Google DeepMind和A24联合开发的AI工具,到底是用来辅助分镜、剪辑、后期这些”后台”工作的,还是会涉及到剧本创作、表演生成这些更敏感的地带?目前双方都没有给出具体细节。

    这种模糊其实是有意为之。太具体了反而容易引发争议。先把合作关系公布出来,让”AI工具和艺术家协作”这个叙事在舆论里扎根,等工具成型了再慢慢推出来——这才是大公司的一贯打法。


    更大的棋盘:AI公司的好莱坞争夺战

    把这笔投资放在更大的背景里看,它不只是Google DeepMind一家的事。OpenAI和好莱坞的接触也在持续,Sora视频生成模型展示出来的能力,已经让不少人开始重新想象电影制作的可能性。Meta也在砸钱,它的AI视频工具已经在Instagram上跑了一阵子了。

    A24选中Google DeepMind,Google DeepMind选中A24,这笔交易能不能产出真正好用的工具、能不能让创作者在不用恐惧的前提下用上AI,接下来两年会见分晓。对于观众来说,也许更值得期待的问题是:有了这些工具之后,电影会变成什么样子?

  • Groq在Nvidia挖角后逆势融资6.5亿美元,AI推理云的下一战才刚开始

    Nvidia的”非收购收购”之后,Groq活下来了

    去年12月,Nvidia和Groq之间那笔交易让不少人看不懂。Nvidia付了一笔可观的”IP授权费”,然后把Groq的创始人兼CEO Jonathan Ross、总裁Sunny Madra和一帮核心工程师全部挖走。这不是收购,但比收购还彻底——人走了,技术授权给Nvidia了,Groq还剩下什么?

    半年之后,答案似乎是:还挺多。6月22日,Groq正式宣布完成6.5亿美元的新融资,确认了此前外界的传闻。估值没有披露,但上次融资(2025年9月)时Groq的估值已经是69亿美元,这轮融资的投资人据传在上次Nvidia交易中已经赚得盆满钵满,现在继续押注。

    AI芯片与推理计算技术概念图
    AI推理芯片赛道持续升温,Groq在Nvidia挖角后完成新一轮融资 © 配图

    Jonathan Ross的遗产:从Google TPU到Groq LPU

    要理解Groq的价值,得先认识Jonathan Ross这个人。他在Google期间参与了TPU(张量处理单元)的研发,那是Google专门为AI计算设计的芯片。离开Google后,Ross和另一位Google工程师Doug Wightman一起创立了Groq,主攻方向是AI推理芯片——他们称之为LPU(语言处理单元)。

    Wightman在Nvidia交易后选择留在Groq,现在担任CEO。Ross和Madra走了,但Groq的技术团队和产品方向还在。更重要的是,Nvidia虽然拿到了LPU的IP授权,但Groq同步宣布了战略转型:从芯片厂商转向”NeoCloud”业务。

    NeoCloud这个概念,说白了就是专门为AI训练和推理优化的云基础设施服务,和AWS、Azure那种通用云不一样,它只干AI这一件事,而且干得更狠。

    13个数据中心,每周处理万亿级Token

    Groq的NeoCloud业务在Madra被挖走前就已经在运作(Groq在2024年收购了他的AI数据分析公司Definitive Intelligence)。根据公司披露的数据,目前已在北美、欧洲、中东和亚太地区部署了13个数据中心,服务超过500万开发者和数千家AI公司,每周处理的AI Token数量达到万亿级别。

    这个规模说大不大,说小也不小。和Nvidia、AWS、Google Cloud比起来,Groq还是个小朋友。但在AI推理这个细分赛道上,需求增长速度之快,让即使是很小的玩家也有饭吃。

    新管理层就位,从xAI和Meta挖来高手

    融资之余,Groq也在快速补强管理层。新上任的COO Alan Rice之前在xAI和Meta都干过,再之前在美国海军服役。CTO Sinclair Schuller和CPO Rakesh Malhotra是一对创业搭档,之前一起做过企业云软件公司Apprenda,后来又共同创立了软件工程公司Nuvalence,2024年被EY收购。

    Malhotra本人在微软待了大约十年,参与过多个云产品的开发。这个背景对Groq的NeoCloud业务来说相当对口。


    关键问题:IP给了Nvidia,Groq还能打吗?

    外界对Groq最大的疑问就在这里:Nvidia现在合法持有LPU技术的IP,而且已经在今年3月的GTC大会上发布了自己的Groq 3 LPX推理硬件系统。Groq转型做NeoCloud,本质上是在用别人的技术授权来运营云服务——这不就是帮Nvidia培育市场吗?

    但也有另一种看法。推理云服务这个赛道的需求增长太快,Nvidia一家吃不下所有客户。Groq如果能把NeoCloud的体验做到足够好,在性价比、延迟、开发者工具链这些维度上建立优势,它不一定非要靠自研芯片才能活。

    类似的剧情在Scale AI身上也发生过。去年Meta用143亿美元”不是收购的收购”把Scale AI的创始人Alexandr Wang和一批核心人才挖走,外界一度认为Scale AI要完了。但CEO Jason Droege今年5月对Forbes说,公司业务已经反弹,今年营收预计能达到10亿美元。

    AI这场大棋局里,人才流动和资本重组几乎每个月都在发生。今天被挖角,明天拿到新融资,后天可能又换一个赛道重新开始。Groq这6.5亿美元能不能让它真正站稳脚跟,接下来12个月见分晓。

  • 五眼联盟发了一份AI网络威胁警告,说’漏洞必然会发生’

    五眼联盟的五个网络安全负责人,难得地坐在一起发了一份联合声明。内容不长,但用词很重:AI正在”根本性地改变”网络攻防,而且这个时间窗口不是几年,是”几个月”。

    这份声明来自美国、英国、加拿大、澳大利亚和新西兰的网络安全机构负责人联合署名。他们说AI模型将在未来几个月内让进攻性和防御性网络能力发生根本性转变,而且”漏洞必然会发生”(breaches will occur)。

    AI网络安全概念图
    五眼联盟警告:AI正在加速网络攻击的速度和复杂度(图源:The Verge)

    “对手已经在用AI了”

    声明里有一句话很直接:”对手已经在用AI来移动得更快、更有效。”这里的”对手”指的是谁,大家都懂。五眼联盟的语境里,主要就是俄罗斯、中国、伊朗、朝鲜这几个国家的国家级黑客团队。

    AI对这些团队的价值在于:以前写攻击代码、找漏洞、做社工诈骗,都需要人手和 time。现在这些事AI可以帮忙加速。一个脚本小子加上一个会用的AI工具,产出的攻击代码可能比过去一个团队一周的产量还多。

    五眼联盟的原话:”防御者必须做同样的事情。”意思是,既然对手在用AI加速攻击,防守方也得用AI加速防御,不能还在用人眼盯日志。

    不是未来,是现在

    声明特别强调:AI不是”未来的考虑”——它已经在这里了。它降低了恶意行为者的门槛,同时增加了攻击的速度和复杂度。漏洞从被发现到被利用之间的时间窗口,正在被AI快速压缩。

    这个趋势其实已经在发生了。2025年到2026年,利用AI辅助发现零日漏洞的攻击报告明显增多。过去一个零日漏洞从被发现到出现在野外部署,可能要几周到几个月。现在有些漏洞在补丁发布之前就已经被利用了——AI帮攻击者更快地理解了补丁代码,逆向出了漏洞利用方式。

    给领导者的行动清单

    这份声明不是写给技术人员的,是写给企业领导者的。它列了五个”现在就做”的事项:

    • 缩小攻击面:能不暴露的系统就不要暴露,能隔离的就隔离。
    • 加速打补丁:AI缩短了漏洞利用的时间窗口,拖拖拉拉打补丁就是在给攻击者送分。
    • 处理遗留系统:不受支持的老系统不是”技术债”,是”战略负债”——这话说的挺狠,但也没错。
    • 强化身份和访问管控:谁能访问关键系统?多久审查一次权限?用多因素认证了吗?
    • 提前演练 incident response:假设一定会被攻破,练的是”怎么快速 containment(控制住)”,而不是”怎么防止被攻破”。

    用AI对抗AI

    声明最后说了一句话,算是给AI防御工具正名:组织如果把AI工具整合进安全运营,可以更早地发现漏洞、改善软件质量、监控异常行为、更快地响应事件。

    这其实是在回应一种质疑:有些企业领导者觉得”用AI做安全”是在赶时髦。五眼联盟的态度很明确:这不是赶时髦,这是必须做的事。你的对手已经在用了,你不用就是在送。

    这份声明本身的象征意义可能比具体内容更重要。五眼联盟一起出面,说明这件事已经上升到了国家级协调的层面。下一次如果真的有大规模AI辅助网络攻击发生,至少各方已经打过预防针了。

  • SpaceX把Colossus算力租给Reflection AI,开源阵营终于有大玩家了

    马斯克的SpaceX最近又签了一笔大单。这次的买家是Reflection AI——一家成立才两年的开源AI实验室。合同金额不算夸张,每月1.5亿美元,从今年7月算起,一直签到2029年7月,总价值63亿美元。

    这个数字听起来很大,但放在SpaceX的算力出租业务里只能算中等。Anthropic每月付12.5亿美元,Google每月付9.2亿美元,Reflection的1.5亿连零头都不到。当然,对于一家还没有正式发布产品的创业公司来说,能拿到Colossus 2数据中心的算力配额,本身就是一种背书。

    SpaceX xAI Logo
    SpaceX的Colossus数据中心现在向外部AI实验室开放算力租赁(图源:TechCrunch)

    开源AI的生存逻辑

    Reflection AI的两个创始人都是从Google DeepMind出来的,2024年创业,主打一个”开源对抗封闭”的叙事。他们的逻辑很简单:Anthropic和OpenAI那种黑箱模型,你根本不知道它怎么想的,也不让你改。Reflection要把模型权重公开,让企业和政府自己去部署、去审计、去改。

    这个叙事在政府禁令出来之后突然变得很值钱。美国那边刚把Anthropic的Fable和Mythos两款闭源模型给禁了,理由是”国家安全”。结果这一禁,反而让不少人开始认真看开源替代品。你总不能连开源模型也禁吧?那跟把所有螺丝刀都管制起来没区别。

    Reflection自己的声明说得很直白:”最近的事态说明开源对AI生态有多重要。越来越多的国家和企业意识到,只依赖闭源模型是有风险和成本的。”这话翻译过来就是:谢谢政府的神助攻。

    Colossus到底是谁的?

    这里有个细节挺有意思。Colossus数据中心最早是xAI建的——就是马斯克那家AI公司,Grok的大本营。后来xAI并进了SpaceX,数据中心也就归了SpaceX。所以现在的情况是:SpaceX拿着这批英伟达最新的GB300芯片,自己用不完,也不想全用来训Grok,干脆租给外面的人。

    Anthropic租了,Google租了,现在Reflection也租了。马斯克一边公开骂Anthropic的模型有安全问题,一边收着人家的租金,这个画面多少有点微妙。不过做生意归做生意,马斯克最近公开说那些长期合同”随时可以取消”,这是在向谁表态,大家心里都有数。

    63亿美元能买到什么

    Reflection拿到的是”立即访问权”——Colossus 2数据中心里的最新GB300芯片和配套硬件,从7月1日起就用。合同写了双方都可以在头三个月之后提前90天通知终止,这个条款基本上是照抄Anthropic和Google的合同模板。

    对Reflection来说,这笔钱花得值不值,取决于它能不能在接下来三年里做出真正能打的开源模型。现在开源阵营里最强的是DeepSeek,但DeepSeek是中国公司,在美国市场多少有点尴尬。Reflection如果能在美国做出一个同等水平的开源模型,机会是有的。前提是钱够烧、算力够用、人够聪明。


    63亿美元听起来很多,但摊到三年里,每月1.5亿,也就是每年18亿。Anthropic每年烧的钱比这个只多不少。AI军备竞赛的入场券,就是这么贵。