标签：网络安全

OpenAI发起”Patch the Planet”计划，用AI帮开源项目找漏洞

AI帮助保护开源软件（概念图）

开源软件有个老问题：它是整个互联网的地基，但维护它的人往往只有两三个，还没工资。bug和漏洞就潜伏在这些代码里，哪天爆出来就是大事——Log4j那次大家都还记得。现在OpenAI说，它想用AI来帮开源社区找漏洞、修漏洞，而且不是只给机器扫一遍就完事，而是派真人去跟项目维护者一起改。

“Patch the Planet”是什么

这个计划叫”Patch the Planet”，名字是在向1995年电影《Hackers》里的经典台词”Hack the Planet”致敬。OpenAI周一（6月22日）正式公布了这个倡议，合作方是一家叫Trail of Bits的安全公司。

具体怎么运作？Trail of Bits的安全工程师会直接跟开源项目的维护者对接，一起审查代码里可能存在的问题。OpenAI自己的安全工具——比如Codex Security——会在这个过程中帮忙做代码分析。

OpenAI在公告里说了一段挺实在的话：”很多维护者已经被要求用更少的时间和资源、更快地处理更多的报告。’Patch the Planet’的设计是减轻这个负担，而不是再给他们加活。”

为什么现在做这件事

开源软件的安全问题不是新鲜事。Log4j事件就是典型案例：一个被无数商业软件依赖的开源工具里出了一个漏洞，结果全球一大片系统都受影响。开源生态的问题在于，它是去中心化的，很多项目的维护者就是靠爱发电，没有足够的人力物力去做系统性的安全审查。

但最近一两年，情况起了变化。AI工具开始出现能自动在代码里找bug、甚至自动生成exploit（攻击脚本）的能力。Anthropic去年推出的Mythos就是一个被广泛讨论的例子——它的本意是帮安全研究人员找漏洞，但同样的技术也可以被坏人用来批量发现并攻击开源项目里的弱点。当AI把”找漏洞”这件事的门槛降到几乎为零的时候，开源生态的脆弱性就被放大了。

OpenAI现在是反过来用AI做防守方——用自家的Codex Security等工具，帮开源社区把漏洞在坏人发现之前先找出来、修好。这个姿态本身也挺有意思：Anthropic的Mythos被不少人质疑会给网络攻击”赋能”，OpenAI这边则直接拿出了一个看起来更负责任的用法。

能做成什么样

当然，这个计划到底能做成什么样，现在还不好说。OpenAI的公告里没有说这个计划会运行多久、覆盖多少项目、怎么选项目，也没有说Trail of Bits的工程师能投入多少时间。开源项目成千上万，漏洞更是数不清，光靠一家安全公司加OpenAI的工具能覆盖多少，是个现实问题。

但至少方向是对的。开源软件的安全问题一直是个”公地悲剧”——大家都在用，但没人愿意出钱维护。现在有几家大科技公司开始认真对待这件事，总比一直放任要好。

更大的背景

这件事的更大背景是：AI正在改变网络安全的攻防平衡。五眼联盟（美国、英国、加拿大、澳大利亚、新西兰的情报共享机制）本月初刚发了一份联合声明，警告各组织”立即行动”应对AI带来的网络威胁，理由是对手已经在用AI提升攻击效率了。

当攻击方用上AI的时候，防守方如果还是老办法，肯定是来不及的。OpenAI这个计划至少是在尝试用AI的速度来对抗AI的威胁——哪怕它能不能真正规模化还存疑。

“Patch the Planet”这个名字起得挺狂的，仿佛要把整个地球的开源漏洞都修一遍。显然这不现实。但它至少释放了一个信号：AI公司开始认真对待开源安全这件事了，而且愿意出人出工具来做。对于每天靠开源软件跑着无数业务的世界来说，这总归是件好事。

📎 原文来源：TechCrunch – OpenAI launches new initiative to help find and patch open source bugs

2026年6月25日
OpenAI搞了个「修补地球」计划，用AI帮开源项目抓bug

OpenAI与Trail of Bits合作，推出「Patch the Planet」开源安全计划 | 图源：OpenAI

上世纪90年代有一部电影叫《Hackers》，里面有一句经典台词「Hack the Planet」（攻陷地球）。上周OpenAI启动了一个新项目，名字叫「Patch the Planet」——把「hack」换成了「patch」（修补），意思很直白：我们不来搞破坏，我们来帮你补漏洞。

这个计划是OpenAI跟安全公司Trail of Bits一起做的。具体怎么做呢？Trail of Bits的安全工程师会直接跟开源项目的维护者对接，帮他们审查代码里可能有问题的地方，OpenAI自己的安全工具（比如Codex Security）会在过程中帮忙。

「很多维护者已经被要求用更有限的时间和资源，更快地处理更多的报告。Patch the Planet的设计是为了减轻这个负担，而不是增加它：安全工程师会在发现到达维护者之前先审查，跟项目合作开发补丁和测试，并建立可复用的工作流，帮助团队在首批修复落地后继续改进安全性。」

开源的「公地悲剧」

这个计划针对的问题其实由来已久。开源软件是现代软件产业的基石——几乎每一家商业软件公司，背后都在用无数开源项目搭起来的轮子。但这个生态有个老问题：它是去中心化的，没有人真的「拥有」它，也就没有人真的为它的安全负责。

几年前的log4j漏洞事件就是一个典型例子。一个几乎无处不在的开源工具里发现了严重漏洞，结果整个互联网都慌了，大家忙着排查自己有没有用这个库。这种事情反复发生，说明开源生态的安全状况确实令人担忧。

OpenAI这次出手，等于是给开源社区派了一支「代码急救队」。Trail of Bits的工程师扮演的角色有点像 EMT（紧急医疗技术员）——哪里有需要，就去哪里帮忙评估和分类潜在问题，而且背后还有OpenAI的软件工具提供支持。

一石二鸟？

这个项目还有一个值得玩味的背景。最近这段时间，AI用于网络安全的话题一直很敏感——尤其是Anthropic的Mythos工具（一个高度宣传的安全工具）让很多人担心，因为AI现在可以自动识别代码里的漏洞，然后还可能被用来生成攻击利用代码。

虽然网络攻击的自动化并不是什么新鲜事，但这些新工具确实让坏人干坏事变得容易多了。在这种氛围下，OpenAI反过来用AI帮开源社区提升防御能力，这个举动很难不让人觉得是在跟Anthropic「打对台」。

当然，OpenAI也说这个计划的出发点是开源社区真正需要的。两相并立，倒也不一定是坏事——只要最后是开源项目的安全性真的提高了，谁「赢」了这场公关战其实并不重要。

能走多远？

这个项目目前来看野心不小，但也有一些悬而未决的问题。比如，这个模式怎么规模化？Trail of Bits的工程师团队规模有限，能服务的开源项目数量自然也有限。OpenAI说他们会建立「可复用的工作流」，让项目团队在首批修复之后能够自己继续改进安全性，这可能是他们想到的规模化路径。

另一个问题是，这个计划会覆盖哪些开源项目？是只针对那些影响力特别大的，还是也会照顾到中小型项目？OpenAI目前还没有公布具体的筛选标准。

不管怎样，这件事对整个开源生态来说是个好消息。有这么大体量的公司愿意投入资源来做这件事，总比大家各自为战要好。接下来就看执行得怎么样了。

📎 原文来源：OpenAI官方博客 – Patch the Planet | 亦见于 TechCrunch

2026年6月24日
76名网络安全专家联名抗议：美国政府封禁Anthropic最强模型，是在削弱防御

上周，美国政府对Anthropic的Fable和Mythos模型下达了出口管制令，理由是国家安全。Anthropic随即暂停了全球用户对这两款模型的访问。

事情到这里，看起来又是一个AI监管收紧的故事。但接下来的发展有点出人意料——76名网络安全专家联名写了一封公开信，要求政府撤销这道命令。

网络安全专家联名抗议Anthropic模型出口管制令

联署名单相当豪华

这份公开信的签署者里有不少业内重量级人物：前Facebook首席安全官Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、著名密码学家兼前苹果安全设计经理Jon Callas、计算机科学家Paul Vixie、前Block应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris，以及安全意识培训公司SocialProof Security的CEO Rachel Tobac。

他们在信里说得很直接：把最好的模型从网络安全防御者手里拿走，而没有充分的理由，这是”危险的”。

“当我们的对手在快速进步的时候，把最好的能力从防御者那里拿走，是没有充分理由的危险行为。”

禁令到底是怎么来的

Anthropic今年4月推出Mythos预览版时，声称这个模型找安全漏洞的能力太强，所以需要严格限制访问，防止恶意黑客或外国对手拿来在互联网上搞破坏。实际操作里，Anthropic只给了大约50家公司初始访问权限，最近才扩展到15个国家的约150个组织。

6月9日，Anthropic发布了Fable，这是Mythos的公开版本，但加了严格的护栏，阻止它在生物、化学和网络安全领域的使用，同时也防止别人通过”蒸馏”来复制这个模型。

问题是，Fable的护栏严格到了许多网络安全专家发现它基本拦掉了任何与网络安全相关的提示词。

亚马逊的论文：是真越狱还是误报

据信，白宫的出口管制令可能源于一份亚马逊研究人员的论文，论文展示了一个可以绕过Fable护栏、解锁其Mythos级别能力的方法。

但联署人之一Katie Moussouris在审阅了这份尚未公开的论文后，给出了完全不同的判断：这根本不是真正的越狱。

她写道，研究人员只是让Fable去修复含有”故意植入的漏洞”的开源代码——而这正是模型最初拒绝”审查代码安全问题”之后发生的事情。

“论文里描述的行为没办法被真正修复，任何尝试都只会削弱模型用于防御的能力。”Moussouris写道，”防御者需要能够要求AI修复文件里的bug、解释修复为什么重要、以及编写确认补丁有效的测试。这不是护栏绕过，这是AI模型能为防御性安全做的最有价值的事情：执行防御者每天都在跑的’发现、修复、测试’循环。”

专家们真正担心的是什么

公开信里还指出，亚马逊论文里描述的方法，在OpenAI的GPT-5.5上、在Anthropic自己公开可用的Claude Opus 4.8和Sonnet上、”甚至在中国的Kimi 2.7这样的模型上”都能复现。

也就是说，封掉Fable和Mythos，并没有真正消除这个所谓的”漏洞”——它只是让美国自己的防御者用不上好工具，而对手那边照样能用上类似的能力。

专家们的要求很明确：他们想要的是由”民主的规则制定程序”产生、基于产业和学术专家科学研究、透明且公平执行的监管，并且”只以最低必要程度使用，以确保美国公众的安全”。

📎 原文来源：TechCrunch · Cybersecurity vets protest ‘dangerous’ US government ban on Anthropic’s most powerful models

2026年6月16日
AI Agent正在变成员工，这家公司拿了6600万美元帮企业管「数字员工」
Goldman Sachs去年把AI编程代理Devin当作新员工来测试，McKinsey今年早些时候说他们已经有25000个AI代理和60000名人类员工一起工作。当AI代理真的变成「员工」，一个没人认真想过的问题就摆在了桌面上：你怎么给一个软件发工牌、管权限、还能在它出错的时候把它「开除」？

从stealth模式走出来的NewCore

纽约网络安全创业者Zohar Alon认为，现有的企业身份系统撑不住这个未来。他创办的NewCore今天从stealth模式走出来，拿了6600万美元种子轮融资，估值3亿美元。领投的是专注网络安全的风投Cyberstarts，Index Ventures和Evolution Equity Partners跟投。

AI代理身份管理正成为企业安全新前线 (图片：AI生成)

Alon不是第一次创业。他之前创办了云安全公司Dome9，后来卖给了Check Point。他说，AI代理的规模和复杂度会把那些用了15到20年的老身份平台「撑爆」。

「我们很确定，AI代理给那些15年、20年历史的身份平台所增加的规模和复杂度，会把它们搞崩。」Alon对TechCrunch说。

AI代理也该有「工牌」

NewCore的平台把人类员工和AI代理放在同一个系统里管理。他们的核心论点是：AI代理应该被当作「一等公民」来对待——有自己的权限、生命周期控制和撤销机制，而不是混在传统的服务账户或机器凭证里蒙混过关。

他们的「分键」架构把关键身份凭证分成两份，分别存在客户和平台那里。这样做的目的是消灭单一泄露点——就算平台被攻破，攻击者拿到的也只是不完整的一半密钥。

NewCore还给Claude Code、OpenAI Codex、Cursor这些编程助手提供了「Agentic Skill」集成包，让AI工具以受管理的身份访问企业系统，而不是靠人工分发的凭证来凑合。

更实用的部分是一个移动App：人类员工可以用它来审批、查看和撤销AI代理的权限。Alon把它叫做「人类监督层」。当公司有几十个甚至几百个AI代理在自主运行的时候，总得有人能随时拔插头。

AI代理数量会超过人类员工？

NewCore目前在美国和以色列有50多名员工，平台有不到10个付费客户和10多个设计伙伴。今年夏天开始收费。

TCS董事长最近说，AI代理的数量最终可能赶上这家印度IT服务公司的人类员工总数。Alon预测，在科技公司里，AI代理在几年内就会超过人类员工的数量。

「这是不可避免的。问题是我们要不要在来得及的时候把护栏建好。」——Zohar Alon

Okta和微软的Entra这些老牌身份提供商也在往自己的平台里加AI代理功能。但Alon认为那些都是在为人类员工设计的平台上打补丁，而NewCore是从零开始为「人类+机器+AI代理」混合 workforce 建的。
- NewCore种子轮6600万美元，估值3亿
- 平台统一管理人类员工和AI代理身份
- 「分键」架构防止单一泄露点
- 移动App让人类监督AI代理权限
- 今年夏天开始向客户收费
📎 原文来源：TechCrunch – As AI agents become employees, NewCore emerges with $66M to give them identities
2026年6月15日
微软GitHub开源项目被植入恶意代码，AI开发者密码遭窃取
使用Claude Code或Gemini命令行工具开发AI应用的程序员，这几天可能无意间把自家的账号密码送到了黑客手里。微软托管在GitHub上的一批开源项目被植入了恶意代码，任何在这些AI编程工具里调用了受影响组件的用户，密码和敏感凭证会在不知不觉中被传输出去。

被盯上的是AI开发者最常用的工具链

这次出事的项目大多和微软的Azure云服务有关，也包括一些AI开发者日常高频使用的工具，比如Claude Code的集成组件、Gemini的命令行接口，以及VS Code的相关扩展。安全公司Cloudsmith和开源恶意软件分析社区OpenSourceMalware最早发现了异常，他们的报告指出，恶意代码会在用户用AI编程应用打开受感染工具时触发，将密码和其他凭证悄悄发送到黑客控制的服务器。

GitHub上被禁用的微软仓库页面 | 来源：TechCrunch

目前还不清楚到底有多少开发者下载了受感染的工具版本。微软没有公布受影响用户的具体数字，只是说已经”暂时移除了一部分仓库，以调查潜在恶意内容”。至少70个微软旗下的项目在GitHub上显示”该仓库已被GitHub工作人员禁用，原因是违反了GitHub服务条款”。

供应链攻击：低调但致命

这种攻击方式有个专门的名字，叫”供应链攻击”。黑客不去直接攻破目标系统，而是去污染那些被广泛依赖的代码库——因为无数软件产品和开发者都在用这些开源组件，只要其中一个被攻破，恶意代码就能顺着依赖链传播到成千上万台机器上。

开源项目的维护者往往是个人开发者，他们的安全防护能力有限。黑客会花数周时间混进开发者社区、赢得信任，然后找机会往代码里塞恶意内容。这次微软中招，说明连资源雄厚的大科技公司也并非高枕无忧。

事实上，这已经是微软在短短几周内第二次发生开源项目被黑的事件。安全媒体Ars Technica的报道指出，今年5月中旬，微软的开源项目Durable Task（一个帮助开发者构建应用的工具）就曾经被植入过恶意代码。而这一次，OpenSourceMalware的分析认为，最新事件是Durable Task项目的”再次被攻破”——这意味着微软上次可能根本没有把黑客完全清理出去。

AI开发者为什么成了靶心

黑客盯上AI开发者，逻辑并不难理解。这个群体手里掌握的凭证，往往能直接访问云服务、生产环境、用户数据库。一个AI创业公司的开发者账号如果被攻破，后果可能比普通用户密码泄露严重得多。

而且，AI开发者近年来越来越依赖开源组件来加速开发——从模型接口到数据处理工具，几乎每一步都能找到现成的开源方案。这种开发习惯，恰好给了供应链攻击最大的发挥空间。

你该怎么自查
- 如果你在过去两个月里用GitHub拉取过微软旗下的Azure或AI开发相关开源项目，建议立即更换相关账户的密码和API密钥
- 检查CI/CD流水线里是否有使用受影响组件的版本，必要时回滚到官方确认的干净版本
- 对敏感项目，考虑在隔离环境里做依赖项完整性校验，而不仅仅依赖版本号
- 微软表示已直接通知了少数可能拉取了受感染内容的客户，留意你的邮箱或GitHub通知
📎 原文来源：Microsoft’s open source tools were hacked to steal passwords of AI developers — TechCrunch
2026年6月14日
Instagram的AI客服机器人成了黑客后门，多名用户账户被劫持
如果你最近收到过Instagram发来的莫名其妙的安全提醒，可能不是误操作——有一群黑客找到了一条绕过Instagram安全机制的蹊径，而且这条路径恰恰来自Meta自己部署的AI客服聊天机器人。

事情最早在Reddit和X（Twitter）上发酵。多名用户发帖称自己的Instagram账户突然被劫持，密码被人改了，自己却被挡在门外。受影响的不只是普通用户——奥巴马时期白宫运营的Instagram账号（2017年之后就再没发过内容）也被攻破，连美国太空军总军士长John Bentivegna的账户也未能幸免。

Meta AI应用图标（图源：Matthias Balk/picture alliance / Getty Images）

黑客是怎么做到的

根据安全研究员和受害者的还原，整个攻击流程出奇地简单——简单到令人不安。黑客首先用VPN把位置伪装成受害者所在的地方，这样可以绕过Instagram的异地登录警报。接下来，他们打开Meta AI客服聊天窗口，直接要求机器人往目标账户里添加一个新的电子邮箱地址。

AI聊天机器人照做了，把验证码发到了黑客控制的邮箱。黑客拿到验证码之后，又把它输回给聊天机器人，于是机器人弹出了一个”重置密码”按钮。点下去，输入新密码，账户就彻底易主了。

整个过程中，黑客从头到尾都没有碰过受害者绑定的原始邮箱。也就是说，哪怕你开启了两步验证，只要黑客能说服AI客服机器人，你的账户就形同虚设。

安全研究员Jane Wong也在受害者之列。她在X上写道：”我的密码在我不知情的情况下被修改了，昨天我一整天都在收到不同的密码重置尝试请求，这非常令人担忧。”

影响范围有多大

目前还不清楚究竟有多少账户受到了影响。Instagram发言人Andy Stone在X上回复称，该问题已于周一（6月1日）修复。但他没有透露受影响用户的具体数字，Meta方面也没有回应TechCrunch的置评请求。

这类攻击最令人不安的地方在于：AI客服的设计初衷是为了让用户更方便地自助解决问题，但一旦这个入口缺少足够的身份验证，它反而成了攻击者最喜欢的后门。你让AI帮你找回账户，结果AI把账户拱手让人——这画面多少有些讽刺。
- 用VPN伪装目标用户所在位置，绕过异地登录检测
- 诱骗Meta AI客服机器人往目标账户添加新邮箱
- 机器人向黑客邮箱发送验证码，黑客将其回传给机器人
- 点击机器人提供的”重置密码”按钮，完成账户接管
这件事也给所有在客服场景内部署AI的公司提了个醒：当AI拥有了修改用户账户信息的权限，它的”信任边界”就必须重新定义。否则，AI客服就不是在服务用户，而是在帮黑客办事。

📎 原文来源：TechCrunch · Hackers hijacked Instagram accounts by tricking Meta AI support chatbot
2026年6月14日
谷歌把一群用AI搞诈骗的中国人告了，这伙人靠钓鱼网站卷走了19亿美元

谷歌本周在加州联邦法院递交了一纸诉状，被告是一个叫”Outsider Enterprise”的网络犯罪组织。这个组织的特别之处在于——他们把AI用在了诈骗上，而且用得相当”高效”。

谷歌正式起诉利用AI实施大规模诈骗的犯罪组织 | 来源：TechCrunch

一个”傻瓜式”的钓鱼工具

Outsider Enterprise运营着一款叫”Outsider”的钓鱼软件，收费模式很直白——每周88美元，或者每月200美元。付了钱之后，哪怕你是个对编程一窍不通的人，也能在几分钟内生成一个以假乱真的仿冒网站。

这个软件内置了超过290种网站模板，覆盖电信运营商、银行、政府机构、零售电商——基本上你能想到的主流网站，它都有对应的仿冒版本。更离谱的是，它还附带”使用教程”，教用户怎么把AI生成的代码拿去干坏事。

据谷歌的起诉书披露，这个组织甚至用谷歌自家的Gemini来生成仿冒网站代码和诈骗短信文案。相当于谷歌的工具被拿来对付谷歌的用户。

数字大到吓人

谷歌在起诉书中列出了一串令人咋舌的数据：从2023年7月开始，这个钓鱼平台已经窃取了至少387万张信用卡信息，对应预估损失高达19亿美元。截至起诉时，来自95个国家的3.6万张支付卡信息被确认被盗取。

光是2026年5月的两周时间里，这个组织就向安卓用户发送了250万条诈骗短信。同一时期，安卓用户向谷歌举报的垃圾短信有5.5万条——算下来，每分钟至少收到2条举报。

更夸张的是规模数据：2025年11月到2026年4月的5个月里，谷歌检测到与这个组织相关的URL超过159万个。这个组织总共搭建了超过100万个钓鱼网站，还有9000个虚假站点。

一条完整的黑色产业链

起诉书显示，这个组织内部已经形成了相当完整的分工体系：有人负责软件开发和维护，有人专门提供诈骗目标的信息，有人负责批量发送垃圾短信，还有人负责把盗来的凭证变现和洗钱。各组之间配合默契，在Telegram频道上交流”经验”。

谷歌在起诉书中说，这个组织甚至用谷歌云盘（Google Drive）和谷歌云（Google Cloud）的基础设施来托管钓鱼网站——相当于在谷歌的服务器上搭起了诈骗平台。

谷歌的反击

这次谷歌没有只停留在技术拦截层面，而是直接走了司法途径。起诉书指控Outsider Enterprise多项违法行为：仿冒谷歌品牌侵犯版权、敲诈勒索、电信欺诈、虚假广告，以及利用谷歌基础设施从事非法活动。

技术层面，谷歌说他们现在用”AI驱动的工具来对抗AI驱动的诈骗”，每月能拦截超过100亿条诈骗信息。他们还与AT&T、T-Mobile、Verizon等运营商合作，共同拦截诈骗短信。

执法层面，谷歌已经和FBI协调行动，FBI联合谷歌和Lumen的Black Lotus Labs查封了该组织使用的多个域名，以及用于测试钓鱼服务的Shopify店铺和账户。

AI降低犯罪门槛这件事

这个案子最值得注意的地方，不是诈骗本身——网络钓鱼已经存在了几十年——而是AI把门槛降到了什么程度。以前要做一个以假乱真的钓鱼网站，你得懂点前端代码，知道怎么绕过浏览器的安全警告。现在，付88美元，跟AI描述一下你想要什么，几分钟就能搞定。

谷歌在起诉书中特别提到，这个组织的软件是”钓鱼傻瓜式工具”——换句话说，他们在用AI democratize（民主化）犯罪。这波AI能力扩散的副作用，可能比很多人想象的来得更快。

📎 原文来源：Google sues Chinese cybercrime operation that used AI to scam ‘hundreds of thousands of victims’ — TechCrunch

2026年6月13日
GPT-5.5把316道黑客题做对292道，网络安全评测体系被AI干碎了
2026年5月27日，澳大利亚研究机构Lyptus Research发布了一份让网络安全圈相当震惊的报告：GPT-5.5在316道进攻性网络安全任务中解出了292道，正确率高达92.4%，直接把这套评测体系干到了”饱和”状态——剩下的24道题不足以支撑有统计意义的能力曲线拟合，评估方法宣告失效。

换句话说，用来衡量AI黑客有多危险的尺子，先被AI自己弄坏了。

“我们2025年12月搭建这套测试时，选的还是全球最难的题。2026年3月数据就出现饱和苗头。到5月，饱和已经成为事实。”——Lyptus Research 报告

316道题，覆盖了黑客的”全科”

这套评测不是纸上谈兵。316道任务覆盖了7个基准领域，包括漏洞利用、CTF夺旗赛题目、真实CVE漏洞复现三类，每道题都设置了人类安全专家的完成时间作为基线参考。

GPT-5.5的表现相当于什么水平？Lyptus的评估是：顶级黑客团队的水平。不是脚本小子的水平，是那些能在真实环境中找到零日漏洞、写出可靠利用代码的人的水平。

更有意思的是Token预算对能力的影响。在最难的基准CyberGym上，GPT-5.5在200万Token预算下正确率只有54.4%；推到5000万Token时，正确率飙升至86.4%——同一个模型，只因为给的算力更充裕，正确率涨了32个百分点。英国人工智能安全研究所（AISI）的独立研究也证实：给到1亿Token时模型能力仍在上涨，还没看到平台期。

AI黑客能力每5到6个月翻一倍

Lyptus从2024年开始追踪相关数据，拟合出的增长曲线相当吓人：AI进攻性网络安全能力，每5到6个月翻一倍。

这个”时间地平线”指标衡量的是：一个AI系统完成顶级难度任务平均需要多少时间（通过不断增加算力预算来测量）。2026年初，Claude Opus 4.6的时间地平线是3.2小时，GPT-5.3 Codex是3.1小时。两个月后，GPT-5.5的时间地平线直接拉到了5.1小时——如果放开算力上限让它冲过12小时的测量上限，这条曲线根本画不出来。

问题在这里：时间地平线方法论原本的假设是，总会有比当前模型能力更难的题来锚定曲线的拐点。但GPT-5.5把所有题都做完了，拐点消失了，曲线无法拟合。评测体系不是被证伪了，是被模型能力的增长速度远远甩在了后面。

头部厂商已经在”控”了

意识到这个能力水平意味着什么之后，头部厂商的动作相当迅速：
- Anthropic：4月发布Claude Mythos Preview，但因为网络安全能力过强，决定不公开发布。配套推出了Project Glasswing，只把模型部署给关键基础设施的防御方使用。
- OpenAI：给GPT-5.5的网络安全能力评级为”High”（只比最高级”Critical”低一档），所有攻击相关能力均通过”Trusted Access for Cyber”门控，不是谁都能调用。
- METR独立评估：拟合出Claude Mythos的时间地平线至少为16小时，但无法给出精确点估计——这意味着连独立评估机构都跟不上模型的边界了。
最麻烦的问题：闭源能力迟早会开源

Lyptus测量了一个叫”适应缓冲期”的指标：从一个闭源前沿能力首次出现，到同等能力出现在开源模型里，平均时间差是多少。在进攻性网络安全领域，这个数字是5.7到13.1个月。

按当前的速度，Mythos和GPT-5.5级别的攻击能力，2026年年内就可能以开源形式落到任何人手里。到那时候，没有”Trusted Access”门控，没有使用场景限制，只有一块显卡和一点好奇心。

网络安全圈子里的普遍看法是：防御方本来就需要假设”攻击者拥有无限资源”，但当一个高中生也能在本地跑一个GPT-5.5级别的攻击模型时，”无限资源”的假设就不再是理论讨论了。

连”最易量化”的领域都跟不上了

这份报告最让人不安的地方，其实不在92.4%这个数字本身，而在于它暴露了一个结构性困境：网络安全是少数有明确成功判据（漏洞找到了没有？系统打穿了没有？）因而相对容易量化的AI能力领域。连这个领域的评估体系都已经失效了，那些更模糊、更难量化的能力维度——推理、规划、社会工程——的评估困境只会更突出。

如果AI能力真的按照每6个月翻一倍的速度增长，一年后是当前的4倍，两年后是16倍。在通往AGI乃至ASI的路上，失效的评估体系只会越来越多，而不是逐渐被修好。

对于安全研究者来说，这份报告给出的信号很直接：静态防御规则已经不够用了。当攻击方可以用AI实时生成针对特定目标环境的漏洞利用代码，防御方也必须用AI来对抗AI——而且是同样聪明、同样快速的AI。

📎 原文来源：36氪 – GPT-5.5彻底击穿300个黑客评测任务 | CSDN – GPT-5.5进攻性网络安全测试分析
2026年5月29日
Google出手了：CodeMender直指Anthropic Mythos，AI安全大战打响
Anthropic的Claude Mythos Preview大模型发布的时候，整个AI圈都震了一下。这个模型强到什么程度呢？它不仅在代码安全漏洞识别上表现出色，还吸引了多家顶级银行、甚至美联储主席的关注。因为能力太强，Anthropic起初被认为不适合公开发布，最后只开放给早期企业用户和政府机构使用。

Google坐不住了

就在大家都觉得Anthropic在AI安全赛道上”一骑绝尘”的时候，Google在I/O 2026大会上悄悄亮了一张牌：CodeMender。这个工具早在2025年10月就首次亮相，但当时没有引起太大波澜。现在，Google把它重新推到台前，明确对标Anthropic的Mythos。

CodeMender的核心能力是同时识别并修复代码库中的安全漏洞。和Mythos不同的是，它不只是”发现”问题，还能”解决”问题。这个设计很聪明：企业客户需要的不是一份漏洞清单，而是一个能帮他们把漏洞修好的工具。

Google CEO桑达尔·皮查伊公开表示：”Mythos证明了超大参数规模模型在安全类场景中有明确价值，而我们同样具备提供这类产品的能力。”

开放策略：从小范围到逐步扩大

Anthropic的Mythos目前只面向早期企业用户和政府机构小范围开放，没有公开发布。Google则采取了不同的策略：在I/O 2026之后，他们向特定专家群体开放了CodeMender的API测试权限，逐步扩大开放范围。

这个策略背后有Google的算盘。他们已经和政府、企业客户展开沟通，推动CodeMender用于系统安全审计。和Anthropic的”高冷”路线不同，Google更想快速把这款产品推向市场，用生态优势（Google Cloud、Android、Workspace）来绑定客户。

AI安全赛道为什么突然火了

其实在Anthropic发布Mythos之前，AI安全这个赛道并不算热门。大多数公司更关心的是”怎么让模型更聪明”，而不是”怎么让模型更安全”。但Mythos的出现改变了这个认知：安全，也可以成为大模型的核心卖点。

这对AI公司来说是个好消息。因为”安全”这个东西，企业和政府愿意买单，而且价格不菲。Anthropic的Mythos主要面向高安全需求的企业和政府客户，定价肯定不便宜。Google看到这块肥肉，当然也想分一杯羹。
- 客户选择更多了：政府、金融、关键基础设施等领域的客户，之前在AI安全服务上的选择很有限，Google CodeMender的入场提供了更多元化的选择
- 技术迭代会更快：有竞争才有进步，Google和Anthropic在这个赛道上”掰手腕”，最终会让AI安全技术的能力提升得更快
- 价格可能会下降：垄断市场的高价，在竞争出现后通常会有所调整，客户可以期待更合理的定价
Google的真实算盘

除了在AI安全赛道上和Anthropic竞争，Google推出CodeMender还有更深层的目的：为IPO铺路。有消息称，Google的母公司Alphabet正在为2026年的IPO做准备，而”AI安全解决方案提供商”这个定位，比”搜索引擎公司”性感得多，也更容易在资本市场上讲出一个好故事。

不管怎么说，AI安全大赛道的竞争才刚刚开始。Anthropic验证了市场需求，Google跟进布局，接下来可能还会有更多玩家入场。对我们这些旁观者来说，这出好戏，才刚拉开帷幕。

📎 原文来源：The Verge – Google wants to compete with Anthropic’s Mythos
2026年5月20日
从少年黑客到铁穹研究员，他融了2800万美元教AI识别钓鱼邮件

Shay Shwartz少年时期靠黑客技术谋生，16岁那年失手被抓，在法庭上他意识到自己的网络安全才能可以用来防御攻击，而不是发起攻击。此后他一路打怪升级，在以色列精英国防和情报部门干了十年，参与了铁穹项目的相关研发工作。

Ocean AI创始团队（来源：Ocean / TechCrunch）

AI把钓鱼攻击的门槛踩碎了

过去只有高度成熟的黑客才能发起精准的鱼叉式钓鱼，因为要针对特定目标做大量调研，费时费力，能盯上的人很有限。AI出来之后，整个流程被自动化了——大语言模型可以批量采集公开信息，几秒钟生成针对某个人的高度定向钓鱼邮件，规模和精度都不是一个量级的。

“我可以指示大语言模型去了解你的具体信息，大量采集公开信息，生成针对你的高度定向钓鱼攻击。”Shwartz对TechCrunch说。

Ocean怎么做邮件安全

Shwartz认为，传统供应商（Proofpoint、Mimecast）和新兴玩家（Abnormal Security）能检测常规钓鱼攻击，但对付AI驱动的定向攻击需要不同的思路。

Ocean的做法是用小型语言模型去全面分析每封 incoming 邮件的上下文，识别欺诈和冒充行为，理解发件人的意图，再结合用户所属组织的具体场景做判断。Shwartz打了个比方：就像每个门口都有守卫，每封邮件进来都要被盘问一遍。

目前Ocean每月为Kayak、金士顿科技、Headspace等客户审查数十亿封邮件。模型体量小，速度快，能在邮件到达用户收件箱之前完成判断。

2800万美元，Lightspeed领投

这轮融资由Lightspeed Venture Partners领投，Picture Capital和Cerca Partners跟投。天使投资人阵容也很豪华：Wiz联合创始人兼CEO Assaf Rappaport，以及近期以77.5亿美元被ServiceNow收购的Armis联合创始人Yevgeny Dibrov和Nadir Izrael都参与了。

Ocean之前一直在隐身模式，现在正式亮相，时机挑得挺准——AI钓鱼攻击的量级正在指数级攀升，企业邮件安全是个真实且正在扩大的痛点。

📎 原文来源：From teen hacker to Iron Dome researcher, this founder raised $28M to fight AI phishing – TechCrunch

2026年5月20日