博客

Anthropic估值超OpenAI逼近1万亿美元，Claude Code三个月烧出9650亿

Anthropic完成了一轮让整个硅谷侧目的融资。650亿美元进账，投后估值9650亿美元，这家公司现在的身价已经把OpenAI甩在了身后。

从3800亿到9650亿，只用了3个月

今年2月，Anthropic的估值还是3800亿美元。3个月后再融资，直接飙到9650亿。这种涨幅在AI圈也算是现象级的。

本轮由Altimeter Capital、Dragoneer、Greenoaks和红杉资本联合领投，同时还包含了此前承诺的150亿美元投资（其中亚马逊出了50亿）。作为对比，OpenAI在3月下旬完成1220亿美元融资后，估值为8520亿美元。

Anthropic的年度经常性收入已经达到470亿美元，远高于今年早些时候的300亿美元，也比去年同期的100亿美元高出近4倍。

营收暴涨的核心驱动力是Claude Code——这款AI编程助手正在成为越来越多开发者和企业的标配工具。Anthropic首席财务官Krishna Rao的话说得很直白：Claude在客户群体里越来越不可或缺，这笔钱就是用来满足历史性需求的。

Anthropic最新一轮融资650亿美元，估值达9650亿美元（图源：CNBC）

三强争霸，都在准备上市

头部AI公司的IPO竞赛已经打响。马斯克的SpaceX（旗下有SpaceX AI）上周提交了招股说明书，合并后估值1.25万亿美元。OpenAI也准备在未来几天内提交保密招股书，最早今年9月挂牌。

Anthropic虽然在幕后也在筹备IPO，但时机还不明确。毕竟手里有650亿美元现金，并不急着上市。真正让外界关注的是，它是否已经走到了”盈利”这个AI公司集体梦寐以求的节点。

同期发布的Claude Opus 4.8和具备高级网络安全能力的Claude Mythos Preview，也在向市场传递一个信号：Anthropic不只是钱多，技术也在往前走。

有意思的是，这轮融资完成后，全球AI版图上估值最高的私有公司头衔，正式从OpenAI交棒给了Anthropic。而就在一年多前，绝大多数人还认为这个位置非OpenAI莫属。

资本用脚投票的背后，是Claude在企业级市场的真实渗透力。比起OpenAI消费者端的耀眼数据，Anthropic的企业客户粘性可能是它估值能够持续走高的更底层逻辑。

📎 原文来源：CNBC – Anthropic tops OpenAI as most valuable AI startup, nears $1 trillion valuation

2026年5月30日
CNN把Perplexity告了，AI版权战打到新战场
CNN正式对AI搜索公司Perplexity提告，指控它逐字复制CNN的报道内容，还为付费墙后面的内容提供摘要。这起诉讼让Perplexity的法律麻烦又多了一桩。

“人类记者去报道、研究、撰写、创作的内容，Perplexity在未经许可、没有补偿的情况下直接拿去用。”CNN在诉讼中写道。

谈判破裂后直接告上法庭

CNN和Perplexity其实谈过合作。2025年10月，双方曾就Perplexity的”Comet Plus”订阅服务使用CNN内容进行过谈判，但因为对AI生成答案中CNN内容的使用限制谈不拢，最终没有签成协议。CNN在11月正式发函要求Perplexity停止未经授权使用其内容，据说Perplexity根本没回信。

CNN在起诉书中举了一个例子：只要用Perplexity搜索一篇文章标题——《What’s next for Minneapolis? A shaky promise, mounting tensions and the fight for control》——它就能生成该报道”大量逐字复制”的内容片段。

Perplexity的回应只有一句话

面对CNN的指控，Perplexity发言人的回应相当简短：”事实是不能被版权化的。”这句话基本上概括了Perplexity对整个AI版权争议的核心立场——它认为AI生成的内容是对事实的重组，不构成侵权。

这个立场在法庭上能不能站得住脚，目前还没有定论。但CNN不是唯一一个这么想的，已经起诉Perplexity的机构包括《纽约时报》、大英百科全书、韦氏词典、新闻集团（华尔街日报母公司）、亚马逊和Reddit。
- 《纽约时报》是最早对Perplexity提告的媒体之一，目前案件仍在审理中
- 新闻集团旗下《华尔街日报》等媒体的诉讼，核心争议也是AI摘要是否构成”衍生作品”
- 亚马逊和Reddit的诉讼则更侧重于数据爬取和平台条款违反
这场官司会影响到普通用户吗

短期来看不会。Perplexity的搜索服务还在正常运行，这起诉讼从立案到判决通常要拖上好几年。但它释放了一个明确信号：内容生产商对AI公司的忍耐已经到了极限，接下来的谈判桌上，内容授权费用会成为一个越来越重的成本项。

对做AI产品的公司来说，这其实是个提醒——爬数据归爬数据，但真被人告上法庭，光靠”事实不能版权化”这句话未必够用。

📎 原文来源：The Verge – CNN sues Perplexity over ‘verbatim’ copycat articles
2026年5月30日
英伟达砸完200亿美元，Groq自己又要融6.5亿美元
英伟达刚跟Groq做完一笔200亿美元的”非收购式招聘”，这家AI芯片初创公司自己又要融资了。据Axios报道，Groq正在寻求6.5亿美元的新一轮融资，投资方正是它现有的那些支持者。

Groq做的事跟英伟达不太一样。它押注的是AI推理环节——也就是模型接收用户提示后生成回答的那个阶段。现在整个行业都在疯抢推理算力，训练的需求反而没那么紧张了。

英伟达那笔200亿美元的交易到底买了什么

2025年12月，英伟达和Groq签了一笔结构很特殊的协议。表面上看不是收购，但Groq的多名高层直接跳槽去了英伟达，同时Groq把硬件技术授权给了英伟达使用。如果这是一笔正常的收购，它会是英伟达历史上最大的一笔。

对Groq的投资者来说，这反而是个好消息——他们拿到了现金回报，现在又被邀请继续投钱，支持Groq把推理云（Inference Neocloud）业务做起来。

推理为什么比训练更值钱

训练一个大模型是一次性投入，而推理是每次用户发消息都要消耗算力的持续过程。ChatGPT每天要处理几十亿次请求，每一次都是推理。这个市场的规模，某种程度上比训练市场还要大。

Groq的芯片设计思路跟英伟达完全不同，它追求的是极致的推理速度，而不是训练所需的大规模并行计算。这套打法能不能跑通，6.5亿美元的新融资会给出部分答案。
- 现有投资者Disruptive和Infinitium已承诺，若其他投资者认购不足，将全额补足本轮融资
- 临时CEO Adam Winter和临时CFO Matt Eng领导业务转型
- Groq推理云直接面向开发者和企业提供API服务，与英伟达的芯片销售模式形成差异
📎 原文来源：TechCrunch – After Nvidia’s $20B not-aqui-hire, AI chip startup Groq reportedly raising $650M
2026年5月30日
这家公司免费帮你打扫房间，条件是记录全过程用来训练机器人
AI训练数据初创公司Shift最近在社交媒体上宣布了一个听起来有点奇怪的优惠：他们将免费为用户提供家庭清洁服务，条件是允许设备记录清洁人员的工作过程，以此收集高质量的机器人训练数据。

该公司的”魔法帽”计划本质上是在用未来的机器人能力，换取今天的真实世界动作数据。清洁人员戴着配有摄像头的帽子工作，记录他们如何擦洗、吸尘、除尘、整理和清洗——这些都是未来家庭服务机器人需要掌握的核心技能。

“你得到一间一尘不染的公寓。我们得到训练数据。双赢。”——Shift官方网站

魔法帽里有什么？

清洁人员戴着一顶看起来有点尴尬的白色帽子——官方称之为”魔法帽”——里面藏着一台摄像头，从清洁人员的第一视角捕捉工作画面。

Shift的”魔法帽”从清洁人员第一视角记录工作过程（图源：The Verge）

当然，让别人的摄像头进到你家里，这本身就是你得”支付”的代价。Shift在官网上说客户的”隐私得到充分保护”，敏感细节（如姓名、面部、屏幕和个人信息、身份证）在用于AI训练之前会被模糊化和匿名化处理。

越脏越好？

Shift在宣传视频中说：”今天清洁的每一间房子，都为明天能自己清洁的房子打下基础。”

有意思的是，该公司表示“更具挑战性的清洁环境”可能特别有用。换句话说，你家越脏乱，对训练机器人来说反而越有价值。当然，清洁人员”可以拒绝执行任何他们感到不舒服的具体任务”。

不只是清洁

清洁可能只是开始。Shift的视频显示，该公司最终计划扩展到管道维修、烹饪和建筑等其他领域。

Shift表示，它已经向15个国家的数万人支付报酬，让他们通过应用程序记录自己的活动。这个市场正在增长——用于训练AI系统和机器人的人类任务录像，正成为AI数据竞赛中的稀缺资源。

目前只在纽约，很快扩展到更多城市

这项免费清洁服务目前仅在纽约提供。但联合CEO兼联合创始人Bercan Kilic表示，很快将在旧金山、伦敦、苏黎世和慕尼黑推出。

免费清洁只是”限时”优惠，但这个模式其实触及了一个更大的趋势：AI公司越来越愿意用真实世界的服务，来换取训练下一代机器人所需的高质量数据。
- 清洁人员戴”魔法帽”第一视角记录工作过程
- 隐私保护：敏感信息在训练前被模糊化和匿名化
- 目前仅在纽约，即将扩展至旧金山/伦敦/苏黎世/慕尼黑
- Shift已在15个国家拥有数万名数据贡献者
- 未来计划扩展至管道/烹饪/建筑等更多家庭场景
📎 原文来源：The Verge — This AI startup will clean your home for free to train future robots
2026年5月29日
这家芯片初创把计算搬进内存，1.35亿美元融资到手
每次你向ChatGPT提问，你的请求都会触发一场数据接力赛。信息离开内存，经过CPU预处理，传输到GPU进行繁重计算，然后再返回——而AI生成的每一个字，整个流程都会重复一遍。

瓶颈是结构性的。这意味着每一个请求中，数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司，刚刚在B轮融资中筹集了1.35亿美元，估值达5.7亿美元。

“几十年来，CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim

把计算搬进内存

XCENA的芯片MX1通过CXL（计算快速链接）连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近，而不是反过来。

该公司声称，以前需要10台服务器完成的工作，现在可能只需要1台就可以完成。

XCENA MX1芯片原型（图源：TechCrunch）

为什么是内存，不是算力？

XCENA的业务押注于一个论点，即”推理不仅是计算问题；它越来越是一个内存扩展问题。”

虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排，包括预处理、KV缓存管理（存储之前的对话上下文的系统，这样模型就不需要重新处理它）、数据缓存，仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。

创始团队来自三星和SK海力士

XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司，三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。

本月，主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是，AI基础设施正朝着以内存为中心的架构更广泛地转变。

竞争对手和差异化

XCENA最接近的竞争对手包括Astera Labs和Marvell，这两家纳斯达克上市公司都在研发下一代内存连接技术。

差异化因素在于知识产权。XCENA有数千个核心，每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下，Marvell的方法依赖少数几个通用核心。

时间表和挑战

MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线，该公司预计从2027年开始产生收入。

XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业，即使内存效率有微小的提升，也可能意味着数亿美元的节省。
- B轮融资1.35亿美元，估值5.7亿美元
- 累计融资总额达1.85亿美元
- MX1芯片基于RISC-V开源架构
- 目标客户：超大规模AI基础设施运营商
- 量产时间：2026年底；收入预期：2027年
📎 原文来源：TechCrunch — This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory
2026年5月29日
Claude Opus 4.8来了：一口气跑1000个子智能体，代码审查聪明4倍
昨天（5月28日），Anthropic把Claude Opus 4.8扔了出来。这次更新的重点很明确：让AI在写代码这件事上更像一个能独立工作的资深工程师，而不是一个需要你步步盯着的高级补全工具。

代码缺陷少4倍，这才是最值钱的地方

Opus 4.8最核心的改进，是代码质量。Anthropic说，这个模型生成的代码里有缺陷但没被标记出来的概率，比上一代低了大约4倍。对那些把AI辅助编程塞进生产流程的团队来说，这个改进直接等于少掉很多坑——未检测到的代码缺陷，在 downstream 产生的修复成本是 exponentially 增长的。

基准测试的数据也佐证了这一点：代理编码得分从64.3%爬到了69.2%，使用工具的多学科推理从54.7%提到57.9%，知识工作得分从1753分涨到1890分。数字看起来增幅不大，但在AI模型迭代里，这种全方位的几个百分点提升，往往意味着实际使用中”可用”和”好用”之间的差距。

Anthropic对Opus 4.8的描述是：”更敏锐的判断力、更诚实地展示其进展，以及比前代模型更长时间独立工作的能力。”这三个点，其实正好对应了企业开发者对AI编码助手最头疼的三个问题：判断不准、爱装懂、干两分钟就得人工介入。

动态工作流：1000个子智能体一起干活

这次最炸裂的功能叫”动态工作流”（Dynamic Workflows），目前在research preview阶段。简单说，就是Claude现在可以写编排脚本，生成并管理几十到几百个并行子代理，从任务启动到完成全程自动跑。

上限是每个运行最多16个并发子代理、总共1000个子代理。实际场景是什么样子？比如你要迁移一个几十万行代码的代码库，以前你得手动拆任务、分配、汇总，现在Opus 4.8可以直接把整个代码库迁移从启动做到生成可合并的拉取请求，中间不用你手动协调。

这个功能一旦正式上线，对大型代码库维护团队来说是个.game changer。不需要额外写编排逻辑，不需要手动拆解任务，模型自己决定怎么把大任务碎成小任务、怎么并行跑、怎么汇总结果。

快速模式：快2.5倍，便宜3倍

Anthropic还把快速模式（Fast Mode）大幅升级了。新版本的快速模式比标准推理快大约2.5倍，而成本只有之前Opus模型快速模式的三分之一。定价是每百万输入token 10美元、每百万输出token 25美元。

新的”努力控制”（Effort Control）设置也值得提一下：用户可以调整Claude在任务上投入的计算量。Opus 4.8默认是”高努力”，Anthropic认为这对大多数工作负载来说是最佳平衡。如果你要处理的任务比较轻量，可以调低努力级别来省钱。

已经在哪能用

从昨天开始，Opus 4.8已经在以下平台可用：
- Claude API——直接给开发者和平台构建者用
- Amazon Bedrock——集成到AWS基础设施里
- Google Cloud Vertex AI——GCP托管AI服务中可用
- Microsoft Foundry——通过Microsoft的AI开发平台访问
已经在生产环境跑Opus 4.7的团队，迁移基本无感——模型标识符更新一下就行，价格没变，这也是Anthropic故意做的”升级成本中性”设计。

下一步：Mythos级模型已经在路上

Anthropic已经确认正在开发新一代”Mythos级”模型，会在”未来几周内”发布。目前关于架构、能力基准或定价的细节都没披露，但Opus 4.8看起来更像一个短期过渡版本，而不是一个长周期旗舰。这也延续了Anthropic在2025年和2026年加速模型更新的节奏——不再憋大招，而是快速迭代、快速铺开。

对于每天都在跟AI编码助手打交道的开发者来说，Opus 4.8最直观的感受可能就是：它犯傻的频率低了，能独立跑的时间长了，而你需要手动介入的次数——终于开始明显减少了。

📎 原文来源：Claude Opus 4.8 推出，支持 1,000 个子智能体编排和 4 倍更智能的代码审查器
2026年5月29日
OpenAI基金会砸2.5亿美元，帮劳动者应对AI冲击

前几天OpenAI基金会扔出一个重磅消息：拿出2.5亿美元，专门帮那些被AI波及的劳动者和社区做转型。这笔钱是去年OpenAI重组后，那个控制OpenAI的非营利组织拿到1300亿美元股权之后的第一次大动作。

1300亿美元的非营利巨头

去年OpenAI重组的时候，很多人没注意到一个细节——非营利组织保留了OpenAI营利性业务26%的股权，按当时估值大约是1300亿美元。一夜之间，这个原本只是小打小闹的赠款机构，直接变成了科技圈最富有的慈善组织之一。

今年3月，OpenAI公开承诺未来12个月通过基金会至少投入10亿美元，重点盯住生命科学研究、AI素养、公民建设和经济机会这几个方向。而这次的2.5亿美元，就是这10亿美元承诺里第一批真正拨出去的钱。

OpenAI基金会在声明里说得很直白：”当前的变化速度意味着我们正确应对的窗口比习惯的要短，而错误应对的代价是巨大的。”这句话背后，是对AI冲击劳动力市场紧迫性的真实认知。

钱到底花在哪

基金会把这2.5亿美元拆成了三块，跟传统慈善机构很不一样——他们不仅要给钱，还要自己下场做项目。

第一块是研究基础设施。他们觉得目前缺的是独立、严谨的劳动力市场影响分析，太多炒作和恐慌，太少实打实的数据。基金会要自己建团队，做中立的预测和研究。

第二块是直接劳动者支持。目标群体很明确：客服、金融后台运营、入门级软件岗位——这些已经被AI工具大量替代的领域。基金会会资助那些给失业劳动者提供转型培训的组织。

第三块是AI驱动的经济模拟。说白了就是用计算建模，画出区域经济在国家层面随着AI能力扩展可能发生的变化图谱。产出这些数据，是给政策制定者、教育者和雇主用来规划培训和转型路径的。

Sam Altman的态度转变

有个细节挺有意思。Sam Altman今年早些时候还跟伴侣Oliver Mulherin一起签了”捐赠誓言”，但他最近几个月公开表态软化了不少。他承认：”我很高兴我错了——我曾以为到这个时候，入门级白领工作的消失会比实际发生的影响更大。”

这种软化，跟基金会一边说”失业担忧真实存在”、一边又强调”主动干预窗口正在缩小”的谨慎态度形成了微妙的对照。Altman的个人态度在变，但基金会的行动逻辑没变：先把钱和资源到位，不管AI到底会不会真的消灭大量工作岗位，提前布局总没错。

现实已经发生了

基金会这个动作不是凭空来的。最近几个月，已经有一堆公司把裁员和效率措施直接跟AI采用挂钩了。Block和Standard Chartered在近期的裁员公告里明确提到了AI带来的效率提升，说明”AI导致失业”已经不是什么遥远的理论风险，而是正在发生的事。

这场辩论的核心其实是：AI带来的经济收益，到底会广泛惠及普通劳动者和社区，还是主要归股东和高技能技术人员所有？OpenAI基金会砸这2.5亿美元，等于是在用真金白银表态：他们想成为塑造这个答案的积极参与者，而不只是旁观者。

接下来的看点就是：这个拥有1300亿美元股权的基金会，能不能真的把规模转化成那些正在经历技术转型的劳动者手上可感知的帮助。首批具体项目公告和合作组织，预计在今年下半年公布。

📎 原文来源：OpenAI 1300 亿美元的非营利组织迈出第一步：投入 2.5 亿美元帮助工人应对人工智能转型

2026年5月29日
GPT-5.5把316道黑客题做对292道，网络安全评测体系被AI干碎了
2026年5月27日，澳大利亚研究机构Lyptus Research发布了一份让网络安全圈相当震惊的报告：GPT-5.5在316道进攻性网络安全任务中解出了292道，正确率高达92.4%，直接把这套评测体系干到了”饱和”状态——剩下的24道题不足以支撑有统计意义的能力曲线拟合，评估方法宣告失效。

换句话说，用来衡量AI黑客有多危险的尺子，先被AI自己弄坏了。

“我们2025年12月搭建这套测试时，选的还是全球最难的题。2026年3月数据就出现饱和苗头。到5月，饱和已经成为事实。”——Lyptus Research 报告

316道题，覆盖了黑客的”全科”

这套评测不是纸上谈兵。316道任务覆盖了7个基准领域，包括漏洞利用、CTF夺旗赛题目、真实CVE漏洞复现三类，每道题都设置了人类安全专家的完成时间作为基线参考。

GPT-5.5的表现相当于什么水平？Lyptus的评估是：顶级黑客团队的水平。不是脚本小子的水平，是那些能在真实环境中找到零日漏洞、写出可靠利用代码的人的水平。

更有意思的是Token预算对能力的影响。在最难的基准CyberGym上，GPT-5.5在200万Token预算下正确率只有54.4%；推到5000万Token时，正确率飙升至86.4%——同一个模型，只因为给的算力更充裕，正确率涨了32个百分点。英国人工智能安全研究所（AISI）的独立研究也证实：给到1亿Token时模型能力仍在上涨，还没看到平台期。

AI黑客能力每5到6个月翻一倍

Lyptus从2024年开始追踪相关数据，拟合出的增长曲线相当吓人：AI进攻性网络安全能力，每5到6个月翻一倍。

这个”时间地平线”指标衡量的是：一个AI系统完成顶级难度任务平均需要多少时间（通过不断增加算力预算来测量）。2026年初，Claude Opus 4.6的时间地平线是3.2小时，GPT-5.3 Codex是3.1小时。两个月后，GPT-5.5的时间地平线直接拉到了5.1小时——如果放开算力上限让它冲过12小时的测量上限，这条曲线根本画不出来。

问题在这里：时间地平线方法论原本的假设是，总会有比当前模型能力更难的题来锚定曲线的拐点。但GPT-5.5把所有题都做完了，拐点消失了，曲线无法拟合。评测体系不是被证伪了，是被模型能力的增长速度远远甩在了后面。

头部厂商已经在”控”了

意识到这个能力水平意味着什么之后，头部厂商的动作相当迅速：
- Anthropic：4月发布Claude Mythos Preview，但因为网络安全能力过强，决定不公开发布。配套推出了Project Glasswing，只把模型部署给关键基础设施的防御方使用。
- OpenAI：给GPT-5.5的网络安全能力评级为”High”（只比最高级”Critical”低一档），所有攻击相关能力均通过”Trusted Access for Cyber”门控，不是谁都能调用。
- METR独立评估：拟合出Claude Mythos的时间地平线至少为16小时，但无法给出精确点估计——这意味着连独立评估机构都跟不上模型的边界了。
最麻烦的问题：闭源能力迟早会开源

Lyptus测量了一个叫”适应缓冲期”的指标：从一个闭源前沿能力首次出现，到同等能力出现在开源模型里，平均时间差是多少。在进攻性网络安全领域，这个数字是5.7到13.1个月。

按当前的速度，Mythos和GPT-5.5级别的攻击能力，2026年年内就可能以开源形式落到任何人手里。到那时候，没有”Trusted Access”门控，没有使用场景限制，只有一块显卡和一点好奇心。

网络安全圈子里的普遍看法是：防御方本来就需要假设”攻击者拥有无限资源”，但当一个高中生也能在本地跑一个GPT-5.5级别的攻击模型时，”无限资源”的假设就不再是理论讨论了。

连”最易量化”的领域都跟不上了

这份报告最让人不安的地方，其实不在92.4%这个数字本身，而在于它暴露了一个结构性困境：网络安全是少数有明确成功判据（漏洞找到了没有？系统打穿了没有？）因而相对容易量化的AI能力领域。连这个领域的评估体系都已经失效了，那些更模糊、更难量化的能力维度——推理、规划、社会工程——的评估困境只会更突出。

如果AI能力真的按照每6个月翻一倍的速度增长，一年后是当前的4倍，两年后是16倍。在通往AGI乃至ASI的路上，失效的评估体系只会越来越多，而不是逐渐被修好。

对于安全研究者来说，这份报告给出的信号很直接：静态防御规则已经不够用了。当攻击方可以用AI实时生成针对特定目标环境的漏洞利用代码，防御方也必须用AI来对抗AI——而且是同样聪明、同样快速的AI。

📎 原文来源：36氪 – GPT-5.5彻底击穿300个黑客评测任务 | CSDN – GPT-5.5进攻性网络安全测试分析
2026年5月29日
教皇良十四世首发AI通谕：技术从来不是中立的，谁在定义AI规则？
2026年5月15日，教皇良十四世（Pope Leo XIV）发布了他就任以来的首份通谕《Magnifica Humanitas》，副标题是”在人工智能时代守护人性尊严”。这是天主教会历史上第一份专门讨论人工智能的社会通谕，全文用拉丁文写成，同时提供多语言译本。

这份文件不是技术文档，也不是AI监管草案。它问的是一个更根本的问题：当算法开始替人类做决定，当机器能生成以假乱真的内容，当自动化系统接管越来越多的工作——人，还剩下什么不可替代的价值？

“技术从来不是中立的。它承载着设计者、资助者、监管者的价值观和利益取向。”——《Magnifica Humanitas》第二章

一份”10条核心立场”的AI伦理纲领

通谕没有给出技术路线图，而是列出了10项核心立场，可以看作是梵蒂冈版的”AI原则宣言”：
- 人性的本体论优先：人的尊严来自其存在本身，不取决于任何能力、产出或社会地位。AI可以模拟智能，但永远无法拥有人的尊严。
- 技术非中立性：AI系统反映其开发者、资助者和监管者的价值取向。不能把技术决策伪装成”纯技术问题”。
- 去人性化风险：不受约束的AI发展有可能把人简化为数据点，剥离掉关系中诞生的意义和精神维度。
- 治理必须透明且可参与：AI治理不能由科技巨头单方面决定，受影响的社区必须有实质参与权，包括算法透明、数据公平获取和申诉渠道。
- 真理作为公共品：AI驱动的虚假信息、算法对集体想象的操纵、共享真理的侵蚀，是对民主和社会凝聚力的威胁。
- 劳动尊严：AI自动化不能只算效率账，必须保护劳动者获得公平报酬、参与经济生活、免于不稳定和被剥削的权利。
- 自由防御：AI赋能的监控、行为操纵和新型数字依赖，是现代形式的奴役，必须主动抵制。
- 武器化红线：将AI整合进自主武器系统和数字战争工具，对人类生命和全球和平构成严重威胁。
- 全球公平：AI的益处必须面向全人类，不能制造新的数字鸿沟，把 marginalized 社区和发展中国家排除在技术进步之外。
- 信徒的召唤：基督徒和所有善意人士被号召参与AI治理和技术发展，做”共融的建设者”，确保AI服务于人的整体发展而非技术统治。
“巴别塔”还是”耶路撒冷”？

通谕用了一个很有张力的比喻：人类在今天面对的根本选择，不是在”要”还是”不要”技术之间做决定，而是在”建造巴别塔”和”重建耶路撒冷”之间做决定。

巴别塔代表的是：利润崇拜牺牲弱者、同质化抹杀差异、假装有一种单一语言（哪怕是数字语言）能把一切——包括人的奥秘——都翻译成数据和性能指标。通谕警告，这种”技术统治范式”的风险，是建造一个把上帝排除在外、把他人当作手段而非目的的未来。

“真正的进步永远来自一颗向他人开放的心、一个愿意倾听的理智，以及一种寻求联结而非分裂的意志。我们必须去爱的、天主赋予我们的、并在基督身上完全彰显的人性伟大——是任何机器永远无法替代的。”——《Magnifica Humanitas》

科技权力的”私有化”隐忧

通谕有一个相当犀利的观察：今天推动技术发展的主要力量是私有的、往往是跨国的主体，它们拥有的资源和干预能力超过许多政府。这种技术权力因此带上前所未有的”私有”面孔，使得 discern（辨别）、治理和引导这种权力服务于公共福利变得格外困难。

这份文件援引了已故教皇方济各的警告：那些掌握知识、特别是经济资源的人，已经获得了”对全人类和整个世界的令人印象深刻的统治力”。AI时代，这个警告的分量只增不减。

数据、算法、平台——新的”公共品”

通谕提出了一个很有意思的论点：在传统意义上的”土地、房屋、工具”之外，今天属于”全人类共同目的地”范围的物品，还必须包括专利、算法、数字平台、技术基础设施和数据。

当国家的财富越来越依赖知识和技术，而这些东西集中在极少数人手里、没有足够的分享和获取机制，就会造成一种新的不平衡，直接违背”公共目的地”原则。这个论点，放在今天关于AI垄断、开源模型和算力集中的讨论里，相当有现实意义。

各方反应：一份迟到的AI伦理坐标

这份通谕发布后，在科技伦理圈和AI治理领域引发了不少讨论。支持者认为，这是一份难得的、从人文主义而非监管合规角度讨论AI的纲领性文件；批评者则认为，用宗教框架讨论技术问题，对世俗社会和政策制定者的影响力有限。

不管立场如何，这份文件提出的核心拷问——”谁在定义AI的规则？”——确实是今天全球AI治理辩论里最缺乏实质答案的问题之一。当模型训练数据、算法目标函数、部署决策都掌握在少数公司手里，所谓”AI造福全人类”更像一句口号而非可验证的承诺。

教皇良十四世在通谕末尾写道：技术人员、哲学家、神学家、政策制定者和每一个受技术影响的人，都需要参与这场关于”我们想要一个什么样的技术未来”的对话。技术可以治愈、联结、教育和保护我们共同的家园，但它也可以分裂、排斥和制造新的不公——取决于谁在掌舵，以及掌舵的人向谁负责。

📎 原文来源：Vatican.va – Magnifica Humanitas (Full Text)
2026年5月29日
Google I/O 2026：Gemini 3.5发布，AI智能体全面入侵谷歌全产品线
北京时间5月20日凌晨，谷歌I/O 2026开发者大会开幕。今年发布会的重点不是某一个单一模型或功能，而是一次系统性转向——谷歌正在把AI智能体全面”塞进”所有核心入口。

从搜索框到Chrome浏览器，从Android手机到智能眼镜，Gemini不再只是一个对话助手，而是一个可以持续运行、跨应用执行任务的AI代理：它能替用户追踪信息、生成内容、调用工具，甚至直接完成下单和操作流程。

谷歌I/O 2026大会现场（图源：新浪科技）

Gemini 3.5 Flash：价格砍半，速度4倍

谷歌CEO桑达尔·皮查伊在主题演讲中发布了新一代大模型系列Gemini 3.5。首发推出的Gemini 3.5 Flash定位为”迄今最强大的智能体与编程模型”，输出Token速率达到其他前沿模型的4倍，而处理智能体任务的费用不到其他前沿模型的一半。

在GDPval-AA基准（衡量现实世界具有实际经济价值的编程任务）中，Gemini 3.5 Flash取得1656 Elo评分，超过了Gemini 3.1 Pro，也超过了目前公开可查的大部分前沿模型。在Terminal-Bench 2.1（衡量AI在真实终端环境中完成复杂任务的能力）中，得分76.2%——这意味着智能体在执行真实任务时的可靠性，正在从”勉强可用”向”可以依赖”跨越。

皮查伊在演讲中直言：”Flash的惊人之处在于，它以不到同类前沿模型一半的价格，提供了前沿级别的能力。”当一家巨头愿意用”砍半定价”来推广自己的最前沿模型时，它传达的信号不是”我在让利”，而是”我要把竞争对手挤出市场”。

视频模型Omni与智能体编程平台Antigravity 2.0

DeepMind首席执行官德米斯·哈萨比斯登台发布了基于谷歌世界模型技术积累的新型视频生成模型Gemini Omni。该模型可以基于多种输入生成视频，并支持对话式编辑，用户可以通过自然语言修改角色、背景和场景。首款模型Gemini Omni Flash将于今年夏季推出。

与此同时，谷歌发布了智能体编程平台Antigravity 2.0，直接对标Anthropic的Claude Code和OpenAI的Codex。该平台被谷歌定位为面向AI Agent时代的编程工具，官方称其”毫不掩饰地以智能体为先”。使用Antigravity 2.0及其代理系统从零开始构建一个操作系统，整个过程所消耗的Token成本不到1000美元。

个人AI助手Gemini Spark与全线产品整合

谷歌同时发布了全天候运行的个人AI助手Gemini Spark，基于Gemini 3.5，运行在Google Cloud虚拟机上。用户可以通过Gemini应用访问Spark，即便合上笔记本电脑，Spark也可以继续工作。本周将面向受信任测试人员推出，下周面向美国Google AI Ultra订阅用户开放。

更重要的是，谷歌宣布了全线产品的AI智能体整合计划：
- 搜索：将推出搜索信息智能体，后台24/7运行，主动发现信息并代为执行操作；Daily Brief Agent将整合用户的邮件、日历与任务，生成个性化晨间摘要。
- Android：2026年晚些时候推出Android Halo，为用户提供实时智能体任务追踪界面。
- 硬件：由Gentle Monster、Warby Parker与三星合作推出的Android XR智能眼镜将于2026年秋季上市，支持语音交互和信息投射。
- 购物：发布由AI智能体驱动的通用购物车Universal Cart，可在Google服务中使用，追踪优惠、监控价格变动、识别兼容性问题。
规模即壁垒：1800亿美元资本支出背后的逻辑

皮查伊在演讲中披露了一组震撼数据：谷歌每月处理的Token数量已达到3.2千万亿，同比增长7倍；Gemini App月活跃用户从4亿增长至9亿；搜索AI模式月活跃用户突破10亿。

支撑这一切的，是谷歌2026年预计1800亿至1900亿美元的资本支出。这1800多亿美元的资本支出，本质上是在做一件事：用基础设施的规模化优势，把竞争对手挤出市场。当你的TPU集群规模、Token处理量和用户基数都达到竞争对手无法匹敌的量级时，”速度4倍、价格砍半”就不再是一个促销手段，而是一个结构性壁垒。

回到根本问题：Gemini 3.5的发布，究竟是一次真正的技术飞跃，还是一次精心包装的战略营销？答案可能是：两者都是。从技术角度看，Gemini 3.5 Flash在基准测试中的表现、推理速度的提升、以及多智能体并行架构的落地，都是真实的进步。但与此同时，这次发布真正值得关注的，不是模型本身，而是谷歌围绕模型构建的全栈壁垒：TPU 8提供算力、Gemini 3.5提供智能、Antigravity 2.0提供平台、Spark和搜索提供触达——这条链条上的每一个环节，谷歌都握有主动权。

📎 原文来源：Gemini 3.5发布：谷歌用”价格砍半、速度4倍”逼竞争对手出局 — 凤凰科技
2026年5月29日

博客

从3800亿到9650亿，只用了3个月

三强争霸，都在准备上市

谈判破裂后直接告上法庭

Perplexity的回应只有一句话

这场官司会影响到普通用户吗

英伟达那笔200亿美元的交易到底买了什么

推理为什么比训练更值钱

魔法帽里有什么？

越脏越好？

不只是清洁

目前只在纽约，很快扩展到更多城市

把计算搬进内存

为什么是内存，不是算力？

创始团队来自三星和SK海力士

竞争对手和差异化

时间表和挑战

代码缺陷少4倍，这才是最值钱的地方

动态工作流：1000个子智能体一起干活

快速模式：快2.5倍，便宜3倍

已经在哪能用

下一步：Mythos级模型已经在路上

1300亿美元的非营利巨头

钱到底花在哪

Sam Altman的态度转变

现实已经发生了

316道题，覆盖了黑客的”全科”

AI黑客能力每5到6个月翻一倍

头部厂商已经在”控”了

最麻烦的问题：闭源能力迟早会开源

连”最易量化”的领域都跟不上了

一份”10条核心立场”的AI伦理纲领

“巴别塔”还是”耶路撒冷”？

科技权力的”私有化”隐忧

数据、算法、平台——新的”公共品”

各方反应：一份迟到的AI伦理坐标

Gemini 3.5 Flash：价格砍半，速度4倍

视频模型Omni与智能体编程平台Antigravity 2.0

个人AI助手Gemini Spark与全线产品整合

规模即壁垒：1800亿美元资本支出背后的逻辑