博客

Anthropic要盈利了，AI烧钱的时代真的结束了？

这话还得从Anthropic最新泄露的财务数据说起。2026年第二季度，这家公司的营收预计冲到109亿美元——什么概念？比去年同期的几亿美元翻了不知道多少倍，而且这季度还要首次实现运营盈利，大概5.59亿美元。

Anthropic CEO Dario Amodei（图源：CNBC）

钱从哪来？

核心答案就两个字：Claude。准确说，是Claude Code——他们的编程助手产品。这款东西的年化营收已经跑到25亿美元了，而且第一季度营收同比增幅是80倍，你没看错，80倍。

企业和开发者对Claude的需求暴涨，直接导致Anthropic的基础设施绷不住了。公司自己在4月承认，算力”不可避免的紧张”，然后赶紧签了一堆算力采购协议。其中最夸张的是跟SpaceX签的那个——租下SpaceX在孟菲斯的Colossus 1数据中心全部算力，每个月付12.5亿美元，合同签到2029年5月，总金额450亿美元。

450亿美元，这是目前AI行业公开的最大算力采购合同，没有之一。

估值竞赛：Anthropic vs OpenAI

Anthropic现在正在谈新一轮融资，投后估值预计9000亿美元。而它的老对手OpenAI最新私募估值大概是8500亿美元。这两家原本是一家人——Anthropic是2021年从OpenAI出走的高管和研究人员创立的，原因是对OpenAI的发展方向不满。

现在两家还在赛跑另一个东西：IPO。Anthropic之前说考虑2026年上市，OpenAI更激进，据说这周就要秘密提交IPO招股书，目标9月公开上市，估值可能超过1万亿美元。

一个有趣的转折

Anthropic之前因为拒绝向美国军方开放所有合法用途的模型访问权限，被美国国防部拉黑了。结果4月他们推出了一个具备高级网络安全能力的Claude Mythos Preview模型，然后国防部那边又说”有可能”合作了。特朗普4月还公开表示支持，这事儿就这么戏剧性地反转了。

回头看，Anthropic这个故事最有意思的地方在于：它证明了一件事，做AI基础模型不一定非要一直烧钱，只要产品找对了方向，企业级市场是愿意买单的。Claude Code这25亿美元的年化营收就是最好的证据。

当然，代价是每个月要付SpaceX 12.5亿美元的算力账单。这生意到底划不划算，可能得等IPO之后看财报才知道。

📎 原文来源：CNBC – Anthropic set to hit $10.9 billion in revenue during second quarter

2026年5月25日
三部门发文规范AI智能体：70%普及率目标背后的信号
AI智能体有了”游戏规则”

既要求智能体的安全规范，又推动智能体创新发展。近日，国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》，这份文件给正在狂飙的AI Agent行业，立了一套清晰的游戏规则。

智能体是啥？文件给了一个清晰的定义：具备自主感知、记忆、决策、交互与执行能力的智能系统。随着大模型等新一代人工智能技术迅猛发展，智能体正加速与网络空间、物理世界深度融合，深刻改变人类生产生活方式和社会治理模式。

这份《意见》其实在回答一个核心问题：当AI开始替人做决策、执行任务，边界到底在哪里？

四大举措，既划红线又给空间

《意见》明确智能体发展要坚持安全可控、规范有序、创新驱动、应用牵引四大基本原则，并提出了4个方面的重要举措：

一是夯实发展基础。完善技术底座，构建标准协议。这意味着国家层面会推动智能体相关的技术标准、通信协议、评价体系等基础设施的建设。

二是守牢安全底线。明确产品准则，防范安全风险，完善治理体系，强化行业自律。智能体如果乱用、滥用，风险不小——比如自主决策导致经济损失、隐私泄露、甚至物理世界的伤害（如果是机器人智能体）。

三是强化应用牵引。围绕科学研究、产业发展、提振消费、民生福祉、社会治理等方向，提出19个典型应用场景。国家不仅在管，更在推——给智能体找真实场景、落地产值。

四是建设创新生态。促进产业合作，强化应用推广。智能体不是一家公司在做的，需要整个产业链协同。

权限边界：谁来决策？

对于智能体接管工作后的权限和边界，《意见》提出了一个很关键的要求：在遵守法律法规、尊重社会公德和伦理规范前提下，厘清三类决策方式的合理边界及所需权限：
- 仅限用户本人决策——涉及重大利益、人身安全的，必须人来做最终决定
- 需由用户授权决策——AI可以建议、可以执行，但关键节点要让人确认
- 智能体自主决策——低风险、高频、规则清晰的，可以让AI自己跑
这个划分其实非常务实。智能体不是要完全取代人，而是要在合适的边界内，最大化释放自动化价值。

70%普及率目标，智能体要进千家万户

《意见》支持落实新一代智能终端、智能体等应用普及率超70%的阶段性目标。这个数字很有意思——70%的普及率，意味着智能体要从”科技圈炒作概念”，变成”普通人也天天在用”的真实基础设施。

对比一下：智能手机在中国的普及率大概是80%左右。也就是说，国家把智能体的战略地位，放到了和智能手机类似的量级。

要达到70%普及率，光靠ToB的企业市场肯定不够，必须进入ToC消费场景——比如手机里的AI助手、家里的智能管家、车里的智能座舱、甚至是穿戴设备上的AI Agent。

三部门联合发文，释放的信号非常明确：智能体不是”野生的”、不是”法外之地”，但国家也不想一管就死。规范和创新，要并举。

对行业意味着什么？

这份文件对AI智能体行业的影响，可能比很多人想象的更深远：

对大模型公司来说，光有模型能力不够了，得想清楚智能体的安全边界怎么设计、用户授权机制怎么做、决策日志怎么留痕。

对应用开发来说，19个典型应用场景相当于国家帮你想好了”往哪发力”——科研、产业、消费、民生、治理，都是真金白银的投入方向。

对投资人来说，70%普及率目标是一个清晰的市场信号——智能体不是短期风口，而是中长期的国家战略方向。

过去两年，AI行业讨论最多的是”谁的模型更聪明”。但智能体这个赛道，比的不是Benchmark分数，而是谁更懂场景、谁更安全可信、谁能让用户放心把任务交出去。

这份《意见》，算是给这个竞争维度，正式按下了加速键。

📎 原文来源：三部门发文规范AI智能体发展规范与创新并举
2026年5月25日
Google I/O 2026：Agent时代正式开启，OpenAI最大对手回来了

Google I/O 2026：从聊天机器人到数字分身

过去几年Google I/O的主角，通常是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会，Google其实只反复讲了一件事：Agent。

不是聊天机器人，不是”帮你回答问题”的AI，而是真正开始替用户持续执行任务的AI Agent。Google想做的，是把Gemini从一个App，彻底变成Google所有入口背后的操作系统。

Google I/O 2026全面押注AI Agent（图源：谷歌）

Gemini Spark：你的24小时数字分身

这次发布会上，Google几乎把整个产品体系全部Agent化了。最核心的新产品，是Gemini Spark。你可以把它理解成Google版”全天候数字分身”。它运行在Google Cloud虚拟机上，7×24小时在线。即便你关掉电脑、合上手机，它依然会在后台继续工作。

Google现场演示了一个典型场景：用户正在组织社区派对，Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets，再自动做一份Google Slides宣传页，整个过程几乎不需要用户手动操作。

Gemini Spark本质上正在把Agent从”问答工具”，变成”长期运行的执行系统”。过去的大模型，更像即时响应；现在的Agent，则开始拥有持续状态、任务记忆和跨应用执行能力。

Gemini 3.5 Flash：把Agent成本打下来

Agent最大的难点，从来都不只是能力，而是成本。因为Agent实在太烧Token了。Google披露的数据非常夸张：目前Google自家产品每月处理的Token，已经达到3200万亿个，同比增长7倍。

于是，Gemini 3.5 Flash出现了。这可能是今年Google最关键的模型。因为它不再单纯强调”最强”，而是开始强调”最适合跑Agent”。Pichai现场直接算了一笔账：如果一家头部企业每天处理1万亿Token，把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash，一年能省超过10亿美元。

性能接近顶级前沿模型，输出速度快4倍，而成本只有同类模型的一半甚至更低。Google现在反复强调一句话：”你不需要再在质量和速度之间二选一。”因为Agent时代，比拼的已经不是一次回答，而是持续运行能力。

Antigravity 2.0：93个Agent协作搭建操作系统

如果说Flash负责”让Agent更便宜”，那Antigravity 2.0负责的，就是”让Agent真正开始干活”。它原本只是个AI Coding工具，现在Google直接把它升级成了多Agent协作平台。

开发者可以同时调度多个Agent：一个写代码，一个生成设计素材，一个规划产品架构，一个测试漏洞，一个修Bug。Google现场甚至演示了一个极其夸张的案例：93个Agent并行协作，从零开始搭建一个可运行的操作系统。

整个过程持续12小时，处理26亿Token，最终居然真的跑起来了，甚至还能运行Doom。而整个API成本不到1000美元。Google显然是在正面硬刚Claude Code和Codex。

搜索彻底变了：从链接到执行结果

Google这次还对搜索动了最大的一刀。Pichai说，这是Google搜索框25年来最大升级。因为搜索不再只是”搜答案”，而是开始”生成执行结果”。

比如用户问：”黑洞如何影响时空？”以前搜索会给你十条蓝链，现在Google直接生成一个交互式可视化界面，你甚至可以拖动参数、实时观察变化。搜索开始变成实时生成式UI。

Google还把Agent正式塞进搜索。用户未来可以创建Information Agent，让它24小时后台监控信息，比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。Agent会自己搜、自己总结、自己更新。

Google最恐怖的其实是生态

但整场发布会真正最危险的地方，其实不是模型，而是Google的生态。因为OpenAI现在最强的，是模型能力；但Google最强的，是入口。

搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来，本身就是全球最大的互联网流量系统之一。而现在，Google正在把Gemini嵌入所有入口。

这意味着，别人还在想办法”获取用户”，Google已经开始直接给几十亿用户发Agent。这是完全不同的战争维度。

甚至连智能眼镜，Google也重新杀回来了。今年发布的Android XR眼镜，可以直接通过Gemini完成导航、下单、消息总结，用户甚至不用掏手机。

Google正在试图让Gemini变成未来所有设备背后的默认智能层。搜索是入口，Chrome是入口，手机是入口，眼镜也是入口。Gemini则开始变成背后的统一大脑。

AI行业开始进入”运营时代”

今年Google I/O还有个特别明显的信号：AI行业正在从”模型竞赛”，进入”运营竞赛”。过去两年，行业核心是”谁更聪明”；现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。

Google今年资本支出预计高达1800亿~1900亿美元，第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调：”我们要把最强AI，变成最便宜的AI。”这已经不是单纯的技术竞争，而是一次基础设施战争。

过去几年，大家一直在讨论：AI到底什么时候能真正”替人做事”。Google这次给出的答案是：现在。而且它不准备只做一个聊天机器人。它想做的是，一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。

Google迟到了。但现在，它终于开始全面开卷Agent。

📎 原文来源：谷歌I/O炸场：Agent时代正式开打，OpenAI最大对手回来了

2026年5月25日
Google DeepMind搞了个AI科研搭档，科学家要失业了？

Google DeepMind搞了个”AI科研搭档”

科学家做研究，最花时间的是啥？不是做实验，是”想假设”和”查文献”。一个靠谱的假设，往往要读几百篇论文、反复试错几个月甚至几年。Google DeepMind最近发布了一个叫Co-Scientist的多智能体系统，目标是让AI来干这件事。

这个系统基于Gemini构建，但跟普通的聊天机器人不一样。它不是你问它答，而是真的在”做科研”——生成假设、跟自己”讨论”、再去文献里找证据验证，然后反复迭代，直到假设站得住脚。

普通LLM的问题在于：它不确定时会瞎编，而且不会主动承认”这个结论有矛盾”。Co-Scientist的核心是，它能在多个专业智能体之间制造”争论”，让它们在讨论中发现逻辑漏洞，然后自己去文献里找证据修补。

三个步骤，模拟科学家的思考过程

Co-Scientist的运作分三个阶段：生成、讨论、验证。

生成阶段，系统会根据你给的研究方向，产生一批可能的假设。这些假设不是随机生成的，而是基于已有的科学文献和数据库。

讨论阶段最有意思。系统里有好几个”智能体”，每个扮演不同的角色——有的负责挑刺，有的负责找支持证据，有的负责检查逻辑一致性。它们会互相”吵架”，直到对某个假设达成一致意见。

验证阶段，系统会去查文献，看看这个假设跟已知的研究是否矛盾，有没有实验数据支持。如果有矛盾，它会回过头去修正假设，然后重新走一遍流程。

已经在用的场景

Google已经在跟Google Cloud和Google Labs合作，让研究人员试用这个系统。目前的反馈是，它在”假设筛选”这个环节特别有用——人类科学家往往靠直觉和经验来判断一个假设值不值得深究，但直觉会出错，经验有盲区。Co-Scientist能把这些假设结构化地过一遍，帮人更快地找到值得深挖的方向。

特别值得关注的是，Google正在把它应用到ALS（肌萎缩侧索硬化症）的疗法开发，还有衰老研究。这两个领域都有一个共同点：数据极其复杂，变量极多，人类研究者很难把所有线索串起来。AI的优势正好在这里——它能同时处理海量文献，发现人眼看不到的模式。

下一步是跟实验自动化打通

现在的Co-Scientist还停留在”纸上谈兵”阶段——它能生成和验证假设，但验证完了，还得人类去做实验。Google的下一步计划，是把这个系统跟实验自动化系统整合起来，让AI生成的假设能直接在实验室里被验证。

如果这一步实现了，科研的效率提升会是数量级的。现在从一个假设到发表论文，往往要几年。如果假设生成、验证、实验、数据分析全都能由AI加速，可能几个月就能走完。

当然，这里有个绕不开的问题：AI生成的假设，如果连人类都理解不了为啥它对，那还敢不敢照着做实验？这个问题，可能比技术本身更难回答。

📎 原文来源：Co-Scientist: A multi-agent AI partner to accelerate research

2026年5月25日
Anthropic拿到300亿美元，估值冲破9000亿

Anthropic拿到300亿美元，估值冲破9000亿

今天AI圈被一条消息刷屏了——Anthropic正在完成一轮300亿美元的融资，估值超过9000亿美元。要知道，就在今年2月，Anthropic的估值还是3800亿美元。不到三个月，直接翻倍。

这轮融资由红杉、Dragoneer、Greenoaks和Altimeter联合领投，预计本周内就能完成交割。如果按上限估值落地，Anthropic将首次超过OpenAI在2026年3月创下的8520亿美元估值，成为AI赛道新的估值王者。

Anthropic的估值暴涨不是靠”讲故事”。他们刚刚披露，2026年第二季度营收预计达到109亿美元，相比第一季度的48亿美元增长了130%，而且首次实现季度运营盈利。投资者看中的不是概念，是真金白银的营收增长。

钱从哪里来，花到哪里去

你可能好奇，Anthropic哪来这么多钱烧？答案在SpaceX的IPO招股书里。Anthropic跟SpaceX签了一份算力合同，每月支付12.5亿美元，一直持续到2029年5月，总价值450亿美元。

光是给SpaceX的算力费，一年就是150亿美元。加上训练模型、养团队、建数据中心，300亿美元其实撑不了太久。但投资者愿意买单，是因为他们相信Anthropic能在18个月内把年营收做到500亿美元以上。

有意思的是，Anthropic还在跟微软谈，打算用微软定制的Maia 200 AI芯片来跑Claude。加上已经合作的英伟达、AWS Trainium、谷歌TPU、SpaceX算力，Anthropic成了行业里第一个实现多芯片供应商布局的前沿AI实验室。

教皇也来站台

今天还有一个挺有意思的新闻。教皇良十四世发布了一份关于AI的通谕《Magnifica Humanitas（卓越人性）》，发布仪式上站在他旁边的，是Anthropic的联合创始人Christopher Olah。

这份通谕的核心是说”人工智能时代要保护人的尊严”。选在《新事（Rerum Novarum）》发布135周年的日子签署，故意把AI类比为”第二次工业革命”。梵蒂冈没有选谷歌或者OpenAI，而是跟Anthropic同台，这个信号挺明确的——在AI安全这件事上，梵蒂冈把Anthropic视为最可信的合作伙伴。

OpenAI那边也没闲着

这边Anthropic融资如火如荼，OpenAI也没闲着。他们已经准备向美国SEC提交保密的S-1文件，预计2026年第四季度或者2027年初正式上市。

两大AI实验室，一个刚拿完钱、估值冲上云端，一个准备上市、接受公开市场检验。2026年的AI赛道，已经从”谁能做出更好的模型”变成了”谁能先把AI变成一门赚钱的生意”。

从目前的财务数据看，Anthropic暂时领先半个身位。但OpenAI有微软背书、有GPT的生态粘性，上市之后的融资能力不容小觑。这场仗，才刚刚开始。

📎 原文来源：AI News Today (May 25, 2026): Top AI Stories & Headlines

2026年5月25日
agent-skills：45.4k Stars！Google工程师开源的AI编码生产级技能库，让AI输出工业级代码
你有没有遇到过这种情况：让AI帮你写代码，它确实写出来了，但一测就挂，还没测试、没文档、没安全检查——因为它总是走「最短路径」，能跑就行。

Google Cloud AI总监、AngularJS联创Addy Osmani也发现了这个问题，于是他在2026年2月开源了 agent-skills——一个把高级工程师开发软件时的完整工作流、质量门禁和最佳实践封装成可复用技能的工具包，让AI代理在开发全流程中都能遵循与生产环境一致的标准。

📊 项目数据

GitHub Stars：45.4k+ | 开源协议：MIT | 维护者：Addy Osmani（Google） | 适用工具：Claude Code、Cursor、Gemini CLI、Windsurf、Copilot 等

📌 项目简介

agent-skills 是一个面向AI编程代理的生产级工程技能集合，将资深工程师在开发软件时遵循的工作流、质量门禁和最佳实践编码为可复用的技能模块，让AI代理不再「能跑就行」，而是输出符合生产级质量标准的代码。项目覆盖从需求定义、计划拆解、迭代开发、测试验证、代码审查到上线部署的完整开发生命周期，并预置了可自动触发的专项技能。

⚙️ 安装要求与过程
环境要求
- 支持任意AI编程代理（Claude Code、Cursor、Gemini CLI、Windsurf、Kiro、Copilot等）
- 部分技能需要配合对应MCP服务使用（如Chrome DevTools MCP）
- 无额外依赖，技能文件为纯Markdown格式
快速安装（以Claude Code为例）

方式一：从市场安装（推荐）

# 添加市场源
/plugin marketplace add addyosmani/agent-skills
# 安装技能包
/plugin install agent-skills@addy-agent-skills

方式二：本地克隆安装

git clone https://github.com/addyosmani/agent-skills.git
claude –plugin-dir /path/to/agent-skills

其他工具（Cursor、Gemini CLI、Windsurf等）详见项目 docs/ 目录下的对应配置指南。

✨ 核心功能

1

23个细分技能模块，覆盖开发全生命周期

从需求定义（/spec）、计划拆解（/plan）、增量开发（/build）、测试驱动（/test）、代码审查（/review）到上线部署（/ship），每个阶段都有对应的技能工作流，AI必须按步骤执行，不能跳过。

2

反合理化机制，防止AI走捷径

每个技能都内置「常见借口反驳表」——比如AI想说「我之后再补测试」，技能会直接反驳并强制要求先写测试。验证要求明确到必须提供证据（测试通过截图、构建输出等），不允许「看起来没问题」这种模糊判断。

3

自动触发 + 斜杠命令双模式

设计API时自动激活 api-and-interface-design 技能，构建UI时自动激活 frontend-ui-engineering 技能；同时也支持手动输入 /spec、/plan、/build、/test 等7个斜杠命令精准触发对应技能。

4

预配置专家代理角色，多维度审查

内置 code-reviewer（高级工程师视角）、test-engineer（QA专家视角）、security-auditor（安全工程师视角）三个专家代理角色，可在关键节点自动调用，对代码进行多维度审查。

🚀 典型使用场景

场景一：让AI严格按照TDD流程开发新功能

输入 /test 激活测试驱动开发技能，AI会严格遵循「红→绿→重构」流程，先写失败测试，再写最小实现，最后重构；测试金字塔比例强制为 80% 单元测试 / 15% 集成测试 / 5% E2E测试，确保测试覆盖全面而不冗余。

场景二：上线前全自动代码审查与安全加固

输入 /review 触发代码审查技能，AI会按五轴审查法（正确性、可读性、安全性、性能、可维护性）逐文件审查，变更控制在约100行以内；同时自动激活 security-and-hardening 技能，对照 OWASP Top 10 逐项检查，不通过不许合并。

💡 推荐理由

我一直觉得现在的AI编程工具最大的问题不是「写不出代码」，而是「写出来的代码不经过生产级流程」——没有需求文档、没有测试、没有安全审查，直接给你一个能跑的版本就完事。agent-skills 的本质，就是把 Google 级别的工程成熟度「编译」成了AI可以理解和执行的技能工作流。

最让我印象深刻的是它的「反合理化机制」——AI 想偷懒的时候，技能会直接「怼回去」，要求提供证据而不是口头保证。这比任何 Prompt 技巧都更有效，因为它是在流程层面强制质量，而不是靠 AI 的「自觉」。

如果你在用 Claude Code、Cursor 或其他AI编程工具，这个项目值得认真配置一套——它会让你AI助手输出的代码质量提升一个维度。

📥 下载地址

🌐 官方网站：https://github.com/addyosmani/agent-skills

📦 GitHub仓库：https://github.com/addyosmani/agent-skills

📚 配置文档：https://github.com/addyosmani/agent-skills/tree/main/docs

💬 技能市场：https://agentskill.work/zh/skills/addyosmani/agent-skills

📄 开源协议：MIT License（可自由使用、修改和分发）

💡 小编注：

这个项目背后的理念其实很深刻——AI编程工具的能力上限不仅仅取决于模型本身，更取决于我们给它的「工程上下文」。agent-skills 做的，就是把这些上下文系统化、可复用化。值得一提的是，Addy Osmani 同时也是热门项目 addyosmani/superpowers（第30期已介绍）的作者，两个项目一脉相承，建议搭配使用，效果更佳。
2026年5月25日
Anthropic悄悄收购Stainless：AI工具链的暗战
“加入Anthropic是自然决定，因为团队能在更早认可这项技术价值的公司体系内继续推进工作。”——Alex Rattray（Stainless创始人）

一笔不太起眼的收购，暗藏大算盘

5月19日，Anthropic宣布收购软件基础设施初创公司Stainless。交易金额没有正式公布，但业内消息称超过2.8亿欧元（约合22.18亿元人民币）。

Stainless这家公司，名字听着像做不锈钢的，其实是搞开发者接口（Developer Interfaces）的。它最核心的能力，是能把API规格说明自动转换成可部署的工具，支持Python、TypeScript、Kotlin、Go、Java等多种编程语言。说白了，就是帮开发者省掉大量手动维护SDK（软件开发工具包）的时间。

Anthropic宣布收购Stainless

为什么这笔收购让谷歌和OpenAI很不舒服？

Stainless之前可不是Anthropic独占的。它的托管服务，OpenAI、谷歌这些重量级AI实验室都在用。现在收购一完成，这块能力就进了Anthropic的”自留地”，外面的竞争对手用不了了。

更直接的是，Stainless已经确认关闭全部托管产品，包括那个知名的SDK自动生成工具。现有客户虽然还能继续用已经生成的代码库，但后续拿不到官方更新和技术支持了。

对AI智能体（Agent）开发来说，SDK和接口适配是很关键的一环。Anthropic这一步，相当于把”连接层”能力提前锁定了。模型再强，如果开发工具链被对手卡住，生态扩展也会受限。反过来，Anthropic现在既能给自己的产品做更快的接口迭代，也能在外部软件协同上掌握更多主动权。

AI工具链的竞争才刚刚开始

这笔收购透露出一个信号：AI公司的竞争，已经从单纯的”模型能力”延伸到”开发工具生态”。谁能帮开发者更高效地构建AI应用，谁就能占据更有利的位置。

Stainless的技术还有一个很实用的特点——当API发生变化时，它能自动更新代码。对需要频繁迭代的AI产品来说，这种自动化能力可以大幅降低维护成本，加快集成速度。

Anthropic最近动作不少。前有卡帕西加盟，后有Stainless收购，看得出来是在为下一阶段的竞争做全方位布局。而对OpenAI和谷歌来说，失去这样一个关键工具合作伙伴，短期内可能得自己补上这块短板了。
- Stainless核心能力：自动化创建和维护SDK，支持多编程语言
- 战略意义：锁定AI智能体开发的关键连接层能力
- 直接影响：OpenAI、谷歌等无法继续共享Stainless托管服务
- 行业趋势：AI竞争从模型能力延伸到开发工具生态
📎 原文来源：Anthropic 收购 Stainless，谷歌和 OpenAI 失去关键 AI SDK 工具
2026年5月25日
卡帕西跳槽了：从OpenAI创始人到Anthropic新兵

“当前大语言模型的发展正处于决定性阶段，我期待通过重返一线研发工作，参与到模型的前沿探索中。”——安德烈·卡帕西

从OpenAI创始人到Anthropic新兵

5月20日，人工智能领域传来重磅消息：安德烈·卡帕西（Andrej Karpathy）正式宣布加入Anthropic。这位OpenAI的创始成员、前特斯拉AI总监，将在Anthropic的预训练团队担任要职，负责Claude大模型的”基本功”训练。

预训练团队听起来很技术，但其实决定了AI模型的”底子”——它学了多少知识、理解能力有多强，都在这个阶段定型。卡帕西要做的，是组建一支新团队，尝试用Claude自己的能力来加速预训练研究。这可是当前AI圈最前沿的方向，各家都在抢着推进AI开发自动化。

卡帕西在社交媒体宣布加盟Anthropic

为什么他的加入这么受关注？

卡帕西不是普通的研究员。他在学术界、工业界，甚至教育领域都有不小的影响力。早年是OpenAI的核心创始成员，后来去了特斯拉，带队搞出了Autopilot的计算机视觉核心技术。马斯克当年为了挖他，可是费了不少功夫——法庭公开的邮件里，马斯克直言卡帕西是全球计算机视觉领域”排名第二的人物”，仅次于伊利亚·苏茨克维。

2022年离开特斯拉后，卡帕西没急着回大模型前线，反而在YouTube和社交平台上做起了技术普及者，积累了大量粉丝。他提出的”vibe coding”概念，最近在开发者圈子里很火。他还公开分享过自己对前沿模型做极限压力测试的心得。

这次加盟Anthropic，算是他重返大模型研发一线。他自己说，虽然回到了研发岗位，但教育事业还是会继续，计划未来再回去搞教学。

一场关于人才的暗战

卡帕西的跳槽，背后其实是一场AI巨头之间的人才博弈。就在本周一，旷日持久的”马斯克诉奥特曼案”刚刚结案，萨姆·奥特曼胜诉。这个案子里，卡帕西的动向曾多次被当作关键证据提及。

2017年，马斯克同时担任OpenAI和特斯拉的董事，利用这个身份把卡帕西从OpenAI挖到了特斯拉，让他带队做Autopilot计算机视觉。2022年离开特斯拉后，卡帕西短暂回归过OpenAI，随后创办了AI教育公司Eureka Labs，一直到这次加入Anthropic。

对Anthropic来说，拿下卡帕西绝对是一步好棋。最近Anthropic势头很猛，融资、产品、口碑都在上涨，这次又捞到这么重量级的研究员，无疑进一步巩固了它在AI人才战中的领先地位。

而对OpenAI来说，失去这样一位创始级别的人物，多少有点尴尬。不过AI圈的人才流动向来频繁，接下来会不会有反向操作，值得继续看下去。

📎 原文来源：OpenAI 联合创始人卡帕西官宣加盟 Anthropic，重返大模型研发前线

2026年5月25日
法拉利用IBM的AI打造F1超级粉丝，赛车运动进入数字时代

两年前，IBM意识到它的体育合作伙伴阵容中有一个明显的缺憾：一级方程式赛车（F1）。F1已经成为全球最受欢迎的运动之一，尤其是在美国——Netflix的《极速求生》记录了F1车手的工作生活，把他们变成了主流名人。这项以技术为中心的运动也成了AWS、Oracle和Anthropic等科技公司的热门选择，它们与车队合作以获得赞助曝光，并提供数据分析和AI工具来带来竞争优势。

法拉利F1赛车在赛道上飞驰 | 图片来源：TechCrunch

IBM为什么选了法拉利

所以，当IBM寻找下一个重大体育合作伙伴时，它选了F1以及其中最标志性的车队之一——法拉利HP车队，这并不让人意外。

“他们是历史上获胜最多的车队。”IBM体育与娱乐合作副总裁Kameryn Stanhouse告诉TechCrunch。

不过，这次合作的核心在于其他车队也开始与科技巨头合作的原因：获得更复杂的技术解决方案，帮助他们最大化利用人工智能。Stanhouse说，体育最大的优点之一，就是有那么多数据可用，可以用来帮助人们适应AI。

“他们实际上看到了AI如何为他们服务，”她谈到AI在体育叙事中的使用时说。

讲故事才是核心

IBM与法拉利的合作围绕讲故事这个理念展开，通过 overhauling 驱动法拉利车迷App的技术来增强粉丝参与度。为了帮助实现这一目标，法拉利聘请了Stefano Pallard担任新设立的”车迷发展负责人”角色。他说，车队想要解决的挑战不仅仅是触达车迷，而是”让每个人感觉我们都了解他们”。

“这从获取赛道数据开始，把它变成容易跟随且吸引人的内容，”他告诉TechCrunch。

每场比赛期间，车队每秒处理数百万个数据点，捕捉车手和赛车的每一个动作。把这些变成车迷可以参与的内容，只是先进的企业AI如何帮助企业更好地与消费者互动的一种方式。

独立App策略，不走社交平台

在11支车队中，法拉利是少数几支（ alongside McLaren和Williams）拥有独立车迷App策略的车队之一，而不是依赖社交媒体或官方F1平台。这显示出这项运动正开始慢慢利用其不断增长的全球车迷群体。

法拉利App的一些改动很简单，比如提供意大利语版本。尽管法拉利是意大利公司，许多车迷也是意大利人，但直到IBM合作之前，他们的车迷App都没有意大利语版本。

Stanhouse说， old 的法拉利车迷App是个人们去查比赛详情然后就离开的地方。这个新App有游戏，车迷可以在App里和别人玩；有新的AI撰写的比赛总结；更多关于车队和车手的幕后故事；一个做预测的地方；还有一个AI伙伴让车迷提问。

“有两个车手，但你知道换一个轮胎需要24个人同时工作两秒钟吗？”Stanhouse说，并补充说讲故事帮助车迷感觉与车队更亲近。

全年参与，不只是比赛日

与IBM打造的其他体育App不同，Stanhouse说法拉利App的主要焦点是讲故事，因为它希望车迷全年都保持参与，而不是一年只有几周，像大师赛那样的锦标赛。Stanhouse说，自IBM介入以来，App的参与度数据一直呈上升趋势，她举了一个例子：比赛周末的参与度增加了62%。

Pallard说，车队随后使用AI分析App中的参与信号，比如人们喜欢读什么内容，以及车迷发送消息的情绪。

“这帮助我们理解什么最能引起Tifosi（法拉利车迷的昵称）的共鸣，它直接告知我们如何塑造我们的叙事，以及如何传递内容，”他说。

车队希望更深入地研究个性化，创造更多沉浸式车迷体验。

新车迷更年轻、更多元

App开发者还考虑到了法拉利的车迷群体——它比五年前更加多元化。F1去年发布的数据显示，75%的新车迷是女性，其中许多是Z世代。对女性来说，一个特别的吸引点是F1学院——一个全女性赛车系列赛，旨在培养下一代女性车手。但这些新车迷，就像老车迷一样，都在追求一件事——更多。

“他们要求更多数据、更多洞察、更多功能，我们必须能够交付这些，”Pallard说。”与IBM一起，未来五年的愿景是让每个车迷都感觉这个体验是为他们打造的，无论他们已经和我们在一起30年还是30天。这就是你如何建立持久的忠诚度。”

通过IBM的AI技术，法拉利正在重新定义什么是真正的车迷体验。这不只是看比赛，而是让每个车迷都感觉自己是车队的一部分。

📎 原文来源：Ferrari is using IBM’s AI to create F1 superfans — TechCrunch

2026年5月25日
我试了亚马逊的Bee可穿戴设备，既好奇又有点发毛

最近我有机会测试了一款来自Bee的AI可穿戴设备。这家公司去年被亚马逊收购，之后更新了一些新功能。跟其他AI可穿戴设备一样，Bee被设计成一种个人助手：它能记录、转录并总结你一整天的对话，提供一种持续的笔记功能——如果你健忘，或者只是想让生活更有条理，这玩意儿还挺有用。如果你把它和日历同步，它还能给你发提醒，告诉你今天该干啥。

Bee可穿戴设备实拍图 | 图片来源：TechCrunch

这东西到底怎么用

TechCrunch之前写过Bee，它的工作原理挺简单：用户开机，戴在手腕上，跟Bee手机App同步，输入一些基本个人信息。Bee有个内置录音器，点一下设备上的按钮就能开关录音。录音的时候，绿灯会闪；不录的时候，绿灯就灭了。一段对话录完之后，App会自动生成一个容易阅读的摘要，还有整段对话的转录文本。

至于这整个概念有多让人兴奋（或者不兴奋），可能因人而异。对我来说，问题是我有点隐私情结。在这个普通人被四面八方的数字监控包围的世界里，我很珍惜任何不被录音的机会。所以，想到要24/7在手腕上绑个偷听的 gadget，我并不觉得多吸引人。

工作场景倒是真有点用

即便如此，我也得承认——在合适的场景下——Bee确实有潜力帮你整理生活。它在职业场合的表现还不错。如果你一整天都是会，而且很难记住所有细节，Bee可以当个还算称职的助手。

这周我有一次商务电话，得到对方同意后开了录音。事后，App很忠实地把对话总结了一遍，还贴心地把每段谈话都分开了，这样我后来复习的时候，不用重新听完整段对话。这确实有用，不过得说明一下：这跟Otter、Granola这些其他转录服务提供的功能相比，也没啥质的区别——它们也都提供转录和自动生成的摘要。

你能想象这么个场景：一个专业人士整天在各种会议之间跑，这设备能帮上忙。你可以让Bee跑一整天，然后回头看对话摘要，找那些你没听清的地方。

Bee在总结对话方面做得还不错，但这玩意儿给出的实际转录文本可能有点乱。之前的评测者也注意到，你通常得手动输入其他说话人的名字，因为Bee不总是知道谁在说话。在我的对话中，我注意到它还漏了一些段落——倒不是啥大事，但确实不是完整记录。

私人生活？算了吧

我还带着Bee去了每周一次的和朋友看电影之夜，让它跑了一整晚。考虑到我们看的是《水库的狗》，我有点担心这可穿戴设备会把所有 vulgar 的杀戮场面当成真实发生的流血事件，然后触发某种内部警报。不过，Bee基本搞明白了怎么回事。这设备判断出我们在看电影，而且在之后的事件摘要里，把这段对话标记为”塔伦蒂诺电影场景分析”。

虽然Bee作为专业工具显示出早期潜力，但我不希望这东西记录我的私人生活。奇怪的是，Bee的市场定位主要是个人使用产品。要对此感到舒服，你得舒服于让Bee访问你线下和数字生活的大部分内容。

确实，要想工作得好，Bee需要大量的手机权限——包括访问你的位置、照片、电话联系人、日历和手机通知。你也可以跟它分享健康数据——如果你出于某种原因，想让它知道你的睡眠模式或者静息心率的话。

隐私问题怎么解

Bee收集的这大量数据存储在云端——再一次，对于数字隐私爱好者来说，这带来了自己的问题。在给科技YouTuber Becca Farsace的消息中，Bee apparently 展示了一个完全在本地运行的设备演示。如果这家公司能造出这样的设备，我会彻底服气——甚至可能考虑买一个。话又说回来，亚马逊还没对这些计划提供任何更新。

至于Bee的数字隐私保护，公司说它提供加密来保护用户数据——无论是静态还是传输中。在隐私政策中，公司声明它”实施了技术和组织安全措施，旨在保护公司处理的任何个人信息的安全”。Bee还声称它接受”严格的第三方安全审计”，并采用持续的安全监控。这些听起来都不错，不过值得指出的是，亚马逊——像许多大型科技公司一样——偶尔也会遇到一两个数据安全问题（对于一个管理如此多全球云环境的公司来说，这不 exactly 让人惊讶，但仍然是个问题）。

简短来说，Bee是个挺有意思的硬件产品，假以时日并加以调整，未来在专业应用方面可能有些前景。不过，作为你私人生活的数字助手，对某些用户来说，它可能有点太侵入性了。

📎 原文来源：I tried Amazon’s Bee wearable and am both intrigued and slightly creeped out — TechCrunch

2026年5月25日

博客

钱从哪来？

估值竞赛：Anthropic vs OpenAI

一个有趣的转折

AI智能体有了”游戏规则”

四大举措，既划红线又给空间

权限边界：谁来决策？

70%普及率目标，智能体要进千家万户

对行业意味着什么？

Google I/O 2026：从聊天机器人到数字分身

Gemini Spark：你的24小时数字分身

Gemini 3.5 Flash：把Agent成本打下来

Antigravity 2.0：93个Agent协作搭建操作系统

搜索彻底变了：从链接到执行结果

Google最恐怖的其实是生态

AI行业开始进入”运营时代”

Google DeepMind搞了个”AI科研搭档”

三个步骤，模拟科学家的思考过程

已经在用的场景

下一步是跟实验自动化打通

Anthropic拿到300亿美元，估值冲破9000亿

钱从哪里来，花到哪里去

教皇也来站台

OpenAI那边也没闲着

📌 项目简介

⚙️ 安装要求与过程

环境要求

快速安装（以Claude Code为例）

✨ 核心功能

🚀 典型使用场景

场景一：让AI严格按照TDD流程开发新功能

场景二：上线前全自动代码审查与安全加固

💡 推荐理由

📥 下载地址

一笔不太起眼的收购，暗藏大算盘

为什么这笔收购让谷歌和OpenAI很不舒服？

AI工具链的竞争才刚刚开始

从OpenAI创始人到Anthropic新兵

为什么他的加入这么受关注？

一场关于人才的暗战

IBM为什么选了法拉利

讲故事才是核心

独立App策略，不走社交平台

全年参与，不只是比赛日

新车迷更年轻、更多元

这东西到底怎么用

工作场景倒是真有点用

私人生活？算了吧

隐私问题怎么解