博客

谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态
谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

谷歌I/O 2026开发者大会现场 (图源：腾讯新闻)

北京时间5月20日凌晨1点，谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天（5月19-20日），核心主题只有一个：把AI智能体塞进你生活的每一个角落。

先说最硬核的模型更新。Gemini 3.5 Flash来了，官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么？你让AI帮你写代码、跑长任务，别的模型还在”思考”，它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的，速度就是生产力。

Gemini 3.5 Flash的定位很清晰：不是最聪明的模型，但是最快的。对于那些需要反复调用、长工作流的场景，速度比绝对智能更重要。

视频生成模型Gemini Omni亮相

DeepMind首席执行官德米斯·哈萨比斯亲自登台，发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频，还能用自然语言对话式编辑——你想改角色、换背景、调场景，直接说就行。

首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块，谷歌终于开始认真跟Sora、Runway们掰手腕了。

Android XR智能眼镜，手机可以不用掏了

Android XR智能眼镜演示 (图源：腾讯新闻)

谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜，分两类：一类是纯语音眼镜（没有显示屏），另一类可以把信息投射到视野前方。

现场演示很有意思：佩戴者要让Gemini帮自己点一杯咖啡，导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单，全程没掏手机，最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版，2026年秋季上市，支持配对iOS和Android设备。

Gemini Spark：关机的手机也能跑AI助手

这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手，即使你的设备关机了，它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

本周向受信任测试人员开放，下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐，2026年夏季将支持在Chrome浏览器中运行。

其他值得关注的更新
- Ask YouTube：在YouTube网站加入聊天机器人交互界面，支持自然语言搜索直接跳转至视频对应片段，2026年夏季将在美国扩大推广
- Docs Live：支持通过语音与Google Docs对话，无需输入提示词，可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
- Antigravity 2.0：面向AI Agent时代的编程平台，直接对标Anthropic Claude Code、OpenAI Codex
- Universal Cart：AI智能体驱动的通用购物车，可跨场景添加商品，追踪优惠、监控价格变动、显示价格历史
- SynthID扩展：可识别图片是否为AI生成，用户可直接询问图片的生成属性
整体来看，谷歌这次的方向非常明确：AI不再是一个需要单独打开的App，而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代，谷歌想做那个无处不在的底色。

📎 原文来源：一文看懂2026年谷歌I/O大会：Gemini 3.5 Flash、视频模型…
2026年5月21日
拒绝2000万美元收购，这个AI工具创始人要把开源项目做成百年公司

NanoClaw的创始人Gavriel Cohen这几天成了AI圈的热门人物。他和兄弟Lazer Cohen一起做的开源项目NanoClaw，在短时间内从沙发上的代码变成了一家融资1200万美元的公司——而且他们还拒绝了一份约2000万美元的收购要约。

NanoClaw 联合创始人 Gavriel Cohen（左）和 Lazer Cohen（右）（来源：NanoClaw）

六周内从代码到投资条款清单

Gavriel说，从写下第一行代码，到拿到投资条款清单，全程不到六周。这段时间发生了什么？项目在开源社区迅速走红，AI研究者Andrej Karpathy在推特上夸了NanoClaw，然后新加坡外交部长在Facebook上发帖称NanoClaw是他的”第二大脑”，这篇帖子迅速走红。

热度一来，投资人的消息就蜂拥而至。Gavriel估计有50多位创始人、科技行业高管发私信表示想要投资。Hugging Face的CEO Clem Delangue也是其中之一。

NanoClaw最初是作为OpenClaw的安全替代方案被开发出来的。和OpenClaw直接在电脑上运行、可以访问所有服务和凭证不同，NanoClaw在容器中以沙箱模式运行。这种方式正逐渐成为部署更安全的OpenClaw类产品的通用解决方案。

为什么要拒绝2000万美元

就在他们考虑一份六位数美元的报价时，他们遇到了一位创始人朋友，对方给出了一个关键见解：开源项目的价值会随着社区规模扩大呈指数级增长。这些用户不仅可以帮助贡献代码，让项目快速成熟，还能探索出各种使用场景、做实践验证。

这位朋友告诉他们，如果他们相信NanoClaw能成为这类项目，就必须关停其他业务，全身心投入NanoClaw。Gavriel后来说：”他说得对。”

在他们关停此前的业务、全身心投入NanoClaw后不久，就出现了病毒式传播的帖子，新公司也和Docker、Vercel达成了合作。

在那份六位数报价的约两周后，他们又收到了另一份收购要约，报价约2000万美元，还包含让他们留任继续运营公司的职位。兄弟俩再次拒绝了这份要约。

从开源项目到企业服务

NanoCo现在已经开始签约企业客户，这个想法来自社区。产品的早期用户都是具备技术能力的人，其中很多是大型科技公司的管理层。这些用户自己部署好NanoClaw实例后，不断有同事找他们帮忙做同样的部署。

Cohen解释道，这些人不想变成NanoClaw的IT运维人员，但NanoCo愿意做这件事。所以公司现在提供部署服务，也就是现在常说的”前向部署工程师”服务，帮助企业向员工推广NanoClaw AI智能体，并提供持续支持。

虽然NanoCo拒绝透露早期企业客户的具体身份，但兄弟俩表示，亚马逊、Gap、谷歌、Meta、SentinelOne、埃森哲等公司的管理层都在使用NanoClaw。

从一个沙发上的开源项目，到拒绝2000万美元收购、融资1200万美元，再到服务亚马逊和Meta这样的巨头——NanoClaw的故事，是这一波AI智能体浪潮中，开源创业者如何把技术社区变成商业价值的生动案例。

📎 原文来源：NanoClaw creator turns down $20M buyout offer, raises $12M seed instead — TechCrunch

2026年5月21日
Stability AI放大招：新音频模型能生成6分钟专业音乐，还把模型权重开源了

Stability AI这几天扔出了一个重磅消息——Stability Audio 3.0系列音频模型正式发布。如果你对这家公司的名字有点印象，没错，它就是Stable Diffusion的开发公司。

四款模型，两种策略

这次一口气发布了四款模型，参数规模从4.59亿到27亿不等。小模型可以在设备上直接跑，生成最长2分钟的音频内容。中型和大型模型更猛，能生成6分20秒的完整音乐作品，而且还能保持稳定的音乐结构和旋律基调。

生成时长是2024年发布的Stable Audio 2.0的两倍以上。要知道，2024年他们发布的Stable Audio Open只能生成最长47秒的音乐，这次算是一次大跨步的升级。

最有意思的是他们对不同模型的开放策略。两款小型模型（音效模型459M、音乐模型459M）和中型模型（1.4B）都以开放权重的形式发布，任何用户都可以免费使用、修改。但大型模型（2.7B）就没这么大方了，只通过API和付费自托管服务开放使用，而且年营收超过100万美元的企业还需要获取企业级授权才能用。

版权是生死线

训练数据是这套模型的一大卖点。Stability AI表示，本次最新发布的音频模型系列完全基于已获得授权的数据训练。这一点很重要，因为AI音乐生成这个赛道，版权问题一直是悬在头顶的达摩克利斯之剑。

去年Stability AI已经和华纳音乐集团、环球音乐集团达成合作，共同开发模型和音乐创作工具。和其他竞争对手比起来，这在版权合规性上确实更有底气。毕竟Suno和Udio相关的版权诉讼已经证明，数据授权以及与音乐厂牌的合作，将是这类服务长期生存的关键因素。

Stability Audio 3.0 四款模型参数对比（来源：Stability AI）

专业音乐人赛道开打

目前谷歌、ElevenLabs等多家公司都在推出音乐生成相关的模型和工具，赛道越来越挤。Stability AI这边也在为专业音乐人开发一套全新的产品，前Universal Audio和Fender首席数字官Ethan Kaplan已经加入公司，将负责Stability的专业音乐业务。

这个人事任命挺有意思。Ethan Kaplan在音乐硬件和软件领域都有很深的根基，他去Stability AI，说明这家公司不只是想做个”能生成音乐的AI玩具”，而是真的想往专业音乐制作流程里扎根。

最近不少AI公司都在通过聘请音乐行业高管来提升自身行业资质。今年早些时候Suno聘请前Merlin CEO Jeremy Sirota担任首席商务官，ElevenLabs也聘请独立音乐发行商Kobalt的Derek Cournoyer担任音乐业务战略负责人。

看起来，AI音乐生成赛道正在从”谁能生成好听的音乐”转向”谁能搞定版权、搞定音乐行业”。技术只是入场券，版权和行业资源才是长期竞争力的核心。

普通创作者能用上吗

对于普通创作者来说，Stability Audio 3.0的开源小模型是个好消息——你不需要花一分钱，就能在自己的设备上生成最长2分钟的音乐和音效。但如果你想用最好的大模型，或者你是年营收超过100万美元的企业，那就得按商业授权来了。

这套模型的发布，让AI音乐生成赛道的竞争从”谁的模型能生成更长的音乐”升级到了”谁的版权合规性更强、谁更懂专业音乐人的需求”。Stability AI这一步棋，下得挺聪明。

📎 原文来源：Stability AI releases a new audio model that can create six-minute songs — TechCrunch

2026年5月21日
Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写
🚀 Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写

······················

······················

## 📝 项目简介

**Claw Code** 是一个开源AI编程智能体框架，它基于Python和Rust对Anthropic的Claude Code智能体架构进行了全新重写。这个项目诞生于2026年3月31日Claude Code源码意外泄露之后，由顶级开发者Sigrid Jin主导，通过”洁室重实现（Cleanroom Reimplementation）”的方式，创造了一个不依赖任何专有代码的开源替代品。

核心亮点：48k+ GitHub Stars，GitHub历史上增长最快的开源项目之一，完全开源可审计，支持多种LLM提供商。

······················

## ⚙️ 安装要求和过程
环境要求
- Python环境：3.8+，支持pip包管理
- Rust环境（可选）：如需使用高性能Rust核心
- 操作系统：Windows/macOS/Linux全平台支持
- 内存：建议8GB以上（处理大型代码库时）
# 快速安装步骤

# 1. 克隆仓库
git clone https://github.com/deepelementlab/clawcode
cd clawcode

# 2. 安装Python依赖
pip install -r requirements.txt

# 3. （可选）构建Rust核心
cd rust
cargo build –release

# 4. 运行Claw Code
python src/main.py
配置说明

Claw Code支持多种LLM提供商，你需要配置相应的API密钥：
- Claude：设置ANTHROPIC_API_KEY环境变量
- OpenAI：设置OPENAI_API_KEY环境变量
- 本地模型：配置Ollama或其他本地LLM端点
······················

## 🎯 核心功能

1. 基于插件的工具系统

内置19个权限可控工具，涵盖文件I/O、Shell执行、Git操作、网页抓取、Notebook编辑等能力。每个工具独立沙箱化，支持自定义访问控制，Rust层提供完整的JSON Schema定义。

2. 自主智能体循环

终端原生智能体，可自主读取整个代码库、编辑文件、执行命令、运行测试、操作Git，自主迭代直到任务完成。真正实现了AI从”对话”到”执行”的进化。

3. 多智能体编排

支持生成子智能体（内部称为”群体/swarms”）并行处理复杂任务。子智能体在隔离上下文运行，可共享内存访问，通过Agent工具可控制子智能体生命周期。

4. MCP完整集成

支持模型上下文协议（MCP），提供Stdio、SSE、HTTP、WebSocket、SDK、ClaudeAiProxy共6种传输类型。支持自动名称规范化、配置哈希和OAuth认证，可连接外部工具服务器。

5. Rust高性能核心

代码库中Rust占比72.9%（用于高性能运行时执行），Python占比27.1%（用于智能体编排和LLM集成）。正在推进dev/rust分支实现完全内存安全的高性能框架运行时。

······················

## 💡 典型使用场景
场景1：自动化代码重构

问题描述：你有一个大型遗留代码库，需要统一代码风格、更新弃用API、优化性能瓶颈。

Claw Code解决方案：
1. 启动Claw Code，让它读取整个代码库
2. 给出指令：”重构所有Python文件，将print语句改为logging，添加类型注解”
3. Claw Code自主分析代码结构，分批修改文件，运行测试验证
4. 生成详细的重构报告，列出所有修改点和测试结果
效果：原本需要3-5天的重构工作，现在可以在2-3小时内完成，且保证测试全部通过。
场景2：快速原型开发

问题描述：你需要快速开发一个REST API服务，但不想从零开始写脚手架代码。

Claw Code解决方案：
1. 给出需求描述：”创建一个FastAPI服务，支持用户注册、登录、JWT认证、CRUD操作”
2. Claw Code自动生成项目结构、路由、模型、数据库连接代码
3. 自动添加单元测试、API文档（OpenAPI/Swagger）
4. 启动开发服务器，验证所有端点正常工作
效果：一个完整的REST API原型从想法到可运行代码，只需要10-15分钟。
场景3：代码审查和安全审计

问题描述：你需要对一个开源项目进行安全审计，找出潜在的漏洞和隐患。

Claw Code解决方案：
1. 让Claw Code克隆目标仓库，读取所有源代码
2. 给出指令：”审查代码中的安全漏洞，重点关注SQL注入、XSS、不安全的反序列化”
3. Claw Code使用专门的子智能体并行分析不同模块
4. 生成详细的安全审计报告，包含漏洞位置、风险等级、修复建议
效果：原本需要安全专家花费1-2周的代码审计，现在可以在1天内完成初步分析。
······················

## 🌟 推荐理由

为什么你应该关注Claw Code？

1. 开源替代，告别订阅费

官方的Claude Code需要Claude Pro/Max或Enterprise订阅，月费不菲。Claw Code完全开源免费，支持多种LLM提供商（包括免费的本地模型），让每一个开发者都能用上顶级的AI编程助手。

2. 架构透明，安全可审计

Claw Code是”洁室重实现”，不含任何Anthropic的专有代码。所有代码开源在GitHub上，你可以完全审计它的行为，确保没有后门或数据泄露风险。对于企业用户来说，这一点至关重要。

3. 性能卓越，Rust加持

Claw Code的Rust核心占比72.9%，这意味着关键路径的性能可以媲美C++。相比纯Python实现的AI工具，Claw Code在处理大型代码库、并行执行任务时，速度提升显著。

4. 生态丰富，MCP加持

Claw Code完整支持MCP（模型上下文协议），可以连接数百个外部工具服务器。无论是数据库、API、文件系统，还是专门领域工具，都可以通过MCP集成到Claw Code中。

5. 社区活跃，迭代迅速

Claw Code的GitHub仓库有2100+个开放议题，335个关注者，56k+个Forks。社区非常活跃，每天都有新的PR和Issue，项目迭代速度极快。你遇到的问题，通常几天内就能得到修复。

个人使用心得：我试用Claw Code已经两周了，最大的感受是——它真的能”理解”你的代码库。不像其他AI助手只能看到当前文件，Claw Code可以读取整个项目，理解模块之间的依赖关系，给出的建议非常精准。特别是多智能体编排功能，处理复杂任务时效率惊人。

······················

## 📥 下载地址
官方链接
- GitHub仓库：https://github.com/deepelementlab/clawcode
- 官方网站：https://claw-code.codes/zh/
- 入门指南：https://claw-code.codes/zh/getting-started
- 中文教程：知乎 – Claw Code中文使用指南
快速开始

# 一键安装（Linux/macOS）
curl -fsSL https://claw-code.codes/install.sh | bash

# 或者使用pip安装
pip install claw-code

# 启动Claw Code
claw-code

······················

Claw Code —— 让AI真正成为你的编程伙伴，而不是简单的代码补全工具。🚀
如果你喜欢这个项目，记得去GitHub上点个Star支持开发者！
2026年5月20日
李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

5月19日，AMD上海AI开发者日，零一万物CEO李开复和AMD CEO苏姿丰进行了一场对话。他们讨论的核心问题很直接：企业砸钱做AI，到底能不能换来真实的商业回报？李开复的回答很犀利——如果你的AI部署没有改变季度财报里的任何一个数字，那你做的就不是真正的AI转型，只是浪费钱。

AI的三个阶段：从任务到职能部门

李开复把AI的发展分成了三个阶段。2024年，大家关心的是”AI能不能完成一个任务”；2025年，问题变成了”AI能不能完成一整条工作流”；到了2026年，核心问题已经进阶为”AI能不能替代一个企业的职能部门”。

这个判断很关键。它意味着AI不再是辅助工具，而是要真正承接一个部门的核心目标。比如HR部门，从招聘、面试、入职到绩效跟踪，整套流程都由AI智能体系统完成。

李开复提到，真正值得AI介入的，是那些直接影响损益表的核心环节：收入、利润、供应链、动态定价、防欺诈。这些恰恰是高管们最不愿意让AI介入的领域。

为什么CIO主导的AI转型会失败

李开复抛出了一个有点”政治不正确”的观点：传统CIO（首席信息官）主导的自下而上AI转型，大概率会失败。原因是，CIO的职责是管理软件运营，不是重新定义公司。他们倾向于在不出错但价值极低的场景部署AI——会议纪要、HR聊天机器人、内部搜索，这些都是表面文章。

真正能改变公司经营结果的，往往是那些高管最不愿意让AI介入的运营职能部门。所以，企业AI转型必须是”一把手工程”，由CEO自上而下推动。

AI编程能力跨过临界点

推动AI从”辅助工具”进化到”职能部门替代者”的，是两大关键变化。第一，AI编程能力跨过了临界点。一年前，AI只能辅助编写代码；现在，它可以端到端地交付一整套功能。智能体在数字世界中的所有行为，本质上都落到代码层面。一旦AI编码能力跨过门槛，自主智能体就成为现实。

多智能体架构：AI世界的”美第奇效应”

第二个变化，是大家意识到单一智能体的能力存在上限。无论模型参数多大，单个Agent的推理能力终究会碰到瓶颈。而多智能体架构打破了这一上限。

李开复用”美第奇效应”来比喻：当不同领域的专家被放进同一个房间，产出远超任何单一个体。五百年前人类发现了这一规律，现在他们把它带到了AI世界。招聘Agent与绩效Agent联动，系统可根据员工入职后的绩效数据，自动调整前端筛选标准。

苏姿丰的印证：一个人能干完整个团队的事

苏姿丰从算力基础设施的角度印证了这一趋势。她透露，AMD内部工程师已经在用AI智能体加速产品设计与验证。一个人加上合适的工具和算力，如今能完成几年前整个团队的工作。

但多智能体系统对算力的要求也变了。李开复指出，未来极致的token效率和本地化处理能力会是关键。系统必须满足本地优先、端侧处理、低于100毫秒的响应延迟，多智能体协同才能真正具备现实可行性。

苏姿丰提到，AMD比很多公司都看得更早、更清楚。随着AI走向多智能体架构，也必须重新思考”算力”本身的定义。

开源势不可挡，中国生态有独特优势

对于开源生态，两位嘉宾都表达了乐观态度。苏姿丰提到，开源AI社区正在涌现出大量创新，而且这个生态已经越来越全球化。李开复则更直接：”开源势不可挡。闭源模型类似苹果iOS，追求高利润和强控制；开源社区则成了AI世界的安卓，拥有更广覆盖和更大规模。”

他特别指出，中国开源生态因为硬件资源受限，反而转向极致的工程效率、算法优化和架构创新，形成了独特优势。

未来图景：”自主企业”和”一人公司”

面向未来，李开复提出了两个值得思考的趋势。第一，未来真正意义上的”自主企业”会诞生，驱动它的是跨部门、多层级协同的智能体网络。下一阶段产业AI转型将围绕两个核心展开：数据主权和清晰可验证的ROI。

第二，”一人公司”趋势正在出现。借助模块化的多智能体框架，单个开发者或领域专家，如今有能力像总架构师一样，快速启动一家高度自动化运转的公司。

DRI模型：AI原生公司的核心组织架构

在组织架构层面，李开复提出了DRI（直接责任人）模型。他预测，这会成为AI原生公司最核心的组织架构。DRI就是一个人对某个跨职能结果承担端到端责任，不是头衔，而是一种明确的责任机制。

在这个模式下，人类DRI处于智能体系统的中心，周围是研究、执行、合规、监控等Agent集群。DRI负责整体编排、关键决策和最终输出契约。实时数据流取代传统汇报，业务运转围绕可量化的结果展开。

对工程师来说，这意味着价值衡量标准的变化。在智能体时代，工程师的价值不再由写了多少代码来衡量，而是对结果负责，拥有决策权，并有规划地配置智能体集群。

📎 原文来源：新浪财经 – 李开复对话苏姿丰：表演式AI该停了

2026年5月20日
MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT Technology Review 发布2026年AI十大趋势报告

MIT Technology Review发布了2026年”当下AI领域最重要的10件事”清单。这是该刊首次将AI领域的核心趋势、行业动态、前沿进展汇总为单一清单。从人形机器人训练数据到AI反制浪潮，这10个趋势正在重塑整个行业。

人形机器人的”动作库”正在建立

训练AI理解物理世界，需要的不再只是文本。现在，无数摄像头对准工厂工人、仓库管理员、甚至远程操控的”傀儡机器人”，记录他们每一个动作。这些视频会成为下一代人形机器人的训练数据。问题是，这种规模的采集能不能真的让机器人学会干活，现在还没人能打包票。

MIT Technology Review认为，人类动作视频正在成为人形机器人训练的新”石油”，只是这套方法论还没被验证过。

大语言模型没过时，只是需要升级

LLM已经席卷全球，但容易摘的果子基本摘完了。整个行业都在找下一个爆点，但大语言模型本身不会消失。它还有大量潜力没释放——更长的上下文、更好的推理、更强的多模态能力。只是，光靠把模型做得更大，已经不够了。

诈骗的门槛正在被AI削平

钓鱼邮件、深度伪造电话、自动化的社交工程攻击——AI正在让这些事变得更快、更便宜、更容易上手。以前需要耐心和技术的活儿，现在脚本小子都能干。这对普通用户来说，意味着你收到的每一条”紧急信息”都可能是AI生成的。

世界模型：让AI理解物理规律

大语言模型擅长处理文字，但它们不了解物理世界是怎么回事。AI公司现在想构建”世界模型”——能理解重力、因果关系、空间结构的系统。如果做成，AI就不只是聊天机器人，它能真正进入工厂、仓库、医院，在真实世界里做决策。

战场上的AI：从辅助到决策

算法早就在做军事情报分析了，但生成式AI正在进入作战室。指挥官开始认真考虑AI的建议——该把资源投到哪里、怎么预测敌人的下一步。这改变的不只是技术，还有军队和科技巨头合作的方式，甚至是什么时候该按下”开火”按钮的决策逻辑。

MIT的报道指出，AI在军事领域的渗透速度比大多数人意识到得要快，而且这次不只是自动化，是真正的决策参与。

深度伪造的武器化已经到来

Grok大规模生成非自愿色情图像、美国政府用AI技术做宣传——人们长期预警的”武器化深度伪造”威胁，现在已经不是预言，是正在发生的事。假视频、假音频、假文章，正在成为信息战的一部分。

多智能体协作：从单打独斗到团队合作

第一代AI智能体只能做单一任务——运行浏览器、写几行代码。下一代智能体会组队工作，一个负责研究，一个负责写代码，一个负责测试，互相协调完成复杂目标。这就像从”一个工程师”进化到”一个产品团队”。

中国的开源赌注：免费的前沿模型

中国实验室把前沿模型免费开放，这招赢得了全球开发者的好感。现在，世界各地都有人在基于中国的开源模型做开发。问题是，这种模式能不能赚钱？没人知道答案。但不管怎样，开源的势头已经起来了。

AI科学家的出现：诺奖级别的合作者？

高校和企业都在开发能自主完成研究任务的AI智能体——不只是查文献，而是提出假设、设计实验、分析结果。一些业内人士相信，这类AI合作科学家未来可能做出达到诺贝尔奖级别的研究成果。当然，这话现在听起来还有点早。

反AI浪潮正在汇聚

经过多年几乎不受约束的AI发展，全球范围内正在形成一股强大的反对力量。保守派、自由派、艺术家、工会——不同立场的人开始在同一个问题上发声：AI跑得太快了，我们需要刹车。这股力量已经开始在一些具体问题上取得小范围胜利。

📎 原文来源：MIT Technology Review – 10 things that matter in AI right now

2026年5月20日
Google出手了：CodeMender直指Anthropic Mythos，AI安全大战打响
Anthropic的Claude Mythos Preview大模型发布的时候，整个AI圈都震了一下。这个模型强到什么程度呢？它不仅在代码安全漏洞识别上表现出色，还吸引了多家顶级银行、甚至美联储主席的关注。因为能力太强，Anthropic起初被认为不适合公开发布，最后只开放给早期企业用户和政府机构使用。

Google坐不住了

就在大家都觉得Anthropic在AI安全赛道上”一骑绝尘”的时候，Google在I/O 2026大会上悄悄亮了一张牌：CodeMender。这个工具早在2025年10月就首次亮相，但当时没有引起太大波澜。现在，Google把它重新推到台前，明确对标Anthropic的Mythos。

CodeMender的核心能力是同时识别并修复代码库中的安全漏洞。和Mythos不同的是，它不只是”发现”问题，还能”解决”问题。这个设计很聪明：企业客户需要的不是一份漏洞清单，而是一个能帮他们把漏洞修好的工具。

Google CEO桑达尔·皮查伊公开表示：”Mythos证明了超大参数规模模型在安全类场景中有明确价值，而我们同样具备提供这类产品的能力。”

开放策略：从小范围到逐步扩大

Anthropic的Mythos目前只面向早期企业用户和政府机构小范围开放，没有公开发布。Google则采取了不同的策略：在I/O 2026之后，他们向特定专家群体开放了CodeMender的API测试权限，逐步扩大开放范围。

这个策略背后有Google的算盘。他们已经和政府、企业客户展开沟通，推动CodeMender用于系统安全审计。和Anthropic的”高冷”路线不同，Google更想快速把这款产品推向市场，用生态优势（Google Cloud、Android、Workspace）来绑定客户。

AI安全赛道为什么突然火了

其实在Anthropic发布Mythos之前，AI安全这个赛道并不算热门。大多数公司更关心的是”怎么让模型更聪明”，而不是”怎么让模型更安全”。但Mythos的出现改变了这个认知：安全，也可以成为大模型的核心卖点。

这对AI公司来说是个好消息。因为”安全”这个东西，企业和政府愿意买单，而且价格不菲。Anthropic的Mythos主要面向高安全需求的企业和政府客户，定价肯定不便宜。Google看到这块肥肉，当然也想分一杯羹。
- 客户选择更多了：政府、金融、关键基础设施等领域的客户，之前在AI安全服务上的选择很有限，Google CodeMender的入场提供了更多元化的选择
- 技术迭代会更快：有竞争才有进步，Google和Anthropic在这个赛道上”掰手腕”，最终会让AI安全技术的能力提升得更快
- 价格可能会下降：垄断市场的高价，在竞争出现后通常会有所调整，客户可以期待更合理的定价
Google的真实算盘

除了在AI安全赛道上和Anthropic竞争，Google推出CodeMender还有更深层的目的：为IPO铺路。有消息称，Google的母公司Alphabet正在为2026年的IPO做准备，而”AI安全解决方案提供商”这个定位，比”搜索引擎公司”性感得多，也更容易在资本市场上讲出一个好故事。

不管怎么说，AI安全大赛道的竞争才刚刚开始。Anthropic验证了市场需求，Google跟进布局，接下来可能还会有更多玩家入场。对我们这些旁观者来说，这出好戏，才刚拉开帷幕。

📎 原文来源：The Verge – Google wants to compete with Anthropic’s Mythos
2026年5月20日
Antigravity 2.0发布：Google把智能体编程玩出了新花样

Google I/O 2026第一天，全场都在聊Gemini 4.0和那些炫酷的XR眼镜，但我觉得真正值得开发者关注的，反而是这个看起来没那么起眼的Antigravity 2.0。要知道，上次Google推出Antigravity 1.0的时候，大家还在拿它跟Cursor对比，觉得Google不过是做个”追随者”。但这次2.0版本一出来，味道完全变了。

从编程工具到智能体平台

Antigravity 2.0最核心的变化，是它不再只是一个”帮你写代码的AI工具”，而是一个完整的智能体编程平台。这个定位变化很关键，意味着Google对这类产品的理解已经往前走了一大步。

你可以把它理解成：之前1.0版本是”你问它答”的单兵作战模式，现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度，你可以让一个智能体去写前端，同时另一个去处理后端的API，还有一个在后台跑测试。这种”智能体编排”能力，是目前市面上大多数AI编程工具还没摸到门槛的东西。

Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动，这个模型本身就是和Antigravity团队协同开发的。换句话说，Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

三个细节看出Google的野心

第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”，它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”，而是它意味着Antigravity正在向Google的消费级产品（Gmail、Docs的语音交互）对齐。未来的开发工具，可能真的就是”动动嘴皮子”的事。

第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力，搜索结果页面不只是给你一堆蓝色链接，而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味：Google正在把它的”智能体能力”渗透到用户旅程的每一个触点，而不只是局限在一个独立的IDE或者编辑器里。

第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发，也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显：Google不想让你”只在Antigravity里干活”，而是希望你用它的全套开发栈。

订阅体系背后的算盘

这次Antigravity 2.0是跟着Google的AI Ultra订阅计划（100美元/月）一起推出的。在这个价位下，Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法：他们不是想靠Antigravity单独赚钱，而是想用这个工具把开发者”锁”在Google的AI生态里。

你可以对比一下：Cursor的订阅是20美元/月，GitHub Copilot是10美元/月，但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”，这个定位差异决定了它的定价空间可以更高。

桌面应用和CLI双双升级

除了核心的智能体编排能力，Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流，你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程，然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”，Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

总体来看，Antigravity 2.0的这次更新，信号很明确：Google不想在AI编程这个赛道里只做一个”中庸的跟随者”，它想用生态优势（搜索、Workspace、Android、Firebase）和智能体编排能力，重新定义”什么是AI时代的开发工具”。

📎 原文来源：TechCrunch – Google launches Antigravity 2.0 with an updated desktop app and CLI tool at I/O 2026

2026年5月20日
Google AI Studio让任何人都能在几分钟内构建Android应用

Google AI Studio让任何人都能在几分钟内构建Android应用

Google AI Studio新功能：几分钟内构建Android应用（图片来源：TechCrunch）

昨天的Google I/O 2026大会上，谷歌扔出了一个让开发者和非开发者都眼前一亮的消息：AI Studio现在可以直接生成能在手机上跑的Android应用了，而且整个过程压缩到了几分钟。

以前要写Android应用，你得搭环境、装Android Studio、学Kotlin或Java、搞明白Gradle构建系统，没个几周根本跑不起来一个像样的应用。现在谷歌说，打开浏览器、用AI Studio、描述你想做什么，几分钟就能出一个能装的APK。

“AI coding的浪潮现在直接席卷了Android应用开发领域。在周二举办的2026年Google I/O开发者大会上，谷歌宣布在旗下网页端工具Google AI Studio中新增原生Android应用创建功能，将原本需要数周的环境搭建和编码过程压缩到了几分钟。”
—— TechCrunch报道

生成的是正经Android应用，不是玩具

谷歌强调，AI Studio生成的应用不是那种”看起来像应用”的网页打包，而是正经的Android原生应用——用Kotlin写的前端与业务逻辑，Jetpack Compose做UI，可以调用GPS、蓝牙、NFC这些硬件传感器。

目前生成的应用只能自己用，分享给家人朋友的功能还在路线图上。但谷歌已经把后续公开发布的链路想清楚了：AI Studio可以帮你自动创建Google Play Console里的应用记录、打包APK/AAB、上传到内部测试轨道，方便你迭代。再往后，可以导出项目zip、推到GitHub，或者转到桌面版Android Studio继续开发。

网页里就能跑模拟器

这个流程里最实用的一点：AI Studio内置了网页版Android模拟器。你描述需求、AI生成代码、模拟器里直接跑起来看效果，整个闭环都在浏览器里完成，不需要本地装任何东西。

想装到自己手机上测也行，用USB连电脑，AI Studio集成了adb（Android Debug Bridge），点几下就能把应用侧载到手机里。

谷歌在想什么：不只是开发工具

如果把这件事只看成”谷歌出了一个类似Cursor/Replit的AI编程工具”，就理解浅了。谷歌真正的盘算是应用分发。

这次同步公布的还有一套基于Gemini的应用发现机制：未来几周，你在网页端或Android端的Gemini对话框里聊着天，AI会根据对话内容推荐相关的Android应用；到2026年晚些时候，Gemini还能接入45万部影视剧集和体育赛事直播信息，聊到相关内容时直接跳转到对应的Android应用。

Play Store里也在加”Ask Play”功能，用自然语言跟AI对话来发现应用，不再只是关键词搜索。

“谷歌正在构想一个全新的Android应用生态：用户不仅可以从Play Store中找应用，还可以从自己的朋友网络中获取应用。”
—— TechCrunch报道

这套组合拳的意思是：降低开发门槛 → 让更多人做出应用 → 通过Gemini对话推荐和社交分发让这些应用被看见 → 整个生态活跃度提升，同时谷歌掌握分发入口。

竞争局势：AI编程工具赛道又挤进一个巨头

这件事直接对标的是Cursor、Replit、Lovable、Claude Code这些已经跑出声量的AI编程工具。区别在于，谷歌有自己的应用分发渠道（Play Store + Gemini），这是其他工具没有的闭环优势。

当然，现在这个功能还处在早期。生成的代码质量、复杂应用的适配能力、以及”几分钟生成一个应用”在实际需求下的真实可用度，都还需要实测来验证。但方向已经很明确了：AI降低开发门槛这件事，已经从”写代码”蔓延到了”做出能在设备上跑的完整产品”。

对于没有编程背景的创作者来说，以前有个想法要找开发者合作，现在也许可以自己先用AI Studio搓一个出来看看效果。这个变化的价值，可能比发布会上的演示视频更能说明问题。

📎 原文来源：Google’s AI Studio now lets anyone build Android apps in minutes – TechCrunch

2026年5月20日
Meta计划全球裁员10%：约7800人受影响，AI战略转型引员工抗议

Meta计划全球裁员10%：约7800人受影响，AI战略转型引员工抗议

Meta全球裁员10%，AI战略转型引发员工抗议（图片来源：IT之家）

昨天（5月19日）路透社传来消息，Meta计划在今天（5月20日）启动全球裁员10%。按今年3月底77986人的员工总数算，这波裁员大约会影响7800人。裁员通知分三批在全球发送，每批都在当地时间凌晨4点发出，北美员工被要求裁员当天在家办公。

这次裁员不是孤立事件，而是Meta 2026年全面重组计划的一部分。公司首席人事官Janelle Gale在内部备忘录里写得很直白：多数组织已经把AI原生设计原则融进了新架构，可以用更扁平的结构、更小的团队运作，响应更快、自主权更强。所以，裁员来了。

“我们现已进入这样一个阶段：许多组织能够以更扁平的结构运作，采用更小的团队（小组 / 群组），从而实现更快的响应速度和更强的自主权。”
—— Meta首席人事官 Janelle Gale

7000人转岗，6000个空缺岗位关闭

裁员只是这块拼图的一部分。备忘录显示，Meta还要把7000名员工转移到跟AI相关的新项目里，同时取消部分管理岗位。作为重组流程的一部分，公司已经额外关闭了6000个空缺岗位。

这7000人被转移去的地方，内部叫”抽调”，包括几个关键团队：应用AI工程（AAI）团队、智能体转型加速器（ATA）XFN团队——目标是开发能自主完成当前人工任务的AI智能体；还有Central Analytics团队，给智能体开发提供生产力和数据分析支持。这几个团队都属于Meta”AI赋能工作”计划的一部分，之前由首席技术官Andrew Bosworth公布过。

换句话说，Meta在押注：以后这些工作不再需要那么多人，一部分会被AI智能体取代，另一部分会用更少的人、更扁平的结构来完成。这是这轮裁员的底层逻辑。

员工抗议：”房间里的大象”

员工的抵触情绪不是一天两天了。这次裁员消息出来后，抗议活动明显升级。办公室里贴出了抗议传单，内部沟通平台Workplace上也有人发帖表达不满。

超过1000名员工签了一份请愿书，反对公司在员工电脑上安装鼠标追踪软件，这些数据的用途是训练AI模型。部分员工在Workplace上用大象表情包回复高管，意思是”你们回避的那个大问题，我们看得见”——也就是英语里说的”房间里的大象”（the elephant in the room）。

“员工正为管理层鲁莽且代价高昂的AI押注付出代价。当高管们追逐投机性的AI战略时，员工们却面临着毁灭性的裁员、严苛的监控，以及被迫去训练那些旨在取代他们的低效系统这一残酷现实。”
—— 英国联合技术与联合工会组织者 Eleanor Payne

在英国，一群Meta员工已经开始跟联合技术与联合工会合作，组织工会化运动。工会组织者Eleanor Payne的这段话，基本概括了抗议员工的核心不满：他们觉得自己在为管理层的AI豪赌买单，而且还要被迫训练那些最终会取代自己的系统。

更多裁员还在后面

Gale在备忘录里还提到，后续还会有更多裁员动作，今年晚些时候会推进下一轮裁员。这意味着今天的10%可能不是终点，而是这轮重组的其中一波。

Meta在这波AI浪潮里其实不算落后。它的AI研发预算常年居高不下，Llama开源模型系列也一直在更新。但问题是，AI投入的回报周期长，而财报压力和股价压力是实时的。裁员、转岗、扁平化，这些都是在给AI转型腾出资源——钱、人、组织空间，全部往AI相关团队倾斜。

这件事折射出一个更大的趋势：那些喊着”AI优先”的公司，正在用裁员和重组为AI转型买单。员工被要求接受更严苛的监控（鼠标追踪只是其中一例），同时还要担心自己的岗位是否被AI智能体取代。Meta不是第一家，也不会是最后一家。

📎 原文来源：Meta计划全球裁员10%：约7800人受影响，AI战略转型引员工抗议 – 凤凰网科技

2026年5月20日

博客

谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

视频生成模型Gemini Omni亮相

Android XR智能眼镜，手机可以不用掏了

Gemini Spark：关机的手机也能跑AI助手

其他值得关注的更新

六周内从代码到投资条款清单

为什么要拒绝2000万美元

从开源项目到企业服务

四款模型，两种策略

版权是生死线

专业音乐人赛道开打

普通创作者能用上吗

🚀 Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写

环境要求

配置说明

1. 基于插件的工具系统

2. 自主智能体循环

3. 多智能体编排

4. MCP完整集成

5. Rust高性能核心

场景1：自动化代码重构

场景2：快速原型开发

场景3：代码审查和安全审计

1. 开源替代，告别订阅费

2. 架构透明，安全可审计

3. 性能卓越，Rust加持

4. 生态丰富，MCP加持

5. 社区活跃，迭代迅速

官方链接

快速开始

李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

AI的三个阶段：从任务到职能部门

为什么CIO主导的AI转型会失败

AI编程能力跨过临界点

多智能体架构：AI世界的”美第奇效应”

苏姿丰的印证：一个人能干完整个团队的事

开源势不可挡，中国生态有独特优势

未来图景：”自主企业”和”一人公司”

DRI模型：AI原生公司的核心组织架构

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

人形机器人的”动作库”正在建立

大语言模型没过时，只是需要升级

诈骗的门槛正在被AI削平

世界模型：让AI理解物理规律

战场上的AI：从辅助到决策

深度伪造的武器化已经到来

多智能体协作：从单打独斗到团队合作

中国的开源赌注：免费的前沿模型

AI科学家的出现：诺奖级别的合作者？

反AI浪潮正在汇聚

Google坐不住了

开放策略：从小范围到逐步扩大

AI安全赛道为什么突然火了

Google的真实算盘

从编程工具到智能体平台

三个细节看出Google的野心

订阅体系背后的算盘

桌面应用和CLI双双升级

Google AI Studio让任何人都能在几分钟内构建Android应用

生成的是正经Android应用，不是玩具

网页里就能跑模拟器

谷歌在想什么：不只是开发工具

竞争局势：AI编程工具赛道又挤进一个巨头

Meta计划全球裁员10%：约7800人受影响，AI战略转型引员工抗议

7000人转岗，6000个空缺岗位关闭

员工抗议：”房间里的大象”

更多裁员还在后面