博客

OpenAI把Codex搬进手机了，随时能写代码这件事到底靠不靠谱

前几天刷到一条消息，OpenAI 把 Codex 搬到手机上了。没错，就是那个在桌面端帮程序员写代码的 AI 工具，现在你可以在手机上直接生成、审阅、甚至部署代码片段。对远程团队来说这是个挺实在的更新，毕竟不是所有人时刻坐在电脑前，等不及的时候掏出手机就能改两行代码，这种灵活性以前真的没有。

手机写代码，真不是噱头

Codex 移动端预览版直接集成在 ChatGPT 应用里，不需要额外安装。最实用的一点是它支持远程 SSH 连接，意味着你真的可以在手机上完成一段代码的审阅、修改、然后推到服务器。当然有人担心移动环境下的代码安全，这个顾虑是合理的，毕竟手机网络比办公网络复杂得多，敏感项目的操作还是得悠着点。

OpenAI 这次把这个功能做成预览版，说明他们自己也很清楚——移动端编码这件事，体验和安全性都还需要迭代。

有意思的是，几乎同一时间，Anthropic 的 Claude Code 产品负责人 Cat Wu 也在公开场合聊了类似的话题。她说 Claude Code 的开发思路是不预设宏大的整体规划，更看重迭代反馈而非僵化的路线图。这话听起来有点虚，但仔细想确实有道理——AI 编码工具这种东西，你很难在发布前就把所有使用场景规划清楚，用户怎么用、在哪卡住，这些反馈比任何前期调研都值钱。

AI 正在改变软件开发的节奏（来源：coaio.com）

企业AI架构，风向变了

还有一个信号值得注意。行业分析里开始出现一种声音：企业级 AI 系统开发，正在从「LLM 优先」转向「代码优先」。什么意思呢？过去一年多，大家一上来就想把大模型能力塞进系统，先把聊天界面搭起来，再想业务逻辑。现在有人意识到，这样做虽然出活快，但开发者对系统的深度理解会被掩盖， Demo 做得很炫，真正跑起来全是坑。

新思路强调「代码优先」，说白了就是先把业务逻辑、数据结构、系统边界想清楚，再用 AI 工具去加速开发，而不是反过来。这个转变背后其实是教训——太多项目在规模化部署的时候翻车，技术债务堆到还不起。

其他值得关注的动静

AMD 这边也有动作，宣布给 RDNA2 和 RDNA3 架构的老显卡提供硬件加速的 FSR 4 超分辨率支持。通俗点说，就是你手里那张几年前的显卡，可以通过驱动更新获得更好的游戏画质，相当于变相延长了硬件寿命。对不想频繁换卡的用户来说，这算是个小惊喜，虽然性能上肯定还是有损耗的。

医疗 AI 这边出了个警示案例。加拿大安大略省审计发现，医生用的 AI 笔记工具频繁虚构治疗建议和处方内容。这个问题其实不意外，大模型的「幻觉」在医疗场景下后果完全不同。行业里已经开始呼吁建立更严格的 AI 输出验证机制，但这件事真正做起来，比喊口号难多了。

最后说个有点荒诞的事——美国太浩湖地区 4.9 万居民，正在和内华达州的一个 AI 数据中心抢电。能源供应商优先给数据中心供电，居民用电反而被挤压。AI 的扩张代价，最终是普通人在承担，这个问题只会越来越突出。

📎 原文来源：Breakthrough AI Tools and Tech Shifts: OpenAI Codex Mobile, Claude Insights, and 2026 Innovations

2026年5月21日
2026年5月AI圈大事件：GPT-5.5来了，Kimi融资20亿美元，人形机器人走向工厂
2026年5月AI圈大事件：GPT-5.5来了，Kimi融资20亿美元，人形机器人走向工厂

5月的AI圈，信息量爆炸。OpenAI发布了GPT-5.5，国产AI企业Kimi即将完成20亿美元融资，人形机器人展览会在杭州开幕，苹果因为AI功能虚假宣传赔了2.5亿美元……如果你没时间每天刷新闻，这篇文章帮你一次性梳理完这个月的所有大事。

GPT-5.5来了，这次主打”不胡说”

OpenAI在5月发布了GPT-5.5 Instant，最核心的升级是”可靠性”。之前的版本在专业领域容易”一本正经地胡说八道”，5.5在医疗、法律、金融等高风险场景的准确性有了质的飞跃，幻觉率大幅降低。

这个方向其实很明确：企业用户要的不是模型”能聊”，而是”说对话”。ChatGPT的使用量继续攀升，企业场景渗透加速，GPT-5.5算是踩在了正确的节奏上。

AI行业的竞争，正在从”谁的模型更聪明”转向”谁的模型更可靠”。GPT-5.5的发布，是这个转向的一个标志性节点。

Kimi即将完成20亿美元融资

月之暗面旗下的Kimi即将完成一笔20亿美元的新融资，投后估值大幅攀升。这是2026年国产AI领域最大的一笔融资之一。

Kimi这波势头很猛，长文本处理能力一直是它的招牌，现在融资到位，接下来在多模态、Agent方向的投入估计会加大。国产大模型这场仗，远没到终局。

人形机器人走向工厂，不只是演示了

5月14日至16日，HRTE 2026杭州国际人形机器人展览会举办，主题是”人形机器人赋能新型工业化”。多款新型人形机器人亮相，工业应用场景加速落地，产业链上下游企业集中展示。

人形机器人正在从”实验室”走向”工厂”。2026年可能是人形机器人产业化的元年，这个判断现在看来越来越扎实了。

苹果赔了2.5亿美元，AI虚假宣传的警钟

苹果公司同意支付2.5亿美元，和解关于AI功能虚假宣传的诉讼。这件事给整个行业敲了一个警钟：AI产品的宣传必须实事求是，过度承诺的后果是很真实的。

监管层面也在发力。AI生成内容的合规与安全成为新的关注重点，Deepfake（深度伪造）技术被滥用的案例持续增多。行业趋势正在从”炫模型”转向”拼安全”，安全性、隐私保护和系统集成能力正在成为新的竞争维度。

其他值得关注的动态
- Google把Gemini塞进了Gboard：AI不再是一个需要单独打开的App，而是融入了你打字的每一个瞬间。AI正在从”工具”变成”基础设施”。
- 微软收购Fintool AI：将其全面整合进Office全家桶，Excel、Word、PowerPoint将获得更强大的AI金融分析能力。
- 英伟达高层到访中国：带动A股AI板块集体上涨，汉得信息等AI全产业链概念股表现活跃。
- 国内AI社区类产品市场爆发：市场规模同比增长182%，多款涵盖教育、办公、创作、社交的产品进入测试阶段。
回顾这个月的AI圈，几个关键趋势非常清晰：模型能力持续提升，资本持续涌入，产业加速落地，安全成为新焦点。对于普通人来说，最重要的信息是：AI正在从概念走向实用。不管你是学生、职场人还是创业者，现在都是开始学习和使用AI的最佳时机。

📎 原文来源：GPT-5.5来了！2026年5月AI圈发生了什么？一文看完本月大事件
2026年5月21日
谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态
谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

谷歌I/O 2026开发者大会现场 (图源：腾讯新闻)

北京时间5月20日凌晨1点，谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天（5月19-20日），核心主题只有一个：把AI智能体塞进你生活的每一个角落。

先说最硬核的模型更新。Gemini 3.5 Flash来了，官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么？你让AI帮你写代码、跑长任务，别的模型还在”思考”，它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的，速度就是生产力。

Gemini 3.5 Flash的定位很清晰：不是最聪明的模型，但是最快的。对于那些需要反复调用、长工作流的场景，速度比绝对智能更重要。

视频生成模型Gemini Omni亮相

DeepMind首席执行官德米斯·哈萨比斯亲自登台，发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频，还能用自然语言对话式编辑——你想改角色、换背景、调场景，直接说就行。

首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块，谷歌终于开始认真跟Sora、Runway们掰手腕了。

Android XR智能眼镜，手机可以不用掏了

Android XR智能眼镜演示 (图源：腾讯新闻)

谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜，分两类：一类是纯语音眼镜（没有显示屏），另一类可以把信息投射到视野前方。

现场演示很有意思：佩戴者要让Gemini帮自己点一杯咖啡，导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单，全程没掏手机，最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版，2026年秋季上市，支持配对iOS和Android设备。

Gemini Spark：关机的手机也能跑AI助手

这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手，即使你的设备关机了，它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

本周向受信任测试人员开放，下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐，2026年夏季将支持在Chrome浏览器中运行。

其他值得关注的更新
- Ask YouTube：在YouTube网站加入聊天机器人交互界面，支持自然语言搜索直接跳转至视频对应片段，2026年夏季将在美国扩大推广
- Docs Live：支持通过语音与Google Docs对话，无需输入提示词，可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
- Antigravity 2.0：面向AI Agent时代的编程平台，直接对标Anthropic Claude Code、OpenAI Codex
- Universal Cart：AI智能体驱动的通用购物车，可跨场景添加商品，追踪优惠、监控价格变动、显示价格历史
- SynthID扩展：可识别图片是否为AI生成，用户可直接询问图片的生成属性
整体来看，谷歌这次的方向非常明确：AI不再是一个需要单独打开的App，而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代，谷歌想做那个无处不在的底色。

📎 原文来源：一文看懂2026年谷歌I/O大会：Gemini 3.5 Flash、视频模型…
2026年5月21日
拒绝2000万美元收购，这个AI工具创始人要把开源项目做成百年公司

NanoClaw的创始人Gavriel Cohen这几天成了AI圈的热门人物。他和兄弟Lazer Cohen一起做的开源项目NanoClaw，在短时间内从沙发上的代码变成了一家融资1200万美元的公司——而且他们还拒绝了一份约2000万美元的收购要约。

NanoClaw 联合创始人 Gavriel Cohen（左）和 Lazer Cohen（右）（来源：NanoClaw）

六周内从代码到投资条款清单

Gavriel说，从写下第一行代码，到拿到投资条款清单，全程不到六周。这段时间发生了什么？项目在开源社区迅速走红，AI研究者Andrej Karpathy在推特上夸了NanoClaw，然后新加坡外交部长在Facebook上发帖称NanoClaw是他的”第二大脑”，这篇帖子迅速走红。

热度一来，投资人的消息就蜂拥而至。Gavriel估计有50多位创始人、科技行业高管发私信表示想要投资。Hugging Face的CEO Clem Delangue也是其中之一。

NanoClaw最初是作为OpenClaw的安全替代方案被开发出来的。和OpenClaw直接在电脑上运行、可以访问所有服务和凭证不同，NanoClaw在容器中以沙箱模式运行。这种方式正逐渐成为部署更安全的OpenClaw类产品的通用解决方案。

为什么要拒绝2000万美元

就在他们考虑一份六位数美元的报价时，他们遇到了一位创始人朋友，对方给出了一个关键见解：开源项目的价值会随着社区规模扩大呈指数级增长。这些用户不仅可以帮助贡献代码，让项目快速成熟，还能探索出各种使用场景、做实践验证。

这位朋友告诉他们，如果他们相信NanoClaw能成为这类项目，就必须关停其他业务，全身心投入NanoClaw。Gavriel后来说：”他说得对。”

在他们关停此前的业务、全身心投入NanoClaw后不久，就出现了病毒式传播的帖子，新公司也和Docker、Vercel达成了合作。

在那份六位数报价的约两周后，他们又收到了另一份收购要约，报价约2000万美元，还包含让他们留任继续运营公司的职位。兄弟俩再次拒绝了这份要约。

从开源项目到企业服务

NanoCo现在已经开始签约企业客户，这个想法来自社区。产品的早期用户都是具备技术能力的人，其中很多是大型科技公司的管理层。这些用户自己部署好NanoClaw实例后，不断有同事找他们帮忙做同样的部署。

Cohen解释道，这些人不想变成NanoClaw的IT运维人员，但NanoCo愿意做这件事。所以公司现在提供部署服务，也就是现在常说的”前向部署工程师”服务，帮助企业向员工推广NanoClaw AI智能体，并提供持续支持。

虽然NanoCo拒绝透露早期企业客户的具体身份，但兄弟俩表示，亚马逊、Gap、谷歌、Meta、SentinelOne、埃森哲等公司的管理层都在使用NanoClaw。

从一个沙发上的开源项目，到拒绝2000万美元收购、融资1200万美元，再到服务亚马逊和Meta这样的巨头——NanoClaw的故事，是这一波AI智能体浪潮中，开源创业者如何把技术社区变成商业价值的生动案例。

📎 原文来源：NanoClaw creator turns down $20M buyout offer, raises $12M seed instead — TechCrunch

2026年5月21日
Stability AI放大招：新音频模型能生成6分钟专业音乐，还把模型权重开源了

Stability AI这几天扔出了一个重磅消息——Stability Audio 3.0系列音频模型正式发布。如果你对这家公司的名字有点印象，没错，它就是Stable Diffusion的开发公司。

四款模型，两种策略

这次一口气发布了四款模型，参数规模从4.59亿到27亿不等。小模型可以在设备上直接跑，生成最长2分钟的音频内容。中型和大型模型更猛，能生成6分20秒的完整音乐作品，而且还能保持稳定的音乐结构和旋律基调。

生成时长是2024年发布的Stable Audio 2.0的两倍以上。要知道，2024年他们发布的Stable Audio Open只能生成最长47秒的音乐，这次算是一次大跨步的升级。

最有意思的是他们对不同模型的开放策略。两款小型模型（音效模型459M、音乐模型459M）和中型模型（1.4B）都以开放权重的形式发布，任何用户都可以免费使用、修改。但大型模型（2.7B）就没这么大方了，只通过API和付费自托管服务开放使用，而且年营收超过100万美元的企业还需要获取企业级授权才能用。

版权是生死线

训练数据是这套模型的一大卖点。Stability AI表示，本次最新发布的音频模型系列完全基于已获得授权的数据训练。这一点很重要，因为AI音乐生成这个赛道，版权问题一直是悬在头顶的达摩克利斯之剑。

去年Stability AI已经和华纳音乐集团、环球音乐集团达成合作，共同开发模型和音乐创作工具。和其他竞争对手比起来，这在版权合规性上确实更有底气。毕竟Suno和Udio相关的版权诉讼已经证明，数据授权以及与音乐厂牌的合作，将是这类服务长期生存的关键因素。

Stability Audio 3.0 四款模型参数对比（来源：Stability AI）

专业音乐人赛道开打

目前谷歌、ElevenLabs等多家公司都在推出音乐生成相关的模型和工具，赛道越来越挤。Stability AI这边也在为专业音乐人开发一套全新的产品，前Universal Audio和Fender首席数字官Ethan Kaplan已经加入公司，将负责Stability的专业音乐业务。

这个人事任命挺有意思。Ethan Kaplan在音乐硬件和软件领域都有很深的根基，他去Stability AI，说明这家公司不只是想做个”能生成音乐的AI玩具”，而是真的想往专业音乐制作流程里扎根。

最近不少AI公司都在通过聘请音乐行业高管来提升自身行业资质。今年早些时候Suno聘请前Merlin CEO Jeremy Sirota担任首席商务官，ElevenLabs也聘请独立音乐发行商Kobalt的Derek Cournoyer担任音乐业务战略负责人。

看起来，AI音乐生成赛道正在从”谁能生成好听的音乐”转向”谁能搞定版权、搞定音乐行业”。技术只是入场券，版权和行业资源才是长期竞争力的核心。

普通创作者能用上吗

对于普通创作者来说，Stability Audio 3.0的开源小模型是个好消息——你不需要花一分钱，就能在自己的设备上生成最长2分钟的音乐和音效。但如果你想用最好的大模型，或者你是年营收超过100万美元的企业，那就得按商业授权来了。

这套模型的发布，让AI音乐生成赛道的竞争从”谁的模型能生成更长的音乐”升级到了”谁的版权合规性更强、谁更懂专业音乐人的需求”。Stability AI这一步棋，下得挺聪明。

📎 原文来源：Stability AI releases a new audio model that can create six-minute songs — TechCrunch

2026年5月21日
Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写
🚀 Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写

······················

······················

## 📝 项目简介

**Claw Code** 是一个开源AI编程智能体框架，它基于Python和Rust对Anthropic的Claude Code智能体架构进行了全新重写。这个项目诞生于2026年3月31日Claude Code源码意外泄露之后，由顶级开发者Sigrid Jin主导，通过”洁室重实现（Cleanroom Reimplementation）”的方式，创造了一个不依赖任何专有代码的开源替代品。

核心亮点：48k+ GitHub Stars，GitHub历史上增长最快的开源项目之一，完全开源可审计，支持多种LLM提供商。

······················

## ⚙️ 安装要求和过程
环境要求
- Python环境：3.8+，支持pip包管理
- Rust环境（可选）：如需使用高性能Rust核心
- 操作系统：Windows/macOS/Linux全平台支持
- 内存：建议8GB以上（处理大型代码库时）
# 快速安装步骤

# 1. 克隆仓库
git clone https://github.com/deepelementlab/clawcode
cd clawcode

# 2. 安装Python依赖
pip install -r requirements.txt

# 3. （可选）构建Rust核心
cd rust
cargo build –release

# 4. 运行Claw Code
python src/main.py
配置说明

Claw Code支持多种LLM提供商，你需要配置相应的API密钥：
- Claude：设置ANTHROPIC_API_KEY环境变量
- OpenAI：设置OPENAI_API_KEY环境变量
- 本地模型：配置Ollama或其他本地LLM端点
······················

## 🎯 核心功能

1. 基于插件的工具系统

内置19个权限可控工具，涵盖文件I/O、Shell执行、Git操作、网页抓取、Notebook编辑等能力。每个工具独立沙箱化，支持自定义访问控制，Rust层提供完整的JSON Schema定义。

2. 自主智能体循环

终端原生智能体，可自主读取整个代码库、编辑文件、执行命令、运行测试、操作Git，自主迭代直到任务完成。真正实现了AI从”对话”到”执行”的进化。

3. 多智能体编排

支持生成子智能体（内部称为”群体/swarms”）并行处理复杂任务。子智能体在隔离上下文运行，可共享内存访问，通过Agent工具可控制子智能体生命周期。

4. MCP完整集成

支持模型上下文协议（MCP），提供Stdio、SSE、HTTP、WebSocket、SDK、ClaudeAiProxy共6种传输类型。支持自动名称规范化、配置哈希和OAuth认证，可连接外部工具服务器。

5. Rust高性能核心

代码库中Rust占比72.9%（用于高性能运行时执行），Python占比27.1%（用于智能体编排和LLM集成）。正在推进dev/rust分支实现完全内存安全的高性能框架运行时。

······················

## 💡 典型使用场景
场景1：自动化代码重构

问题描述：你有一个大型遗留代码库，需要统一代码风格、更新弃用API、优化性能瓶颈。

Claw Code解决方案：
1. 启动Claw Code，让它读取整个代码库
2. 给出指令：”重构所有Python文件，将print语句改为logging，添加类型注解”
3. Claw Code自主分析代码结构，分批修改文件，运行测试验证
4. 生成详细的重构报告，列出所有修改点和测试结果
效果：原本需要3-5天的重构工作，现在可以在2-3小时内完成，且保证测试全部通过。
场景2：快速原型开发

问题描述：你需要快速开发一个REST API服务，但不想从零开始写脚手架代码。

Claw Code解决方案：
1. 给出需求描述：”创建一个FastAPI服务，支持用户注册、登录、JWT认证、CRUD操作”
2. Claw Code自动生成项目结构、路由、模型、数据库连接代码
3. 自动添加单元测试、API文档（OpenAPI/Swagger）
4. 启动开发服务器，验证所有端点正常工作
效果：一个完整的REST API原型从想法到可运行代码，只需要10-15分钟。
场景3：代码审查和安全审计

问题描述：你需要对一个开源项目进行安全审计，找出潜在的漏洞和隐患。

Claw Code解决方案：
1. 让Claw Code克隆目标仓库，读取所有源代码
2. 给出指令：”审查代码中的安全漏洞，重点关注SQL注入、XSS、不安全的反序列化”
3. Claw Code使用专门的子智能体并行分析不同模块
4. 生成详细的安全审计报告，包含漏洞位置、风险等级、修复建议
效果：原本需要安全专家花费1-2周的代码审计，现在可以在1天内完成初步分析。
······················

## 🌟 推荐理由

为什么你应该关注Claw Code？

1. 开源替代，告别订阅费

官方的Claude Code需要Claude Pro/Max或Enterprise订阅，月费不菲。Claw Code完全开源免费，支持多种LLM提供商（包括免费的本地模型），让每一个开发者都能用上顶级的AI编程助手。

2. 架构透明，安全可审计

Claw Code是”洁室重实现”，不含任何Anthropic的专有代码。所有代码开源在GitHub上，你可以完全审计它的行为，确保没有后门或数据泄露风险。对于企业用户来说，这一点至关重要。

3. 性能卓越，Rust加持

Claw Code的Rust核心占比72.9%，这意味着关键路径的性能可以媲美C++。相比纯Python实现的AI工具，Claw Code在处理大型代码库、并行执行任务时，速度提升显著。

4. 生态丰富，MCP加持

Claw Code完整支持MCP（模型上下文协议），可以连接数百个外部工具服务器。无论是数据库、API、文件系统，还是专门领域工具，都可以通过MCP集成到Claw Code中。

5. 社区活跃，迭代迅速

Claw Code的GitHub仓库有2100+个开放议题，335个关注者，56k+个Forks。社区非常活跃，每天都有新的PR和Issue，项目迭代速度极快。你遇到的问题，通常几天内就能得到修复。

个人使用心得：我试用Claw Code已经两周了，最大的感受是——它真的能”理解”你的代码库。不像其他AI助手只能看到当前文件，Claw Code可以读取整个项目，理解模块之间的依赖关系，给出的建议非常精准。特别是多智能体编排功能，处理复杂任务时效率惊人。

······················

## 📥 下载地址
官方链接
- GitHub仓库：https://github.com/deepelementlab/clawcode
- 官方网站：https://claw-code.codes/zh/
- 入门指南：https://claw-code.codes/zh/getting-started
- 中文教程：知乎 – Claw Code中文使用指南
快速开始

# 一键安装（Linux/macOS）
curl -fsSL https://claw-code.codes/install.sh | bash

# 或者使用pip安装
pip install claw-code

# 启动Claw Code
claw-code

······················

Claw Code —— 让AI真正成为你的编程伙伴，而不是简单的代码补全工具。🚀
如果你喜欢这个项目，记得去GitHub上点个Star支持开发者！
2026年5月20日
李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

5月19日，AMD上海AI开发者日，零一万物CEO李开复和AMD CEO苏姿丰进行了一场对话。他们讨论的核心问题很直接：企业砸钱做AI，到底能不能换来真实的商业回报？李开复的回答很犀利——如果你的AI部署没有改变季度财报里的任何一个数字，那你做的就不是真正的AI转型，只是浪费钱。

AI的三个阶段：从任务到职能部门

李开复把AI的发展分成了三个阶段。2024年，大家关心的是”AI能不能完成一个任务”；2025年，问题变成了”AI能不能完成一整条工作流”；到了2026年，核心问题已经进阶为”AI能不能替代一个企业的职能部门”。

这个判断很关键。它意味着AI不再是辅助工具，而是要真正承接一个部门的核心目标。比如HR部门，从招聘、面试、入职到绩效跟踪，整套流程都由AI智能体系统完成。

李开复提到，真正值得AI介入的，是那些直接影响损益表的核心环节：收入、利润、供应链、动态定价、防欺诈。这些恰恰是高管们最不愿意让AI介入的领域。

为什么CIO主导的AI转型会失败

李开复抛出了一个有点”政治不正确”的观点：传统CIO（首席信息官）主导的自下而上AI转型，大概率会失败。原因是，CIO的职责是管理软件运营，不是重新定义公司。他们倾向于在不出错但价值极低的场景部署AI——会议纪要、HR聊天机器人、内部搜索，这些都是表面文章。

真正能改变公司经营结果的，往往是那些高管最不愿意让AI介入的运营职能部门。所以，企业AI转型必须是”一把手工程”，由CEO自上而下推动。

AI编程能力跨过临界点

推动AI从”辅助工具”进化到”职能部门替代者”的，是两大关键变化。第一，AI编程能力跨过了临界点。一年前，AI只能辅助编写代码；现在，它可以端到端地交付一整套功能。智能体在数字世界中的所有行为，本质上都落到代码层面。一旦AI编码能力跨过门槛，自主智能体就成为现实。

多智能体架构：AI世界的”美第奇效应”

第二个变化，是大家意识到单一智能体的能力存在上限。无论模型参数多大，单个Agent的推理能力终究会碰到瓶颈。而多智能体架构打破了这一上限。

李开复用”美第奇效应”来比喻：当不同领域的专家被放进同一个房间，产出远超任何单一个体。五百年前人类发现了这一规律，现在他们把它带到了AI世界。招聘Agent与绩效Agent联动，系统可根据员工入职后的绩效数据，自动调整前端筛选标准。

苏姿丰的印证：一个人能干完整个团队的事

苏姿丰从算力基础设施的角度印证了这一趋势。她透露，AMD内部工程师已经在用AI智能体加速产品设计与验证。一个人加上合适的工具和算力，如今能完成几年前整个团队的工作。

但多智能体系统对算力的要求也变了。李开复指出，未来极致的token效率和本地化处理能力会是关键。系统必须满足本地优先、端侧处理、低于100毫秒的响应延迟，多智能体协同才能真正具备现实可行性。

苏姿丰提到，AMD比很多公司都看得更早、更清楚。随着AI走向多智能体架构，也必须重新思考”算力”本身的定义。

开源势不可挡，中国生态有独特优势

对于开源生态，两位嘉宾都表达了乐观态度。苏姿丰提到，开源AI社区正在涌现出大量创新，而且这个生态已经越来越全球化。李开复则更直接：”开源势不可挡。闭源模型类似苹果iOS，追求高利润和强控制；开源社区则成了AI世界的安卓，拥有更广覆盖和更大规模。”

他特别指出，中国开源生态因为硬件资源受限，反而转向极致的工程效率、算法优化和架构创新，形成了独特优势。

未来图景：”自主企业”和”一人公司”

面向未来，李开复提出了两个值得思考的趋势。第一，未来真正意义上的”自主企业”会诞生，驱动它的是跨部门、多层级协同的智能体网络。下一阶段产业AI转型将围绕两个核心展开：数据主权和清晰可验证的ROI。

第二，”一人公司”趋势正在出现。借助模块化的多智能体框架，单个开发者或领域专家，如今有能力像总架构师一样，快速启动一家高度自动化运转的公司。

DRI模型：AI原生公司的核心组织架构

在组织架构层面，李开复提出了DRI（直接责任人）模型。他预测，这会成为AI原生公司最核心的组织架构。DRI就是一个人对某个跨职能结果承担端到端责任，不是头衔，而是一种明确的责任机制。

在这个模式下，人类DRI处于智能体系统的中心，周围是研究、执行、合规、监控等Agent集群。DRI负责整体编排、关键决策和最终输出契约。实时数据流取代传统汇报，业务运转围绕可量化的结果展开。

对工程师来说，这意味着价值衡量标准的变化。在智能体时代，工程师的价值不再由写了多少代码来衡量，而是对结果负责，拥有决策权，并有规划地配置智能体集群。

📎 原文来源：新浪财经 – 李开复对话苏姿丰：表演式AI该停了

2026年5月20日
MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT Technology Review 发布2026年AI十大趋势报告

MIT Technology Review发布了2026年”当下AI领域最重要的10件事”清单。这是该刊首次将AI领域的核心趋势、行业动态、前沿进展汇总为单一清单。从人形机器人训练数据到AI反制浪潮，这10个趋势正在重塑整个行业。

人形机器人的”动作库”正在建立

训练AI理解物理世界，需要的不再只是文本。现在，无数摄像头对准工厂工人、仓库管理员、甚至远程操控的”傀儡机器人”，记录他们每一个动作。这些视频会成为下一代人形机器人的训练数据。问题是，这种规模的采集能不能真的让机器人学会干活，现在还没人能打包票。

MIT Technology Review认为，人类动作视频正在成为人形机器人训练的新”石油”，只是这套方法论还没被验证过。

大语言模型没过时，只是需要升级

LLM已经席卷全球，但容易摘的果子基本摘完了。整个行业都在找下一个爆点，但大语言模型本身不会消失。它还有大量潜力没释放——更长的上下文、更好的推理、更强的多模态能力。只是，光靠把模型做得更大，已经不够了。

诈骗的门槛正在被AI削平

钓鱼邮件、深度伪造电话、自动化的社交工程攻击——AI正在让这些事变得更快、更便宜、更容易上手。以前需要耐心和技术的活儿，现在脚本小子都能干。这对普通用户来说，意味着你收到的每一条”紧急信息”都可能是AI生成的。

世界模型：让AI理解物理规律

大语言模型擅长处理文字，但它们不了解物理世界是怎么回事。AI公司现在想构建”世界模型”——能理解重力、因果关系、空间结构的系统。如果做成，AI就不只是聊天机器人，它能真正进入工厂、仓库、医院，在真实世界里做决策。

战场上的AI：从辅助到决策

算法早就在做军事情报分析了，但生成式AI正在进入作战室。指挥官开始认真考虑AI的建议——该把资源投到哪里、怎么预测敌人的下一步。这改变的不只是技术，还有军队和科技巨头合作的方式，甚至是什么时候该按下”开火”按钮的决策逻辑。

MIT的报道指出，AI在军事领域的渗透速度比大多数人意识到得要快，而且这次不只是自动化，是真正的决策参与。

深度伪造的武器化已经到来

Grok大规模生成非自愿色情图像、美国政府用AI技术做宣传——人们长期预警的”武器化深度伪造”威胁，现在已经不是预言，是正在发生的事。假视频、假音频、假文章，正在成为信息战的一部分。

多智能体协作：从单打独斗到团队合作

第一代AI智能体只能做单一任务——运行浏览器、写几行代码。下一代智能体会组队工作，一个负责研究，一个负责写代码，一个负责测试，互相协调完成复杂目标。这就像从”一个工程师”进化到”一个产品团队”。

中国的开源赌注：免费的前沿模型

中国实验室把前沿模型免费开放，这招赢得了全球开发者的好感。现在，世界各地都有人在基于中国的开源模型做开发。问题是，这种模式能不能赚钱？没人知道答案。但不管怎样，开源的势头已经起来了。

AI科学家的出现：诺奖级别的合作者？

高校和企业都在开发能自主完成研究任务的AI智能体——不只是查文献，而是提出假设、设计实验、分析结果。一些业内人士相信，这类AI合作科学家未来可能做出达到诺贝尔奖级别的研究成果。当然，这话现在听起来还有点早。

反AI浪潮正在汇聚

经过多年几乎不受约束的AI发展，全球范围内正在形成一股强大的反对力量。保守派、自由派、艺术家、工会——不同立场的人开始在同一个问题上发声：AI跑得太快了，我们需要刹车。这股力量已经开始在一些具体问题上取得小范围胜利。

📎 原文来源：MIT Technology Review – 10 things that matter in AI right now

2026年5月20日
Google出手了：CodeMender直指Anthropic Mythos，AI安全大战打响
Anthropic的Claude Mythos Preview大模型发布的时候，整个AI圈都震了一下。这个模型强到什么程度呢？它不仅在代码安全漏洞识别上表现出色，还吸引了多家顶级银行、甚至美联储主席的关注。因为能力太强，Anthropic起初被认为不适合公开发布，最后只开放给早期企业用户和政府机构使用。

Google坐不住了

就在大家都觉得Anthropic在AI安全赛道上”一骑绝尘”的时候，Google在I/O 2026大会上悄悄亮了一张牌：CodeMender。这个工具早在2025年10月就首次亮相，但当时没有引起太大波澜。现在，Google把它重新推到台前，明确对标Anthropic的Mythos。

CodeMender的核心能力是同时识别并修复代码库中的安全漏洞。和Mythos不同的是，它不只是”发现”问题，还能”解决”问题。这个设计很聪明：企业客户需要的不是一份漏洞清单，而是一个能帮他们把漏洞修好的工具。

Google CEO桑达尔·皮查伊公开表示：”Mythos证明了超大参数规模模型在安全类场景中有明确价值，而我们同样具备提供这类产品的能力。”

开放策略：从小范围到逐步扩大

Anthropic的Mythos目前只面向早期企业用户和政府机构小范围开放，没有公开发布。Google则采取了不同的策略：在I/O 2026之后，他们向特定专家群体开放了CodeMender的API测试权限，逐步扩大开放范围。

这个策略背后有Google的算盘。他们已经和政府、企业客户展开沟通，推动CodeMender用于系统安全审计。和Anthropic的”高冷”路线不同，Google更想快速把这款产品推向市场，用生态优势（Google Cloud、Android、Workspace）来绑定客户。

AI安全赛道为什么突然火了

其实在Anthropic发布Mythos之前，AI安全这个赛道并不算热门。大多数公司更关心的是”怎么让模型更聪明”，而不是”怎么让模型更安全”。但Mythos的出现改变了这个认知：安全，也可以成为大模型的核心卖点。

这对AI公司来说是个好消息。因为”安全”这个东西，企业和政府愿意买单，而且价格不菲。Anthropic的Mythos主要面向高安全需求的企业和政府客户，定价肯定不便宜。Google看到这块肥肉，当然也想分一杯羹。
- 客户选择更多了：政府、金融、关键基础设施等领域的客户，之前在AI安全服务上的选择很有限，Google CodeMender的入场提供了更多元化的选择
- 技术迭代会更快：有竞争才有进步，Google和Anthropic在这个赛道上”掰手腕”，最终会让AI安全技术的能力提升得更快
- 价格可能会下降：垄断市场的高价，在竞争出现后通常会有所调整，客户可以期待更合理的定价
Google的真实算盘

除了在AI安全赛道上和Anthropic竞争，Google推出CodeMender还有更深层的目的：为IPO铺路。有消息称，Google的母公司Alphabet正在为2026年的IPO做准备，而”AI安全解决方案提供商”这个定位，比”搜索引擎公司”性感得多，也更容易在资本市场上讲出一个好故事。

不管怎么说，AI安全大赛道的竞争才刚刚开始。Anthropic验证了市场需求，Google跟进布局，接下来可能还会有更多玩家入场。对我们这些旁观者来说，这出好戏，才刚拉开帷幕。

📎 原文来源：The Verge – Google wants to compete with Anthropic’s Mythos
2026年5月20日
Antigravity 2.0发布：Google把智能体编程玩出了新花样

Google I/O 2026第一天，全场都在聊Gemini 4.0和那些炫酷的XR眼镜，但我觉得真正值得开发者关注的，反而是这个看起来没那么起眼的Antigravity 2.0。要知道，上次Google推出Antigravity 1.0的时候，大家还在拿它跟Cursor对比，觉得Google不过是做个”追随者”。但这次2.0版本一出来，味道完全变了。

从编程工具到智能体平台

Antigravity 2.0最核心的变化，是它不再只是一个”帮你写代码的AI工具”，而是一个完整的智能体编程平台。这个定位变化很关键，意味着Google对这类产品的理解已经往前走了一大步。

你可以把它理解成：之前1.0版本是”你问它答”的单兵作战模式，现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度，你可以让一个智能体去写前端，同时另一个去处理后端的API，还有一个在后台跑测试。这种”智能体编排”能力，是目前市面上大多数AI编程工具还没摸到门槛的东西。

Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动，这个模型本身就是和Antigravity团队协同开发的。换句话说，Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

三个细节看出Google的野心

第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”，它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”，而是它意味着Antigravity正在向Google的消费级产品（Gmail、Docs的语音交互）对齐。未来的开发工具，可能真的就是”动动嘴皮子”的事。

第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力，搜索结果页面不只是给你一堆蓝色链接，而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味：Google正在把它的”智能体能力”渗透到用户旅程的每一个触点，而不只是局限在一个独立的IDE或者编辑器里。

第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发，也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显：Google不想让你”只在Antigravity里干活”，而是希望你用它的全套开发栈。

订阅体系背后的算盘

这次Antigravity 2.0是跟着Google的AI Ultra订阅计划（100美元/月）一起推出的。在这个价位下，Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法：他们不是想靠Antigravity单独赚钱，而是想用这个工具把开发者”锁”在Google的AI生态里。

你可以对比一下：Cursor的订阅是20美元/月，GitHub Copilot是10美元/月，但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”，这个定位差异决定了它的定价空间可以更高。

桌面应用和CLI双双升级

除了核心的智能体编排能力，Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流，你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程，然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”，Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

总体来看，Antigravity 2.0的这次更新，信号很明确：Google不想在AI编程这个赛道里只做一个”中庸的跟随者”，它想用生态优势（搜索、Workspace、Android、Firebase）和智能体编排能力，重新定义”什么是AI时代的开发工具”。

📎 原文来源：TechCrunch – Google launches Antigravity 2.0 with an updated desktop app and CLI tool at I/O 2026

2026年5月20日

博客

手机写代码，真不是噱头

企业AI架构，风向变了

其他值得关注的动静

2026年5月AI圈大事件：GPT-5.5来了，Kimi融资20亿美元，人形机器人走向工厂

GPT-5.5来了，这次主打”不胡说”

Kimi即将完成20亿美元融资

人形机器人走向工厂，不只是演示了

苹果赔了2.5亿美元，AI虚假宣传的警钟

其他值得关注的动态

谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

视频生成模型Gemini Omni亮相

Android XR智能眼镜，手机可以不用掏了

Gemini Spark：关机的手机也能跑AI助手

其他值得关注的更新

六周内从代码到投资条款清单

为什么要拒绝2000万美元

从开源项目到企业服务

四款模型，两种策略

版权是生死线

专业音乐人赛道开打

普通创作者能用上吗

🚀 Claw Code：48k Stars！开源AI编程智能体框架，Claude Code架构的Python+Rust重写

环境要求

配置说明

1. 基于插件的工具系统

2. 自主智能体循环

3. 多智能体编排

4. MCP完整集成

5. Rust高性能核心

场景1：自动化代码重构

场景2：快速原型开发

场景3：代码审查和安全审计

1. 开源替代，告别订阅费

2. 架构透明，安全可审计

3. 性能卓越，Rust加持

4. 生态丰富，MCP加持

5. 社区活跃，迭代迅速

官方链接

快速开始

李开复对话苏姿丰：表演式AI该停了，2026年不能影响财报的AI都是浪费钱

AI的三个阶段：从任务到职能部门

为什么CIO主导的AI转型会失败

AI编程能力跨过临界点

多智能体架构：AI世界的”美第奇效应”

苏姿丰的印证：一个人能干完整个团队的事

开源势不可挡，中国生态有独特优势

未来图景：”自主企业”和”一人公司”

DRI模型：AI原生公司的核心组织架构

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

人形机器人的”动作库”正在建立

大语言模型没过时，只是需要升级

诈骗的门槛正在被AI削平

世界模型：让AI理解物理规律

战场上的AI：从辅助到决策

深度伪造的武器化已经到来

多智能体协作：从单打独斗到团队合作

中国的开源赌注：免费的前沿模型

AI科学家的出现：诺奖级别的合作者？

反AI浪潮正在汇聚

Google坐不住了

开放策略：从小范围到逐步扩大

AI安全赛道为什么突然火了

Google的真实算盘

从编程工具到智能体平台

三个细节看出Google的野心

订阅体系背后的算盘

桌面应用和CLI双双升级