博客

  • 谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态






    谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态

    谷歌I/O 2026大会
    谷歌I/O 2026开发者大会现场 (图源:腾讯新闻)

    北京时间5月20日凌晨1点,谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天(5月19-20日),核心主题只有一个:把AI智能体塞进你生活的每一个角落。

    先说最硬核的模型更新。Gemini 3.5 Flash来了,官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么?你让AI帮你写代码、跑长任务,别的模型还在”思考”,它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的,速度就是生产力。

    Gemini 3.5 Flash的定位很清晰:不是最聪明的模型,但是最快的。对于那些需要反复调用、长工作流的场景,速度比绝对智能更重要。

    视频生成模型Gemini Omni亮相

    DeepMind首席执行官德米斯·哈萨比斯亲自登台,发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频,还能用自然语言对话式编辑——你想改角色、换背景、调场景,直接说就行。

    首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块,谷歌终于开始认真跟Sora、Runway们掰手腕了。

    Android XR智能眼镜,手机可以不用掏了

    Android XR智能眼镜
    Android XR智能眼镜演示 (图源:腾讯新闻)

    谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜,分两类:一类是纯语音眼镜(没有显示屏),另一类可以把信息投射到视野前方。

    现场演示很有意思:佩戴者要让Gemini帮自己点一杯咖啡,导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单,全程没掏手机,最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版,2026年秋季上市,支持配对iOS和Android设备。

    Gemini Spark:关机的手机也能跑AI助手

    这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手,即使你的设备关机了,它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

    本周向受信任测试人员开放,下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐,2026年夏季将支持在Chrome浏览器中运行。

    其他值得关注的更新

    • Ask YouTube:在YouTube网站加入聊天机器人交互界面,支持自然语言搜索直接跳转至视频对应片段,2026年夏季将在美国扩大推广
    • Docs Live:支持通过语音与Google Docs对话,无需输入提示词,可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
    • Antigravity 2.0:面向AI Agent时代的编程平台,直接对标Anthropic Claude Code、OpenAI Codex
    • Universal Cart:AI智能体驱动的通用购物车,可跨场景添加商品,追踪优惠、监控价格变动、显示价格历史
    • SynthID扩展:可识别图片是否为AI生成,用户可直接询问图片的生成属性

    整体来看,谷歌这次的方向非常明确:AI不再是一个需要单独打开的App,而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代,谷歌想做那个无处不在的底色。


  • 拒绝2000万美元收购,这个AI工具创始人要把开源项目做成百年公司

    NanoClaw的创始人Gavriel Cohen这几天成了AI圈的热门人物。他和兄弟Lazer Cohen一起做的开源项目NanoClaw,在短时间内从沙发上的代码变成了一家融资1200万美元的公司——而且他们还拒绝了一份约2000万美元的收购要约。

    NanoClaw 联合创始人合影
    NanoClaw 联合创始人 Gavriel Cohen(左)和 Lazer Cohen(右)(来源:NanoClaw)

    六周内从代码到投资条款清单

    Gavriel说,从写下第一行代码,到拿到投资条款清单,全程不到六周。这段时间发生了什么?项目在开源社区迅速走红,AI研究者Andrej Karpathy在推特上夸了NanoClaw,然后新加坡外交部长在Facebook上发帖称NanoClaw是他的”第二大脑”,这篇帖子迅速走红。

    热度一来,投资人的消息就蜂拥而至。Gavriel估计有50多位创始人、科技行业高管发私信表示想要投资。Hugging Face的CEO Clem Delangue也是其中之一。

    NanoClaw最初是作为OpenClaw的安全替代方案被开发出来的。和OpenClaw直接在电脑上运行、可以访问所有服务和凭证不同,NanoClaw在容器中以沙箱模式运行。这种方式正逐渐成为部署更安全的OpenClaw类产品的通用解决方案。


    为什么要拒绝2000万美元

    就在他们考虑一份六位数美元的报价时,他们遇到了一位创始人朋友,对方给出了一个关键见解:开源项目的价值会随着社区规模扩大呈指数级增长。这些用户不仅可以帮助贡献代码,让项目快速成熟,还能探索出各种使用场景、做实践验证。

    这位朋友告诉他们,如果他们相信NanoClaw能成为这类项目,就必须关停其他业务,全身心投入NanoClaw。Gavriel后来说:”他说得对。”

    在他们关停此前的业务、全身心投入NanoClaw后不久,就出现了病毒式传播的帖子,新公司也和Docker、Vercel达成了合作。

    在那份六位数报价的约两周后,他们又收到了另一份收购要约,报价约2000万美元,还包含让他们留任继续运营公司的职位。兄弟俩再次拒绝了这份要约。


    从开源项目到企业服务

    NanoCo现在已经开始签约企业客户,这个想法来自社区。产品的早期用户都是具备技术能力的人,其中很多是大型科技公司的管理层。这些用户自己部署好NanoClaw实例后,不断有同事找他们帮忙做同样的部署。

    Cohen解释道,这些人不想变成NanoClaw的IT运维人员,但NanoCo愿意做这件事。所以公司现在提供部署服务,也就是现在常说的”前向部署工程师”服务,帮助企业向员工推广NanoClaw AI智能体,并提供持续支持。

    虽然NanoCo拒绝透露早期企业客户的具体身份,但兄弟俩表示,亚马逊、Gap、谷歌、Meta、SentinelOne、埃森哲等公司的管理层都在使用NanoClaw。

    从一个沙发上的开源项目,到拒绝2000万美元收购、融资1200万美元,再到服务亚马逊和Meta这样的巨头——NanoClaw的故事,是这一波AI智能体浪潮中,开源创业者如何把技术社区变成商业价值的生动案例。

  • Stability AI放大招:新音频模型能生成6分钟专业音乐,还把模型权重开源了

    Stability AI这几天扔出了一个重磅消息——Stability Audio 3.0系列音频模型正式发布。如果你对这家公司的名字有点印象,没错,它就是Stable Diffusion的开发公司。

    四款模型,两种策略

    这次一口气发布了四款模型,参数规模从4.59亿到27亿不等。小模型可以在设备上直接跑,生成最长2分钟的音频内容。中型和大型模型更猛,能生成6分20秒的完整音乐作品,而且还能保持稳定的音乐结构和旋律基调。

    生成时长是2024年发布的Stable Audio 2.0的两倍以上。要知道,2024年他们发布的Stable Audio Open只能生成最长47秒的音乐,这次算是一次大跨步的升级。

    最有意思的是他们对不同模型的开放策略。两款小型模型(音效模型459M、音乐模型459M)和中型模型(1.4B)都以开放权重的形式发布,任何用户都可以免费使用、修改。但大型模型(2.7B)就没这么大方了,只通过API和付费自托管服务开放使用,而且年营收超过100万美元的企业还需要获取企业级授权才能用。


    版权是生死线

    训练数据是这套模型的一大卖点。Stability AI表示,本次最新发布的音频模型系列完全基于已获得授权的数据训练。这一点很重要,因为AI音乐生成这个赛道,版权问题一直是悬在头顶的达摩克利斯之剑。

    去年Stability AI已经和华纳音乐集团、环球音乐集团达成合作,共同开发模型和音乐创作工具。和其他竞争对手比起来,这在版权合规性上确实更有底气。毕竟Suno和Udio相关的版权诉讼已经证明,数据授权以及与音乐厂牌的合作,将是这类服务长期生存的关键因素。

    Stability Audio 3.0 模型对比图
    Stability Audio 3.0 四款模型参数对比(来源:Stability AI)

    专业音乐人赛道开打

    目前谷歌、ElevenLabs等多家公司都在推出音乐生成相关的模型和工具,赛道越来越挤。Stability AI这边也在为专业音乐人开发一套全新的产品,前Universal Audio和Fender首席数字官Ethan Kaplan已经加入公司,将负责Stability的专业音乐业务。

    这个人事任命挺有意思。Ethan Kaplan在音乐硬件和软件领域都有很深的根基,他去Stability AI,说明这家公司不只是想做个”能生成音乐的AI玩具”,而是真的想往专业音乐制作流程里扎根。

    最近不少AI公司都在通过聘请音乐行业高管来提升自身行业资质。今年早些时候Suno聘请前Merlin CEO Jeremy Sirota担任首席商务官,ElevenLabs也聘请独立音乐发行商Kobalt的Derek Cournoyer担任音乐业务战略负责人。

    看起来,AI音乐生成赛道正在从”谁能生成好听的音乐”转向”谁能搞定版权、搞定音乐行业”。技术只是入场券,版权和行业资源才是长期竞争力的核心。


    普通创作者能用上吗

    对于普通创作者来说,Stability Audio 3.0的开源小模型是个好消息——你不需要花一分钱,就能在自己的设备上生成最长2分钟的音乐和音效。但如果你想用最好的大模型,或者你是年营收超过100万美元的企业,那就得按商业授权来了。

    这套模型的发布,让AI音乐生成赛道的竞争从”谁的模型能生成更长的音乐”升级到了”谁的版权合规性更强、谁更懂专业音乐人的需求”。Stability AI这一步棋,下得挺聪明。

  • Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    🚀 Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    ······················


    Claw Code Logo

    ······················

    ## 📝 项目简介

    **Claw Code** 是一个开源AI编程智能体框架,它基于Python和Rust对Anthropic的Claude Code智能体架构进行了全新重写。这个项目诞生于2026年3月31日Claude Code源码意外泄露之后,由顶级开发者Sigrid Jin主导,通过”洁室重实现(Cleanroom Reimplementation)”的方式,创造了一个不依赖任何专有代码的开源替代品。

    核心亮点:48k+ GitHub Stars,GitHub历史上增长最快的开源项目之一,完全开源可审计,支持多种LLM提供商。

    ······················

    ## ⚙️ 安装要求和过程

    环境要求

    • Python环境:3.8+,支持pip包管理
    • Rust环境(可选):如需使用高性能Rust核心
    • 操作系统:Windows/macOS/Linux全平台支持
    • 内存:建议8GB以上(处理大型代码库时)
    # 快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/deepelementlab/clawcode
    cd clawcode

    # 2. 安装Python依赖
    pip install -r requirements.txt

    # 3. (可选)构建Rust核心
    cd rust
    cargo build –release

    # 4. 运行Claw Code
    python src/main.py

    配置说明

    Claw Code支持多种LLM提供商,你需要配置相应的API密钥:

    • Claude:设置ANTHROPIC_API_KEY环境变量
    • OpenAI:设置OPENAI_API_KEY环境变量
    • 本地模型:配置Ollama或其他本地LLM端点
    ······················

    ## 🎯 核心功能

    1. 基于插件的工具系统

    内置19个权限可控工具,涵盖文件I/O、Shell执行、Git操作、网页抓取、Notebook编辑等能力。每个工具独立沙箱化,支持自定义访问控制,Rust层提供完整的JSON Schema定义。

    2. 自主智能体循环

    终端原生智能体,可自主读取整个代码库、编辑文件、执行命令、运行测试、操作Git,自主迭代直到任务完成。真正实现了AI从”对话”到”执行”的进化。

    3. 多智能体编排

    支持生成子智能体(内部称为”群体/swarms”)并行处理复杂任务。子智能体在隔离上下文运行,可共享内存访问,通过Agent工具可控制子智能体生命周期。

    4. MCP完整集成

    支持模型上下文协议(MCP),提供Stdio、SSE、HTTP、WebSocket、SDK、ClaudeAiProxy共6种传输类型。支持自动名称规范化、配置哈希和OAuth认证,可连接外部工具服务器。

    5. Rust高性能核心

    代码库中Rust占比72.9%(用于高性能运行时执行),Python占比27.1%(用于智能体编排和LLM集成)。正在推进dev/rust分支实现完全内存安全的高性能框架运行时。

    ······················

    ## 💡 典型使用场景

    场景1:自动化代码重构

    问题描述:你有一个大型遗留代码库,需要统一代码风格、更新弃用API、优化性能瓶颈。

    Claw Code解决方案

    1. 启动Claw Code,让它读取整个代码库
    2. 给出指令:”重构所有Python文件,将print语句改为logging,添加类型注解”
    3. Claw Code自主分析代码结构,分批修改文件,运行测试验证
    4. 生成详细的重构报告,列出所有修改点和测试结果

    效果:原本需要3-5天的重构工作,现在可以在2-3小时内完成,且保证测试全部通过。

    场景2:快速原型开发

    问题描述:你需要快速开发一个REST API服务,但不想从零开始写脚手架代码。

    Claw Code解决方案

    1. 给出需求描述:”创建一个FastAPI服务,支持用户注册、登录、JWT认证、CRUD操作”
    2. Claw Code自动生成项目结构、路由、模型、数据库连接代码
    3. 自动添加单元测试、API文档(OpenAPI/Swagger)
    4. 启动开发服务器,验证所有端点正常工作

    效果:一个完整的REST API原型从想法到可运行代码,只需要10-15分钟。

    场景3:代码审查和安全审计

    问题描述:你需要对一个开源项目进行安全审计,找出潜在的漏洞和隐患。

    Claw Code解决方案

    1. 让Claw Code克隆目标仓库,读取所有源代码
    2. 给出指令:”审查代码中的安全漏洞,重点关注SQL注入、XSS、不安全的反序列化”
    3. Claw Code使用专门的子智能体并行分析不同模块
    4. 生成详细的安全审计报告,包含漏洞位置、风险等级、修复建议

    效果:原本需要安全专家花费1-2周的代码审计,现在可以在1天内完成初步分析。

    ······················

    ## 🌟 推荐理由

    为什么你应该关注Claw Code?

    1. 开源替代,告别订阅费

    官方的Claude Code需要Claude Pro/Max或Enterprise订阅,月费不菲。Claw Code完全开源免费,支持多种LLM提供商(包括免费的本地模型),让每一个开发者都能用上顶级的AI编程助手。

    2. 架构透明,安全可审计

    Claw Code是”洁室重实现”,不含任何Anthropic的专有代码。所有代码开源在GitHub上,你可以完全审计它的行为,确保没有后门或数据泄露风险。对于企业用户来说,这一点至关重要。

    3. 性能卓越,Rust加持

    Claw Code的Rust核心占比72.9%,这意味着关键路径的性能可以媲美C++。相比纯Python实现的AI工具,Claw Code在处理大型代码库、并行执行任务时,速度提升显著。

    4. 生态丰富,MCP加持

    Claw Code完整支持MCP(模型上下文协议),可以连接数百个外部工具服务器。无论是数据库、API、文件系统,还是专门领域工具,都可以通过MCP集成到Claw Code中。

    5. 社区活跃,迭代迅速

    Claw Code的GitHub仓库有2100+个开放议题,335个关注者,56k+个Forks。社区非常活跃,每天都有新的PR和Issue,项目迭代速度极快。你遇到的问题,通常几天内就能得到修复。

    个人使用心得:我试用Claw Code已经两周了,最大的感受是——它真的能”理解”你的代码库。不像其他AI助手只能看到当前文件,Claw Code可以读取整个项目,理解模块之间的依赖关系,给出的建议非常精准。特别是多智能体编排功能,处理复杂任务时效率惊人。

    ······················

    ## 📥 下载地址

    快速开始

    # 一键安装(Linux/macOS)
    curl -fsSL https://claw-code.codes/install.sh | bash

    # 或者使用pip安装
    pip install claw-code

    # 启动Claw Code
    claw-code

    ······················

    Claw Code —— 让AI真正成为你的编程伙伴,而不是简单的代码补全工具。🚀
    如果你喜欢这个项目,记得去GitHub上点个Star支持开发者!

  • 李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱



    李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱

    5月19日,AMD上海AI开发者日,零一万物CEO李开复和AMD CEO苏姿丰进行了一场对话。他们讨论的核心问题很直接:企业砸钱做AI,到底能不能换来真实的商业回报?李开复的回答很犀利——如果你的AI部署没有改变季度财报里的任何一个数字,那你做的就不是真正的AI转型,只是浪费钱。


    AI的三个阶段:从任务到职能部门

    李开复把AI的发展分成了三个阶段。2024年,大家关心的是”AI能不能完成一个任务”;2025年,问题变成了”AI能不能完成一整条工作流”;到了2026年,核心问题已经进阶为”AI能不能替代一个企业的职能部门”。

    这个判断很关键。它意味着AI不再是辅助工具,而是要真正承接一个部门的核心目标。比如HR部门,从招聘、面试、入职到绩效跟踪,整套流程都由AI智能体系统完成。

    李开复提到,真正值得AI介入的,是那些直接影响损益表的核心环节:收入、利润、供应链、动态定价、防欺诈。这些恰恰是高管们最不愿意让AI介入的领域。

    为什么CIO主导的AI转型会失败

    李开复抛出了一个有点”政治不正确”的观点:传统CIO(首席信息官)主导的自下而上AI转型,大概率会失败。原因是,CIO的职责是管理软件运营,不是重新定义公司。他们倾向于在不出错但价值极低的场景部署AI——会议纪要、HR聊天机器人、内部搜索,这些都是表面文章。

    真正能改变公司经营结果的,往往是那些高管最不愿意让AI介入的运营职能部门。所以,企业AI转型必须是”一把手工程”,由CEO自上而下推动。

    AI编程能力跨过临界点

    推动AI从”辅助工具”进化到”职能部门替代者”的,是两大关键变化。第一,AI编程能力跨过了临界点。一年前,AI只能辅助编写代码;现在,它可以端到端地交付一整套功能。智能体在数字世界中的所有行为,本质上都落到代码层面。一旦AI编码能力跨过门槛,自主智能体就成为现实。


    多智能体架构:AI世界的”美第奇效应”

    第二个变化,是大家意识到单一智能体的能力存在上限。无论模型参数多大,单个Agent的推理能力终究会碰到瓶颈。而多智能体架构打破了这一上限。

    李开复用”美第奇效应”来比喻:当不同领域的专家被放进同一个房间,产出远超任何单一个体。五百年前人类发现了这一规律,现在他们把它带到了AI世界。招聘Agent与绩效Agent联动,系统可根据员工入职后的绩效数据,自动调整前端筛选标准。

    苏姿丰的印证:一个人能干完整个团队的事

    苏姿丰从算力基础设施的角度印证了这一趋势。她透露,AMD内部工程师已经在用AI智能体加速产品设计与验证。一个人加上合适的工具和算力,如今能完成几年前整个团队的工作。

    但多智能体系统对算力的要求也变了。李开复指出,未来极致的token效率和本地化处理能力会是关键。系统必须满足本地优先、端侧处理、低于100毫秒的响应延迟,多智能体协同才能真正具备现实可行性。

    苏姿丰提到,AMD比很多公司都看得更早、更清楚。随着AI走向多智能体架构,也必须重新思考”算力”本身的定义。

    开源势不可挡,中国生态有独特优势

    对于开源生态,两位嘉宾都表达了乐观态度。苏姿丰提到,开源AI社区正在涌现出大量创新,而且这个生态已经越来越全球化。李开复则更直接:”开源势不可挡。闭源模型类似苹果iOS,追求高利润和强控制;开源社区则成了AI世界的安卓,拥有更广覆盖和更大规模。”

    他特别指出,中国开源生态因为硬件资源受限,反而转向极致的工程效率、算法优化和架构创新,形成了独特优势。


    未来图景:”自主企业”和”一人公司”

    面向未来,李开复提出了两个值得思考的趋势。第一,未来真正意义上的”自主企业”会诞生,驱动它的是跨部门、多层级协同的智能体网络。下一阶段产业AI转型将围绕两个核心展开:数据主权和清晰可验证的ROI。

    第二,”一人公司”趋势正在出现。借助模块化的多智能体框架,单个开发者或领域专家,如今有能力像总架构师一样,快速启动一家高度自动化运转的公司。

    DRI模型:AI原生公司的核心组织架构

    在组织架构层面,李开复提出了DRI(直接责任人)模型。他预测,这会成为AI原生公司最核心的组织架构。DRI就是一个人对某个跨职能结果承担端到端责任,不是头衔,而是一种明确的责任机制。

    在这个模式下,人类DRI处于智能体系统的中心,周围是研究、执行、合规、监控等Agent集群。DRI负责整体编排、关键决策和最终输出契约。实时数据流取代传统汇报,业务运转围绕可量化的结果展开。

    对工程师来说,这意味着价值衡量标准的变化。在智能体时代,工程师的价值不再由写了多少代码来衡量,而是对结果负责,拥有决策权,并有规划地配置智能体集群。



  • MIT发布2026年AI十大趋势:从人形机器人训练数据到AI反制浪潮



    MIT发布2026年AI十大趋势:从人形机器人训练数据到AI反制浪潮

    MIT Technology Review 2026年AI趋势
    MIT Technology Review 发布2026年AI十大趋势报告

    MIT Technology Review发布了2026年”当下AI领域最重要的10件事”清单。这是该刊首次将AI领域的核心趋势、行业动态、前沿进展汇总为单一清单。从人形机器人训练数据到AI反制浪潮,这10个趋势正在重塑整个行业。


    人形机器人的”动作库”正在建立

    训练AI理解物理世界,需要的不再只是文本。现在,无数摄像头对准工厂工人、仓库管理员、甚至远程操控的”傀儡机器人”,记录他们每一个动作。这些视频会成为下一代人形机器人的训练数据。问题是,这种规模的采集能不能真的让机器人学会干活,现在还没人能打包票。

    MIT Technology Review认为,人类动作视频正在成为人形机器人训练的新”石油”,只是这套方法论还没被验证过。

    大语言模型没过时,只是需要升级

    LLM已经席卷全球,但容易摘的果子基本摘完了。整个行业都在找下一个爆点,但大语言模型本身不会消失。它还有大量潜力没释放——更长的上下文、更好的推理、更强的多模态能力。只是,光靠把模型做得更大,已经不够了。

    诈骗的门槛正在被AI削平

    钓鱼邮件、深度伪造电话、自动化的社交工程攻击——AI正在让这些事变得更快、更便宜、更容易上手。以前需要耐心和技术的活儿,现在脚本小子都能干。这对普通用户来说,意味着你收到的每一条”紧急信息”都可能是AI生成的。


    世界模型:让AI理解物理规律

    大语言模型擅长处理文字,但它们不了解物理世界是怎么回事。AI公司现在想构建”世界模型”——能理解重力、因果关系、空间结构的系统。如果做成,AI就不只是聊天机器人,它能真正进入工厂、仓库、医院,在真实世界里做决策。

    战场上的AI:从辅助到决策

    算法早就在做军事情报分析了,但生成式AI正在进入作战室。指挥官开始认真考虑AI的建议——该把资源投到哪里、怎么预测敌人的下一步。这改变的不只是技术,还有军队和科技巨头合作的方式,甚至是什么时候该按下”开火”按钮的决策逻辑。

    MIT的报道指出,AI在军事领域的渗透速度比大多数人意识到得要快,而且这次不只是自动化,是真正的决策参与。

    深度伪造的武器化已经到来

    Grok大规模生成非自愿色情图像、美国政府用AI技术做宣传——人们长期预警的”武器化深度伪造”威胁,现在已经不是预言,是正在发生的事。假视频、假音频、假文章,正在成为信息战的一部分。

    多智能体协作:从单打独斗到团队合作

    第一代AI智能体只能做单一任务——运行浏览器、写几行代码。下一代智能体会组队工作,一个负责研究,一个负责写代码,一个负责测试,互相协调完成复杂目标。这就像从”一个工程师”进化到”一个产品团队”。


    中国的开源赌注:免费的前沿模型

    中国实验室把前沿模型免费开放,这招赢得了全球开发者的好感。现在,世界各地都有人在基于中国的开源模型做开发。问题是,这种模式能不能赚钱?没人知道答案。但不管怎样,开源的势头已经起来了。

    AI科学家的出现:诺奖级别的合作者?

    高校和企业都在开发能自主完成研究任务的AI智能体——不只是查文献,而是提出假设、设计实验、分析结果。一些业内人士相信,这类AI合作科学家未来可能做出达到诺贝尔奖级别的研究成果。当然,这话现在听起来还有点早。

    反AI浪潮正在汇聚

    经过多年几乎不受约束的AI发展,全球范围内正在形成一股强大的反对力量。保守派、自由派、艺术家、工会——不同立场的人开始在同一个问题上发声:AI跑得太快了,我们需要刹车。这股力量已经开始在一些具体问题上取得小范围胜利。



  • Google出手了:CodeMender直指Anthropic Mythos,AI安全大战打响

    Anthropic的Claude Mythos Preview大模型发布的时候,整个AI圈都震了一下。这个模型强到什么程度呢?它不仅在代码安全漏洞识别上表现出色,还吸引了多家顶级银行、甚至美联储主席的关注。因为能力太强,Anthropic起初被认为不适合公开发布,最后只开放给早期企业用户和政府机构使用。

    Google坐不住了

    就在大家都觉得Anthropic在AI安全赛道上”一骑绝尘”的时候,Google在I/O 2026大会上悄悄亮了一张牌:CodeMender。这个工具早在2025年10月就首次亮相,但当时没有引起太大波澜。现在,Google把它重新推到台前,明确对标Anthropic的Mythos。

    CodeMender的核心能力是同时识别并修复代码库中的安全漏洞。和Mythos不同的是,它不只是”发现”问题,还能”解决”问题。这个设计很聪明:企业客户需要的不是一份漏洞清单,而是一个能帮他们把漏洞修好的工具。

    Google CEO桑达尔·皮查伊公开表示:”Mythos证明了超大参数规模模型在安全类场景中有明确价值,而我们同样具备提供这类产品的能力。”

    开放策略:从小范围到逐步扩大

    Anthropic的Mythos目前只面向早期企业用户和政府机构小范围开放,没有公开发布。Google则采取了不同的策略:在I/O 2026之后,他们向特定专家群体开放了CodeMender的API测试权限,逐步扩大开放范围。

    这个策略背后有Google的算盘。他们已经和政府、企业客户展开沟通,推动CodeMender用于系统安全审计。和Anthropic的”高冷”路线不同,Google更想快速把这款产品推向市场,用生态优势(Google Cloud、Android、Workspace)来绑定客户。

    AI安全赛道为什么突然火了

    其实在Anthropic发布Mythos之前,AI安全这个赛道并不算热门。大多数公司更关心的是”怎么让模型更聪明”,而不是”怎么让模型更安全”。但Mythos的出现改变了这个认知:安全,也可以成为大模型的核心卖点

    这对AI公司来说是个好消息。因为”安全”这个东西,企业和政府愿意买单,而且价格不菲。Anthropic的Mythos主要面向高安全需求的企业和政府客户,定价肯定不便宜。Google看到这块肥肉,当然也想分一杯羹。

    • 客户选择更多了:政府、金融、关键基础设施等领域的客户,之前在AI安全服务上的选择很有限,Google CodeMender的入场提供了更多元化的选择
    • 技术迭代会更快:有竞争才有进步,Google和Anthropic在这个赛道上”掰手腕”,最终会让AI安全技术的能力提升得更快
    • 价格可能会下降:垄断市场的高价,在竞争出现后通常会有所调整,客户可以期待更合理的定价

    Google的真实算盘

    除了在AI安全赛道上和Anthropic竞争,Google推出CodeMender还有更深层的目的:为IPO铺路。有消息称,Google的母公司Alphabet正在为2026年的IPO做准备,而”AI安全解决方案提供商”这个定位,比”搜索引擎公司”性感得多,也更容易在资本市场上讲出一个好故事。

    不管怎么说,AI安全大赛道的竞争才刚刚开始。Anthropic验证了市场需求,Google跟进布局,接下来可能还会有更多玩家入场。对我们这些旁观者来说,这出好戏,才刚拉开帷幕。

  • Antigravity 2.0发布:Google把智能体编程玩出了新花样

    Google I/O 2026第一天,全场都在聊Gemini 4.0和那些炫酷的XR眼镜,但我觉得真正值得开发者关注的,反而是这个看起来没那么起眼的Antigravity 2.0。要知道,上次Google推出Antigravity 1.0的时候,大家还在拿它跟Cursor对比,觉得Google不过是做个”追随者”。但这次2.0版本一出来,味道完全变了。

    从编程工具到智能体平台

    Antigravity 2.0最核心的变化,是它不再只是一个”帮你写代码的AI工具”,而是一个完整的智能体编程平台。这个定位变化很关键,意味着Google对这类产品的理解已经往前走了一大步。

    你可以把它理解成:之前1.0版本是”你问它答”的单兵作战模式,现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度,你可以让一个智能体去写前端,同时另一个去处理后端的API,还有一个在后台跑测试。这种”智能体编排”能力,是目前市面上大多数AI编程工具还没摸到门槛的东西。

    Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动,这个模型本身就是和Antigravity团队协同开发的。换句话说,Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

    三个细节看出Google的野心

    第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”,它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”,而是它意味着Antigravity正在向Google的消费级产品(Gmail、Docs的语音交互)对齐。未来的开发工具,可能真的就是”动动嘴皮子”的事。

    第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力,搜索结果页面不只是给你一堆蓝色链接,而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味:Google正在把它的”智能体能力”渗透到用户旅程的每一个触点,而不只是局限在一个独立的IDE或者编辑器里。

    第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发,也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显:Google不想让你”只在Antigravity里干活”,而是希望你用它的全套开发栈。

    订阅体系背后的算盘

    这次Antigravity 2.0是跟着Google的AI Ultra订阅计划(100美元/月)一起推出的。在这个价位下,Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法:他们不是想靠Antigravity单独赚钱,而是想用这个工具把开发者”锁”在Google的AI生态里。

    你可以对比一下:Cursor的订阅是20美元/月,GitHub Copilot是10美元/月,但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”,这个定位差异决定了它的定价空间可以更高。


    桌面应用和CLI双双升级

    除了核心的智能体编排能力,Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流,你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程,然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”,Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

    总体来看,Antigravity 2.0的这次更新,信号很明确:Google不想在AI编程这个赛道里只做一个”中庸的跟随者”,它想用生态优势(搜索、Workspace、Android、Firebase)和智能体编排能力,重新定义”什么是AI时代的开发工具”。

  • Google AI Studio让任何人都能在几分钟内构建Android应用






    Google AI Studio让任何人都能在几分钟内构建Android应用

    Google AI Studio Android应用开发
    Google AI Studio新功能:几分钟内构建Android应用(图片来源:TechCrunch)

    昨天的Google I/O 2026大会上,谷歌扔出了一个让开发者和非开发者都眼前一亮的消息:AI Studio现在可以直接生成能在手机上跑的Android应用了,而且整个过程压缩到了几分钟。

    以前要写Android应用,你得搭环境、装Android Studio、学Kotlin或Java、搞明白Gradle构建系统,没个几周根本跑不起来一个像样的应用。现在谷歌说,打开浏览器、用AI Studio、描述你想做什么,几分钟就能出一个能装的APK。

    “AI coding的浪潮现在直接席卷了Android应用开发领域。在周二举办的2026年Google I/O开发者大会上,谷歌宣布在旗下网页端工具Google AI Studio中新增原生Android应用创建功能,将原本需要数周的环境搭建和编码过程压缩到了几分钟。”
    —— TechCrunch报道

    生成的是正经Android应用,不是玩具

    谷歌强调,AI Studio生成的应用不是那种”看起来像应用”的网页打包,而是正经的Android原生应用——用Kotlin写的前端与业务逻辑,Jetpack Compose做UI,可以调用GPS、蓝牙、NFC这些硬件传感器。

    目前生成的应用只能自己用,分享给家人朋友的功能还在路线图上。但谷歌已经把后续公开发布的链路想清楚了:AI Studio可以帮你自动创建Google Play Console里的应用记录、打包APK/AAB、上传到内部测试轨道,方便你迭代。再往后,可以导出项目zip、推到GitHub,或者转到桌面版Android Studio继续开发。

    网页里就能跑模拟器

    这个流程里最实用的一点:AI Studio内置了网页版Android模拟器。你描述需求、AI生成代码、模拟器里直接跑起来看效果,整个闭环都在浏览器里完成,不需要本地装任何东西。

    想装到自己手机上测也行,用USB连电脑,AI Studio集成了adb(Android Debug Bridge),点几下就能把应用侧载到手机里。

    谷歌在想什么:不只是开发工具

    如果把这件事只看成”谷歌出了一个类似Cursor/Replit的AI编程工具”,就理解浅了。谷歌真正的盘算是应用分发。

    这次同步公布的还有一套基于Gemini的应用发现机制:未来几周,你在网页端或Android端的Gemini对话框里聊着天,AI会根据对话内容推荐相关的Android应用;到2026年晚些时候,Gemini还能接入45万部影视剧集和体育赛事直播信息,聊到相关内容时直接跳转到对应的Android应用。

    Play Store里也在加”Ask Play”功能,用自然语言跟AI对话来发现应用,不再只是关键词搜索。

    “谷歌正在构想一个全新的Android应用生态:用户不仅可以从Play Store中找应用,还可以从自己的朋友网络中获取应用。”
    —— TechCrunch报道

    这套组合拳的意思是:降低开发门槛 → 让更多人做出应用 → 通过Gemini对话推荐和社交分发让这些应用被看见 → 整个生态活跃度提升,同时谷歌掌握分发入口。

    竞争局势:AI编程工具赛道又挤进一个巨头

    这件事直接对标的是Cursor、Replit、Lovable、Claude Code这些已经跑出声量的AI编程工具。区别在于,谷歌有自己的应用分发渠道(Play Store + Gemini),这是其他工具没有的闭环优势。

    当然,现在这个功能还处在早期。生成的代码质量、复杂应用的适配能力、以及”几分钟生成一个应用”在实际需求下的真实可用度,都还需要实测来验证。但方向已经很明确了:AI降低开发门槛这件事,已经从”写代码”蔓延到了”做出能在设备上跑的完整产品”。

    对于没有编程背景的创作者来说,以前有个想法要找开发者合作,现在也许可以自己先用AI Studio搓一个出来看看效果。这个变化的价值,可能比发布会上的演示视频更能说明问题。



  • Meta计划全球裁员10%:约7800人受影响,AI战略转型引员工抗议






    Meta计划全球裁员10%:约7800人受影响,AI战略转型引员工抗议

    Meta裁员AI战略转型
    Meta全球裁员10%,AI战略转型引发员工抗议(图片来源:IT之家)

    昨天(5月19日)路透社传来消息,Meta计划在今天(5月20日)启动全球裁员10%。按今年3月底77986人的员工总数算,这波裁员大约会影响7800人。裁员通知分三批在全球发送,每批都在当地时间凌晨4点发出,北美员工被要求裁员当天在家办公。

    这次裁员不是孤立事件,而是Meta 2026年全面重组计划的一部分。公司首席人事官Janelle Gale在内部备忘录里写得很直白:多数组织已经把AI原生设计原则融进了新架构,可以用更扁平的结构、更小的团队运作,响应更快、自主权更强。所以,裁员来了。

    “我们现已进入这样一个阶段:许多组织能够以更扁平的结构运作,采用更小的团队(小组 / 群组),从而实现更快的响应速度和更强的自主权。”
    —— Meta首席人事官 Janelle Gale

    7000人转岗,6000个空缺岗位关闭

    裁员只是这块拼图的一部分。备忘录显示,Meta还要把7000名员工转移到跟AI相关的新项目里,同时取消部分管理岗位。作为重组流程的一部分,公司已经额外关闭了6000个空缺岗位。

    这7000人被转移去的地方,内部叫”抽调”,包括几个关键团队:应用AI工程(AAI)团队、智能体转型加速器(ATA)XFN团队——目标是开发能自主完成当前人工任务的AI智能体;还有Central Analytics团队,给智能体开发提供生产力和数据分析支持。这几个团队都属于Meta”AI赋能工作”计划的一部分,之前由首席技术官Andrew Bosworth公布过。

    换句话说,Meta在押注:以后这些工作不再需要那么多人,一部分会被AI智能体取代,另一部分会用更少的人、更扁平的结构来完成。这是这轮裁员的底层逻辑。

    员工抗议:”房间里的大象”

    员工的抵触情绪不是一天两天了。这次裁员消息出来后,抗议活动明显升级。办公室里贴出了抗议传单,内部沟通平台Workplace上也有人发帖表达不满。

    超过1000名员工签了一份请愿书,反对公司在员工电脑上安装鼠标追踪软件,这些数据的用途是训练AI模型。部分员工在Workplace上用大象表情包回复高管,意思是”你们回避的那个大问题,我们看得见”——也就是英语里说的”房间里的大象”(the elephant in the room)。

    “员工正为管理层鲁莽且代价高昂的AI押注付出代价。当高管们追逐投机性的AI战略时,员工们却面临着毁灭性的裁员、严苛的监控,以及被迫去训练那些旨在取代他们的低效系统这一残酷现实。”
    —— 英国联合技术与联合工会组织者 Eleanor Payne

    在英国,一群Meta员工已经开始跟联合技术与联合工会合作,组织工会化运动。工会组织者Eleanor Payne的这段话,基本概括了抗议员工的核心不满:他们觉得自己在为管理层的AI豪赌买单,而且还要被迫训练那些最终会取代自己的系统。

    更多裁员还在后面

    Gale在备忘录里还提到,后续还会有更多裁员动作,今年晚些时候会推进下一轮裁员。这意味着今天的10%可能不是终点,而是这轮重组的其中一波。

    Meta在这波AI浪潮里其实不算落后。它的AI研发预算常年居高不下,Llama开源模型系列也一直在更新。但问题是,AI投入的回报周期长,而财报压力和股价压力是实时的。裁员、转岗、扁平化,这些都是在给AI转型腾出资源——钱、人、组织空间,全部往AI相关团队倾斜。

    这件事折射出一个更大的趋势:那些喊着”AI优先”的公司,正在用裁员和重组为AI转型买单。员工被要求接受更严苛的监控(鼠标追踪只是其中一例),同时还要担心自己的岗位是否被AI智能体取代。Meta不是第一家,也不会是最后一家。