博客

  • OpenAI把Codex搬进手机了,随时能写代码这件事到底靠不靠谱

    前几天刷到一条消息,OpenAI 把 Codex 搬到手机上了。没错,就是那个在桌面端帮程序员写代码的 AI 工具,现在你可以在手机上直接生成、审阅、甚至部署代码片段。对远程团队来说这是个挺实在的更新,毕竟不是所有人时刻坐在电脑前,等不及的时候掏出手机就能改两行代码,这种灵活性以前真的没有。

    手机写代码,真不是噱头

    Codex 移动端预览版直接集成在 ChatGPT 应用里,不需要额外安装。最实用的一点是它支持远程 SSH 连接,意味着你真的可以在手机上完成一段代码的审阅、修改、然后推到服务器。当然有人担心移动环境下的代码安全,这个顾虑是合理的,毕竟手机网络比办公网络复杂得多,敏感项目的操作还是得悠着点。

    OpenAI 这次把这个功能做成预览版,说明他们自己也很清楚——移动端编码这件事,体验和安全性都还需要迭代。

    有意思的是,几乎同一时间,Anthropic 的 Claude Code 产品负责人 Cat Wu 也在公开场合聊了类似的话题。她说 Claude Code 的开发思路是不预设宏大的整体规划,更看重迭代反馈而非僵化的路线图。这话听起来有点虚,但仔细想确实有道理——AI 编码工具这种东西,你很难在发布前就把所有使用场景规划清楚,用户怎么用、在哪卡住,这些反馈比任何前期调研都值钱。

    AI辅助软件开发
    AI 正在改变软件开发的节奏(来源:coaio.com)

    企业AI架构,风向变了

    还有一个信号值得注意。行业分析里开始出现一种声音:企业级 AI 系统开发,正在从「LLM 优先」转向「代码优先」。什么意思呢?过去一年多,大家一上来就想把大模型能力塞进系统,先把聊天界面搭起来,再想业务逻辑。现在有人意识到,这样做虽然出活快,但开发者对系统的深度理解会被掩盖, Demo 做得很炫,真正跑起来全是坑。

    新思路强调「代码优先」,说白了就是先把业务逻辑、数据结构、系统边界想清楚,再用 AI 工具去加速开发,而不是反过来。这个转变背后其实是教训——太多项目在规模化部署的时候翻车,技术债务堆到还不起。


    其他值得关注的动静

    AMD 这边也有动作,宣布给 RDNA2 和 RDNA3 架构的老显卡提供硬件加速的 FSR 4 超分辨率支持。通俗点说,就是你手里那张几年前的显卡,可以通过驱动更新获得更好的游戏画质,相当于变相延长了硬件寿命。对不想频繁换卡的用户来说,这算是个小惊喜,虽然性能上肯定还是有损耗的。

    医疗 AI 这边出了个警示案例。加拿大安大略省审计发现,医生用的 AI 笔记工具频繁虚构治疗建议和处方内容。这个问题其实不意外,大模型的「幻觉」在医疗场景下后果完全不同。行业里已经开始呼吁建立更严格的 AI 输出验证机制,但这件事真正做起来,比喊口号难多了。

    最后说个有点荒诞的事——美国太浩湖地区 4.9 万居民,正在和内华达州的一个 AI 数据中心抢电。能源供应商优先给数据中心供电,居民用电反而被挤压。AI 的扩张代价,最终是普通人在承担,这个问题只会越来越突出。

  • 2026年5月AI圈大事件:GPT-5.5来了,Kimi融资20亿美元,人形机器人走向工厂






    2026年5月AI圈大事件:GPT-5.5来了,Kimi融资20亿美元,人形机器人走向工厂

    5月的AI圈,信息量爆炸。OpenAI发布了GPT-5.5,国产AI企业Kimi即将完成20亿美元融资,人形机器人展览会在杭州开幕,苹果因为AI功能虚假宣传赔了2.5亿美元……如果你没时间每天刷新闻,这篇文章帮你一次性梳理完这个月的所有大事。

    GPT-5.5来了,这次主打”不胡说”

    OpenAI在5月发布了GPT-5.5 Instant,最核心的升级是”可靠性”。之前的版本在专业领域容易”一本正经地胡说八道”,5.5在医疗、法律、金融等高风险场景的准确性有了质的飞跃,幻觉率大幅降低。

    这个方向其实很明确:企业用户要的不是模型”能聊”,而是”说对话”。ChatGPT的使用量继续攀升,企业场景渗透加速,GPT-5.5算是踩在了正确的节奏上。

    AI行业的竞争,正在从”谁的模型更聪明”转向”谁的模型更可靠”。GPT-5.5的发布,是这个转向的一个标志性节点。

    Kimi即将完成20亿美元融资

    月之暗面旗下的Kimi即将完成一笔20亿美元的新融资,投后估值大幅攀升。这是2026年国产AI领域最大的一笔融资之一。

    Kimi这波势头很猛,长文本处理能力一直是它的招牌,现在融资到位,接下来在多模态、Agent方向的投入估计会加大。国产大模型这场仗,远没到终局。

    人形机器人走向工厂,不只是演示了

    5月14日至16日,HRTE 2026杭州国际人形机器人展览会举办,主题是”人形机器人赋能新型工业化”。多款新型人形机器人亮相,工业应用场景加速落地,产业链上下游企业集中展示。

    人形机器人正在从”实验室”走向”工厂”。2026年可能是人形机器人产业化的元年,这个判断现在看来越来越扎实了。

    苹果赔了2.5亿美元,AI虚假宣传的警钟

    苹果公司同意支付2.5亿美元,和解关于AI功能虚假宣传的诉讼。这件事给整个行业敲了一个警钟:AI产品的宣传必须实事求是,过度承诺的后果是很真实的。

    监管层面也在发力。AI生成内容的合规与安全成为新的关注重点,Deepfake(深度伪造)技术被滥用的案例持续增多。行业趋势正在从”炫模型”转向”拼安全”,安全性、隐私保护和系统集成能力正在成为新的竞争维度。

    其他值得关注的动态

    • Google把Gemini塞进了Gboard:AI不再是一个需要单独打开的App,而是融入了你打字的每一个瞬间。AI正在从”工具”变成”基础设施”。
    • 微软收购Fintool AI:将其全面整合进Office全家桶,Excel、Word、PowerPoint将获得更强大的AI金融分析能力。
    • 英伟达高层到访中国:带动A股AI板块集体上涨,汉得信息等AI全产业链概念股表现活跃。
    • 国内AI社区类产品市场爆发:市场规模同比增长182%,多款涵盖教育、办公、创作、社交的产品进入测试阶段。

    回顾这个月的AI圈,几个关键趋势非常清晰:模型能力持续提升,资本持续涌入,产业加速落地,安全成为新焦点。对于普通人来说,最重要的信息是:AI正在从概念走向实用。不管你是学生、职场人还是创业者,现在都是开始学习和使用AI的最佳时机。


  • 谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态






    谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态

    谷歌I/O 2026大会
    谷歌I/O 2026开发者大会现场 (图源:腾讯新闻)

    北京时间5月20日凌晨1点,谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天(5月19-20日),核心主题只有一个:把AI智能体塞进你生活的每一个角落。

    先说最硬核的模型更新。Gemini 3.5 Flash来了,官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么?你让AI帮你写代码、跑长任务,别的模型还在”思考”,它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的,速度就是生产力。

    Gemini 3.5 Flash的定位很清晰:不是最聪明的模型,但是最快的。对于那些需要反复调用、长工作流的场景,速度比绝对智能更重要。

    视频生成模型Gemini Omni亮相

    DeepMind首席执行官德米斯·哈萨比斯亲自登台,发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频,还能用自然语言对话式编辑——你想改角色、换背景、调场景,直接说就行。

    首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块,谷歌终于开始认真跟Sora、Runway们掰手腕了。

    Android XR智能眼镜,手机可以不用掏了

    Android XR智能眼镜
    Android XR智能眼镜演示 (图源:腾讯新闻)

    谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜,分两类:一类是纯语音眼镜(没有显示屏),另一类可以把信息投射到视野前方。

    现场演示很有意思:佩戴者要让Gemini帮自己点一杯咖啡,导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单,全程没掏手机,最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版,2026年秋季上市,支持配对iOS和Android设备。

    Gemini Spark:关机的手机也能跑AI助手

    这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手,即使你的设备关机了,它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

    本周向受信任测试人员开放,下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐,2026年夏季将支持在Chrome浏览器中运行。

    其他值得关注的更新

    • Ask YouTube:在YouTube网站加入聊天机器人交互界面,支持自然语言搜索直接跳转至视频对应片段,2026年夏季将在美国扩大推广
    • Docs Live:支持通过语音与Google Docs对话,无需输入提示词,可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
    • Antigravity 2.0:面向AI Agent时代的编程平台,直接对标Anthropic Claude Code、OpenAI Codex
    • Universal Cart:AI智能体驱动的通用购物车,可跨场景添加商品,追踪优惠、监控价格变动、显示价格历史
    • SynthID扩展:可识别图片是否为AI生成,用户可直接询问图片的生成属性

    整体来看,谷歌这次的方向非常明确:AI不再是一个需要单独打开的App,而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代,谷歌想做那个无处不在的底色。


  • 拒绝2000万美元收购,这个AI工具创始人要把开源项目做成百年公司

    NanoClaw的创始人Gavriel Cohen这几天成了AI圈的热门人物。他和兄弟Lazer Cohen一起做的开源项目NanoClaw,在短时间内从沙发上的代码变成了一家融资1200万美元的公司——而且他们还拒绝了一份约2000万美元的收购要约。

    NanoClaw 联合创始人合影
    NanoClaw 联合创始人 Gavriel Cohen(左)和 Lazer Cohen(右)(来源:NanoClaw)

    六周内从代码到投资条款清单

    Gavriel说,从写下第一行代码,到拿到投资条款清单,全程不到六周。这段时间发生了什么?项目在开源社区迅速走红,AI研究者Andrej Karpathy在推特上夸了NanoClaw,然后新加坡外交部长在Facebook上发帖称NanoClaw是他的”第二大脑”,这篇帖子迅速走红。

    热度一来,投资人的消息就蜂拥而至。Gavriel估计有50多位创始人、科技行业高管发私信表示想要投资。Hugging Face的CEO Clem Delangue也是其中之一。

    NanoClaw最初是作为OpenClaw的安全替代方案被开发出来的。和OpenClaw直接在电脑上运行、可以访问所有服务和凭证不同,NanoClaw在容器中以沙箱模式运行。这种方式正逐渐成为部署更安全的OpenClaw类产品的通用解决方案。


    为什么要拒绝2000万美元

    就在他们考虑一份六位数美元的报价时,他们遇到了一位创始人朋友,对方给出了一个关键见解:开源项目的价值会随着社区规模扩大呈指数级增长。这些用户不仅可以帮助贡献代码,让项目快速成熟,还能探索出各种使用场景、做实践验证。

    这位朋友告诉他们,如果他们相信NanoClaw能成为这类项目,就必须关停其他业务,全身心投入NanoClaw。Gavriel后来说:”他说得对。”

    在他们关停此前的业务、全身心投入NanoClaw后不久,就出现了病毒式传播的帖子,新公司也和Docker、Vercel达成了合作。

    在那份六位数报价的约两周后,他们又收到了另一份收购要约,报价约2000万美元,还包含让他们留任继续运营公司的职位。兄弟俩再次拒绝了这份要约。


    从开源项目到企业服务

    NanoCo现在已经开始签约企业客户,这个想法来自社区。产品的早期用户都是具备技术能力的人,其中很多是大型科技公司的管理层。这些用户自己部署好NanoClaw实例后,不断有同事找他们帮忙做同样的部署。

    Cohen解释道,这些人不想变成NanoClaw的IT运维人员,但NanoCo愿意做这件事。所以公司现在提供部署服务,也就是现在常说的”前向部署工程师”服务,帮助企业向员工推广NanoClaw AI智能体,并提供持续支持。

    虽然NanoCo拒绝透露早期企业客户的具体身份,但兄弟俩表示,亚马逊、Gap、谷歌、Meta、SentinelOne、埃森哲等公司的管理层都在使用NanoClaw。

    从一个沙发上的开源项目,到拒绝2000万美元收购、融资1200万美元,再到服务亚马逊和Meta这样的巨头——NanoClaw的故事,是这一波AI智能体浪潮中,开源创业者如何把技术社区变成商业价值的生动案例。

  • Stability AI放大招:新音频模型能生成6分钟专业音乐,还把模型权重开源了

    Stability AI这几天扔出了一个重磅消息——Stability Audio 3.0系列音频模型正式发布。如果你对这家公司的名字有点印象,没错,它就是Stable Diffusion的开发公司。

    四款模型,两种策略

    这次一口气发布了四款模型,参数规模从4.59亿到27亿不等。小模型可以在设备上直接跑,生成最长2分钟的音频内容。中型和大型模型更猛,能生成6分20秒的完整音乐作品,而且还能保持稳定的音乐结构和旋律基调。

    生成时长是2024年发布的Stable Audio 2.0的两倍以上。要知道,2024年他们发布的Stable Audio Open只能生成最长47秒的音乐,这次算是一次大跨步的升级。

    最有意思的是他们对不同模型的开放策略。两款小型模型(音效模型459M、音乐模型459M)和中型模型(1.4B)都以开放权重的形式发布,任何用户都可以免费使用、修改。但大型模型(2.7B)就没这么大方了,只通过API和付费自托管服务开放使用,而且年营收超过100万美元的企业还需要获取企业级授权才能用。


    版权是生死线

    训练数据是这套模型的一大卖点。Stability AI表示,本次最新发布的音频模型系列完全基于已获得授权的数据训练。这一点很重要,因为AI音乐生成这个赛道,版权问题一直是悬在头顶的达摩克利斯之剑。

    去年Stability AI已经和华纳音乐集团、环球音乐集团达成合作,共同开发模型和音乐创作工具。和其他竞争对手比起来,这在版权合规性上确实更有底气。毕竟Suno和Udio相关的版权诉讼已经证明,数据授权以及与音乐厂牌的合作,将是这类服务长期生存的关键因素。

    Stability Audio 3.0 模型对比图
    Stability Audio 3.0 四款模型参数对比(来源:Stability AI)

    专业音乐人赛道开打

    目前谷歌、ElevenLabs等多家公司都在推出音乐生成相关的模型和工具,赛道越来越挤。Stability AI这边也在为专业音乐人开发一套全新的产品,前Universal Audio和Fender首席数字官Ethan Kaplan已经加入公司,将负责Stability的专业音乐业务。

    这个人事任命挺有意思。Ethan Kaplan在音乐硬件和软件领域都有很深的根基,他去Stability AI,说明这家公司不只是想做个”能生成音乐的AI玩具”,而是真的想往专业音乐制作流程里扎根。

    最近不少AI公司都在通过聘请音乐行业高管来提升自身行业资质。今年早些时候Suno聘请前Merlin CEO Jeremy Sirota担任首席商务官,ElevenLabs也聘请独立音乐发行商Kobalt的Derek Cournoyer担任音乐业务战略负责人。

    看起来,AI音乐生成赛道正在从”谁能生成好听的音乐”转向”谁能搞定版权、搞定音乐行业”。技术只是入场券,版权和行业资源才是长期竞争力的核心。


    普通创作者能用上吗

    对于普通创作者来说,Stability Audio 3.0的开源小模型是个好消息——你不需要花一分钱,就能在自己的设备上生成最长2分钟的音乐和音效。但如果你想用最好的大模型,或者你是年营收超过100万美元的企业,那就得按商业授权来了。

    这套模型的发布,让AI音乐生成赛道的竞争从”谁的模型能生成更长的音乐”升级到了”谁的版权合规性更强、谁更懂专业音乐人的需求”。Stability AI这一步棋,下得挺聪明。

  • Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    🚀 Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    ······················


    Claw Code Logo

    ······················

    ## 📝 项目简介

    **Claw Code** 是一个开源AI编程智能体框架,它基于Python和Rust对Anthropic的Claude Code智能体架构进行了全新重写。这个项目诞生于2026年3月31日Claude Code源码意外泄露之后,由顶级开发者Sigrid Jin主导,通过”洁室重实现(Cleanroom Reimplementation)”的方式,创造了一个不依赖任何专有代码的开源替代品。

    核心亮点:48k+ GitHub Stars,GitHub历史上增长最快的开源项目之一,完全开源可审计,支持多种LLM提供商。

    ······················

    ## ⚙️ 安装要求和过程

    环境要求

    • Python环境:3.8+,支持pip包管理
    • Rust环境(可选):如需使用高性能Rust核心
    • 操作系统:Windows/macOS/Linux全平台支持
    • 内存:建议8GB以上(处理大型代码库时)
    # 快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/deepelementlab/clawcode
    cd clawcode

    # 2. 安装Python依赖
    pip install -r requirements.txt

    # 3. (可选)构建Rust核心
    cd rust
    cargo build –release

    # 4. 运行Claw Code
    python src/main.py

    配置说明

    Claw Code支持多种LLM提供商,你需要配置相应的API密钥:

    • Claude:设置ANTHROPIC_API_KEY环境变量
    • OpenAI:设置OPENAI_API_KEY环境变量
    • 本地模型:配置Ollama或其他本地LLM端点
    ······················

    ## 🎯 核心功能

    1. 基于插件的工具系统

    内置19个权限可控工具,涵盖文件I/O、Shell执行、Git操作、网页抓取、Notebook编辑等能力。每个工具独立沙箱化,支持自定义访问控制,Rust层提供完整的JSON Schema定义。

    2. 自主智能体循环

    终端原生智能体,可自主读取整个代码库、编辑文件、执行命令、运行测试、操作Git,自主迭代直到任务完成。真正实现了AI从”对话”到”执行”的进化。

    3. 多智能体编排

    支持生成子智能体(内部称为”群体/swarms”)并行处理复杂任务。子智能体在隔离上下文运行,可共享内存访问,通过Agent工具可控制子智能体生命周期。

    4. MCP完整集成

    支持模型上下文协议(MCP),提供Stdio、SSE、HTTP、WebSocket、SDK、ClaudeAiProxy共6种传输类型。支持自动名称规范化、配置哈希和OAuth认证,可连接外部工具服务器。

    5. Rust高性能核心

    代码库中Rust占比72.9%(用于高性能运行时执行),Python占比27.1%(用于智能体编排和LLM集成)。正在推进dev/rust分支实现完全内存安全的高性能框架运行时。

    ······················

    ## 💡 典型使用场景

    场景1:自动化代码重构

    问题描述:你有一个大型遗留代码库,需要统一代码风格、更新弃用API、优化性能瓶颈。

    Claw Code解决方案

    1. 启动Claw Code,让它读取整个代码库
    2. 给出指令:”重构所有Python文件,将print语句改为logging,添加类型注解”
    3. Claw Code自主分析代码结构,分批修改文件,运行测试验证
    4. 生成详细的重构报告,列出所有修改点和测试结果

    效果:原本需要3-5天的重构工作,现在可以在2-3小时内完成,且保证测试全部通过。

    场景2:快速原型开发

    问题描述:你需要快速开发一个REST API服务,但不想从零开始写脚手架代码。

    Claw Code解决方案

    1. 给出需求描述:”创建一个FastAPI服务,支持用户注册、登录、JWT认证、CRUD操作”
    2. Claw Code自动生成项目结构、路由、模型、数据库连接代码
    3. 自动添加单元测试、API文档(OpenAPI/Swagger)
    4. 启动开发服务器,验证所有端点正常工作

    效果:一个完整的REST API原型从想法到可运行代码,只需要10-15分钟。

    场景3:代码审查和安全审计

    问题描述:你需要对一个开源项目进行安全审计,找出潜在的漏洞和隐患。

    Claw Code解决方案

    1. 让Claw Code克隆目标仓库,读取所有源代码
    2. 给出指令:”审查代码中的安全漏洞,重点关注SQL注入、XSS、不安全的反序列化”
    3. Claw Code使用专门的子智能体并行分析不同模块
    4. 生成详细的安全审计报告,包含漏洞位置、风险等级、修复建议

    效果:原本需要安全专家花费1-2周的代码审计,现在可以在1天内完成初步分析。

    ······················

    ## 🌟 推荐理由

    为什么你应该关注Claw Code?

    1. 开源替代,告别订阅费

    官方的Claude Code需要Claude Pro/Max或Enterprise订阅,月费不菲。Claw Code完全开源免费,支持多种LLM提供商(包括免费的本地模型),让每一个开发者都能用上顶级的AI编程助手。

    2. 架构透明,安全可审计

    Claw Code是”洁室重实现”,不含任何Anthropic的专有代码。所有代码开源在GitHub上,你可以完全审计它的行为,确保没有后门或数据泄露风险。对于企业用户来说,这一点至关重要。

    3. 性能卓越,Rust加持

    Claw Code的Rust核心占比72.9%,这意味着关键路径的性能可以媲美C++。相比纯Python实现的AI工具,Claw Code在处理大型代码库、并行执行任务时,速度提升显著。

    4. 生态丰富,MCP加持

    Claw Code完整支持MCP(模型上下文协议),可以连接数百个外部工具服务器。无论是数据库、API、文件系统,还是专门领域工具,都可以通过MCP集成到Claw Code中。

    5. 社区活跃,迭代迅速

    Claw Code的GitHub仓库有2100+个开放议题,335个关注者,56k+个Forks。社区非常活跃,每天都有新的PR和Issue,项目迭代速度极快。你遇到的问题,通常几天内就能得到修复。

    个人使用心得:我试用Claw Code已经两周了,最大的感受是——它真的能”理解”你的代码库。不像其他AI助手只能看到当前文件,Claw Code可以读取整个项目,理解模块之间的依赖关系,给出的建议非常精准。特别是多智能体编排功能,处理复杂任务时效率惊人。

    ······················

    ## 📥 下载地址

    快速开始

    # 一键安装(Linux/macOS)
    curl -fsSL https://claw-code.codes/install.sh | bash

    # 或者使用pip安装
    pip install claw-code

    # 启动Claw Code
    claw-code

    ······················

    Claw Code —— 让AI真正成为你的编程伙伴,而不是简单的代码补全工具。🚀
    如果你喜欢这个项目,记得去GitHub上点个Star支持开发者!

  • 李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱



    李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱

    5月19日,AMD上海AI开发者日,零一万物CEO李开复和AMD CEO苏姿丰进行了一场对话。他们讨论的核心问题很直接:企业砸钱做AI,到底能不能换来真实的商业回报?李开复的回答很犀利——如果你的AI部署没有改变季度财报里的任何一个数字,那你做的就不是真正的AI转型,只是浪费钱。


    AI的三个阶段:从任务到职能部门

    李开复把AI的发展分成了三个阶段。2024年,大家关心的是”AI能不能完成一个任务”;2025年,问题变成了”AI能不能完成一整条工作流”;到了2026年,核心问题已经进阶为”AI能不能替代一个企业的职能部门”。

    这个判断很关键。它意味着AI不再是辅助工具,而是要真正承接一个部门的核心目标。比如HR部门,从招聘、面试、入职到绩效跟踪,整套流程都由AI智能体系统完成。

    李开复提到,真正值得AI介入的,是那些直接影响损益表的核心环节:收入、利润、供应链、动态定价、防欺诈。这些恰恰是高管们最不愿意让AI介入的领域。

    为什么CIO主导的AI转型会失败

    李开复抛出了一个有点”政治不正确”的观点:传统CIO(首席信息官)主导的自下而上AI转型,大概率会失败。原因是,CIO的职责是管理软件运营,不是重新定义公司。他们倾向于在不出错但价值极低的场景部署AI——会议纪要、HR聊天机器人、内部搜索,这些都是表面文章。

    真正能改变公司经营结果的,往往是那些高管最不愿意让AI介入的运营职能部门。所以,企业AI转型必须是”一把手工程”,由CEO自上而下推动。

    AI编程能力跨过临界点

    推动AI从”辅助工具”进化到”职能部门替代者”的,是两大关键变化。第一,AI编程能力跨过了临界点。一年前,AI只能辅助编写代码;现在,它可以端到端地交付一整套功能。智能体在数字世界中的所有行为,本质上都落到代码层面。一旦AI编码能力跨过门槛,自主智能体就成为现实。


    多智能体架构:AI世界的”美第奇效应”

    第二个变化,是大家意识到单一智能体的能力存在上限。无论模型参数多大,单个Agent的推理能力终究会碰到瓶颈。而多智能体架构打破了这一上限。

    李开复用”美第奇效应”来比喻:当不同领域的专家被放进同一个房间,产出远超任何单一个体。五百年前人类发现了这一规律,现在他们把它带到了AI世界。招聘Agent与绩效Agent联动,系统可根据员工入职后的绩效数据,自动调整前端筛选标准。

    苏姿丰的印证:一个人能干完整个团队的事

    苏姿丰从算力基础设施的角度印证了这一趋势。她透露,AMD内部工程师已经在用AI智能体加速产品设计与验证。一个人加上合适的工具和算力,如今能完成几年前整个团队的工作。

    但多智能体系统对算力的要求也变了。李开复指出,未来极致的token效率和本地化处理能力会是关键。系统必须满足本地优先、端侧处理、低于100毫秒的响应延迟,多智能体协同才能真正具备现实可行性。

    苏姿丰提到,AMD比很多公司都看得更早、更清楚。随着AI走向多智能体架构,也必须重新思考”算力”本身的定义。

    开源势不可挡,中国生态有独特优势

    对于开源生态,两位嘉宾都表达了乐观态度。苏姿丰提到,开源AI社区正在涌现出大量创新,而且这个生态已经越来越全球化。李开复则更直接:”开源势不可挡。闭源模型类似苹果iOS,追求高利润和强控制;开源社区则成了AI世界的安卓,拥有更广覆盖和更大规模。”

    他特别指出,中国开源生态因为硬件资源受限,反而转向极致的工程效率、算法优化和架构创新,形成了独特优势。


    未来图景:”自主企业”和”一人公司”

    面向未来,李开复提出了两个值得思考的趋势。第一,未来真正意义上的”自主企业”会诞生,驱动它的是跨部门、多层级协同的智能体网络。下一阶段产业AI转型将围绕两个核心展开:数据主权和清晰可验证的ROI。

    第二,”一人公司”趋势正在出现。借助模块化的多智能体框架,单个开发者或领域专家,如今有能力像总架构师一样,快速启动一家高度自动化运转的公司。

    DRI模型:AI原生公司的核心组织架构

    在组织架构层面,李开复提出了DRI(直接责任人)模型。他预测,这会成为AI原生公司最核心的组织架构。DRI就是一个人对某个跨职能结果承担端到端责任,不是头衔,而是一种明确的责任机制。

    在这个模式下,人类DRI处于智能体系统的中心,周围是研究、执行、合规、监控等Agent集群。DRI负责整体编排、关键决策和最终输出契约。实时数据流取代传统汇报,业务运转围绕可量化的结果展开。

    对工程师来说,这意味着价值衡量标准的变化。在智能体时代,工程师的价值不再由写了多少代码来衡量,而是对结果负责,拥有决策权,并有规划地配置智能体集群。



  • MIT发布2026年AI十大趋势:从人形机器人训练数据到AI反制浪潮



    MIT发布2026年AI十大趋势:从人形机器人训练数据到AI反制浪潮

    MIT Technology Review 2026年AI趋势
    MIT Technology Review 发布2026年AI十大趋势报告

    MIT Technology Review发布了2026年”当下AI领域最重要的10件事”清单。这是该刊首次将AI领域的核心趋势、行业动态、前沿进展汇总为单一清单。从人形机器人训练数据到AI反制浪潮,这10个趋势正在重塑整个行业。


    人形机器人的”动作库”正在建立

    训练AI理解物理世界,需要的不再只是文本。现在,无数摄像头对准工厂工人、仓库管理员、甚至远程操控的”傀儡机器人”,记录他们每一个动作。这些视频会成为下一代人形机器人的训练数据。问题是,这种规模的采集能不能真的让机器人学会干活,现在还没人能打包票。

    MIT Technology Review认为,人类动作视频正在成为人形机器人训练的新”石油”,只是这套方法论还没被验证过。

    大语言模型没过时,只是需要升级

    LLM已经席卷全球,但容易摘的果子基本摘完了。整个行业都在找下一个爆点,但大语言模型本身不会消失。它还有大量潜力没释放——更长的上下文、更好的推理、更强的多模态能力。只是,光靠把模型做得更大,已经不够了。

    诈骗的门槛正在被AI削平

    钓鱼邮件、深度伪造电话、自动化的社交工程攻击——AI正在让这些事变得更快、更便宜、更容易上手。以前需要耐心和技术的活儿,现在脚本小子都能干。这对普通用户来说,意味着你收到的每一条”紧急信息”都可能是AI生成的。


    世界模型:让AI理解物理规律

    大语言模型擅长处理文字,但它们不了解物理世界是怎么回事。AI公司现在想构建”世界模型”——能理解重力、因果关系、空间结构的系统。如果做成,AI就不只是聊天机器人,它能真正进入工厂、仓库、医院,在真实世界里做决策。

    战场上的AI:从辅助到决策

    算法早就在做军事情报分析了,但生成式AI正在进入作战室。指挥官开始认真考虑AI的建议——该把资源投到哪里、怎么预测敌人的下一步。这改变的不只是技术,还有军队和科技巨头合作的方式,甚至是什么时候该按下”开火”按钮的决策逻辑。

    MIT的报道指出,AI在军事领域的渗透速度比大多数人意识到得要快,而且这次不只是自动化,是真正的决策参与。

    深度伪造的武器化已经到来

    Grok大规模生成非自愿色情图像、美国政府用AI技术做宣传——人们长期预警的”武器化深度伪造”威胁,现在已经不是预言,是正在发生的事。假视频、假音频、假文章,正在成为信息战的一部分。

    多智能体协作:从单打独斗到团队合作

    第一代AI智能体只能做单一任务——运行浏览器、写几行代码。下一代智能体会组队工作,一个负责研究,一个负责写代码,一个负责测试,互相协调完成复杂目标。这就像从”一个工程师”进化到”一个产品团队”。


    中国的开源赌注:免费的前沿模型

    中国实验室把前沿模型免费开放,这招赢得了全球开发者的好感。现在,世界各地都有人在基于中国的开源模型做开发。问题是,这种模式能不能赚钱?没人知道答案。但不管怎样,开源的势头已经起来了。

    AI科学家的出现:诺奖级别的合作者?

    高校和企业都在开发能自主完成研究任务的AI智能体——不只是查文献,而是提出假设、设计实验、分析结果。一些业内人士相信,这类AI合作科学家未来可能做出达到诺贝尔奖级别的研究成果。当然,这话现在听起来还有点早。

    反AI浪潮正在汇聚

    经过多年几乎不受约束的AI发展,全球范围内正在形成一股强大的反对力量。保守派、自由派、艺术家、工会——不同立场的人开始在同一个问题上发声:AI跑得太快了,我们需要刹车。这股力量已经开始在一些具体问题上取得小范围胜利。



  • Google出手了:CodeMender直指Anthropic Mythos,AI安全大战打响

    Anthropic的Claude Mythos Preview大模型发布的时候,整个AI圈都震了一下。这个模型强到什么程度呢?它不仅在代码安全漏洞识别上表现出色,还吸引了多家顶级银行、甚至美联储主席的关注。因为能力太强,Anthropic起初被认为不适合公开发布,最后只开放给早期企业用户和政府机构使用。

    Google坐不住了

    就在大家都觉得Anthropic在AI安全赛道上”一骑绝尘”的时候,Google在I/O 2026大会上悄悄亮了一张牌:CodeMender。这个工具早在2025年10月就首次亮相,但当时没有引起太大波澜。现在,Google把它重新推到台前,明确对标Anthropic的Mythos。

    CodeMender的核心能力是同时识别并修复代码库中的安全漏洞。和Mythos不同的是,它不只是”发现”问题,还能”解决”问题。这个设计很聪明:企业客户需要的不是一份漏洞清单,而是一个能帮他们把漏洞修好的工具。

    Google CEO桑达尔·皮查伊公开表示:”Mythos证明了超大参数规模模型在安全类场景中有明确价值,而我们同样具备提供这类产品的能力。”

    开放策略:从小范围到逐步扩大

    Anthropic的Mythos目前只面向早期企业用户和政府机构小范围开放,没有公开发布。Google则采取了不同的策略:在I/O 2026之后,他们向特定专家群体开放了CodeMender的API测试权限,逐步扩大开放范围。

    这个策略背后有Google的算盘。他们已经和政府、企业客户展开沟通,推动CodeMender用于系统安全审计。和Anthropic的”高冷”路线不同,Google更想快速把这款产品推向市场,用生态优势(Google Cloud、Android、Workspace)来绑定客户。

    AI安全赛道为什么突然火了

    其实在Anthropic发布Mythos之前,AI安全这个赛道并不算热门。大多数公司更关心的是”怎么让模型更聪明”,而不是”怎么让模型更安全”。但Mythos的出现改变了这个认知:安全,也可以成为大模型的核心卖点

    这对AI公司来说是个好消息。因为”安全”这个东西,企业和政府愿意买单,而且价格不菲。Anthropic的Mythos主要面向高安全需求的企业和政府客户,定价肯定不便宜。Google看到这块肥肉,当然也想分一杯羹。

    • 客户选择更多了:政府、金融、关键基础设施等领域的客户,之前在AI安全服务上的选择很有限,Google CodeMender的入场提供了更多元化的选择
    • 技术迭代会更快:有竞争才有进步,Google和Anthropic在这个赛道上”掰手腕”,最终会让AI安全技术的能力提升得更快
    • 价格可能会下降:垄断市场的高价,在竞争出现后通常会有所调整,客户可以期待更合理的定价

    Google的真实算盘

    除了在AI安全赛道上和Anthropic竞争,Google推出CodeMender还有更深层的目的:为IPO铺路。有消息称,Google的母公司Alphabet正在为2026年的IPO做准备,而”AI安全解决方案提供商”这个定位,比”搜索引擎公司”性感得多,也更容易在资本市场上讲出一个好故事。

    不管怎么说,AI安全大赛道的竞争才刚刚开始。Anthropic验证了市场需求,Google跟进布局,接下来可能还会有更多玩家入场。对我们这些旁观者来说,这出好戏,才刚拉开帷幕。

  • Antigravity 2.0发布:Google把智能体编程玩出了新花样

    Google I/O 2026第一天,全场都在聊Gemini 4.0和那些炫酷的XR眼镜,但我觉得真正值得开发者关注的,反而是这个看起来没那么起眼的Antigravity 2.0。要知道,上次Google推出Antigravity 1.0的时候,大家还在拿它跟Cursor对比,觉得Google不过是做个”追随者”。但这次2.0版本一出来,味道完全变了。

    从编程工具到智能体平台

    Antigravity 2.0最核心的变化,是它不再只是一个”帮你写代码的AI工具”,而是一个完整的智能体编程平台。这个定位变化很关键,意味着Google对这类产品的理解已经往前走了一大步。

    你可以把它理解成:之前1.0版本是”你问它答”的单兵作战模式,现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度,你可以让一个智能体去写前端,同时另一个去处理后端的API,还有一个在后台跑测试。这种”智能体编排”能力,是目前市面上大多数AI编程工具还没摸到门槛的东西。

    Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动,这个模型本身就是和Antigravity团队协同开发的。换句话说,Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

    三个细节看出Google的野心

    第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”,它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”,而是它意味着Antigravity正在向Google的消费级产品(Gmail、Docs的语音交互)对齐。未来的开发工具,可能真的就是”动动嘴皮子”的事。

    第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力,搜索结果页面不只是给你一堆蓝色链接,而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味:Google正在把它的”智能体能力”渗透到用户旅程的每一个触点,而不只是局限在一个独立的IDE或者编辑器里。

    第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发,也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显:Google不想让你”只在Antigravity里干活”,而是希望你用它的全套开发栈。

    订阅体系背后的算盘

    这次Antigravity 2.0是跟着Google的AI Ultra订阅计划(100美元/月)一起推出的。在这个价位下,Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法:他们不是想靠Antigravity单独赚钱,而是想用这个工具把开发者”锁”在Google的AI生态里。

    你可以对比一下:Cursor的订阅是20美元/月,GitHub Copilot是10美元/月,但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”,这个定位差异决定了它的定价空间可以更高。


    桌面应用和CLI双双升级

    除了核心的智能体编排能力,Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流,你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程,然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”,Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

    总体来看,Antigravity 2.0的这次更新,信号很明确:Google不想在AI编程这个赛道里只做一个”中庸的跟随者”,它想用生态优势(搜索、Workspace、Android、Firebase)和智能体编排能力,重新定义”什么是AI时代的开发工具”。