博客

  • GPT-5.5 Instant全面上线:ChatGPT默认模型升级,数学推理大涨24%

    OpenAI在5月5日把这周默认模型换成了GPT-5.5 Instant,替代了之前的GPT-5.3 Instant。这次升级不是小修小补——数学测试AIME 2025从65.4分拉到81.2分,多模态推理MMMU-Pro从69.2涨到76分。如果你用过GPT-5.3觉得数学推理还差点意思,这一版能感觉到明显进步。

    GPT-5.5 Instant 记忆功能更新
    GPT-5.5 Instant 新增记忆功能,可引用过往对话和关联Gmail账户(图源:OpenAI)

    幻觉率下降,但OpenAI没给具体数字

    OpenAI在公告里说GPT-5.5 Instant在法律、医疗、金融这些高风险领域的幻觉减少了,但没公布具体百分比。TechCrunch的报道也确认了这一点——知道它减少了,但不知道减少了多少。对比隔壁Claude时不时自己编造个引用来源,GPT-5.5 Instant这波升级至少在”不乱说”这件事上下了功夫。

    GPT-5.3 Instant的AIME 2025分数是65.4,GPT-5.5 Instant是81.2——这个跳跃幅度相当于从”能做对大部分”到”基本不会错”。多模态推理的提升同样显著,这意味着看图做题、理解图表这些能力也跟着涨了。

    新记忆功能有点东西

    这波更新最实用的功能,是GPT-5.5 Instant新增的记忆能力。模型现在可以引用你之前的对话记录、上传过的文件、甚至关联的Gmail账户内容来生成更个性化的回复。比如你之前跟它讨论过某个项目,下次接着问的时候它记得上下文,不用你重新介绍背景。

    • ChatGPT Plus/Pro用户:已可使用(网页版)
    • 移动端:即将推出
    • Free/Go Business/企业用户:未来几周内开放
    • 记忆来源可视化:用户可查看、编辑、删除记忆源

    默认模型这件事意味着什么

    ChatGPT的默认模型,全球有数亿人在用。把GPT-5.5 Instant设成默认,等于OpenAI在对用户说:这是目前综合体验最好的模型,不需要你手动切换。对比Anthropic那边要用户自己选Opus还是Sonnet,OpenAI的策略更直接——我帮你选好了,你就用这个。

    从GPT-5.3到GPT-5.5,中间隔了不到两个月。这个迭代速度说明OpenAI现在已经把模型升级做成了”持续交付”模式,而不是以前那种一年一次大版本的节奏。对开发者来说,这意味着API背后的模型能力在悄悄变强,但你不一定能感知到具体是哪天升级的。

  • Isomorphic Labs完成$21亿B轮融资:AI制药从 Nobel 奖走向临床

    Demis Hassabis 2021年从DeepMind分拆出来的Isomorphic Labs,这周宣布完成21亿美元B轮融资,领投方是Thrive Capital。算上这一轮,公司累计融资接近26亿美金,直接把AI制药这个赛道的天花板顶到了一个新高度。

    Isomorphic Labs的核心资产是AlphaFold——那个2024年拿了诺贝尔化学奖的蛋白质结构预测系统。以前科学家要花数年才能解析一个蛋白质的三维结构,AlphaFold能在几分钟内给出高精度的预测结果。Isomorphic要做的事,就是把这个能力商业化,用AI设计新药分子。

    AlphaFold已经预测了超过2亿个蛋白质结构,覆盖几乎所有已知的蛋白质编码基因。这个数据库对全球科研人员免费开放,但Isomorphic Labs的商业模式是在这个基础上做药物设计,而不只是结构预测。

    投资者的阵容很有意思

    这轮除了Thrive Capital领投,Alphabet(谷歌母公司)和GV(谷歌风投)继续跟投,说明谷歌内部对这个函数还是很有信心。新进来的投资者包括MGX(阿联酋主权基金)、Temasek(新加坡淡马锡)、英国主权AI基金。一个AI制药公司,能让多个国家主权基金同时下注,这个信号值得琢磨。

    融资额21亿美元是什么概念?对比一下:Anthropic最新一轮融资30亿美金,估值900亿;Isomorphic这一轮单轮21亿,已经超过了大部分AI公司的累计融资额。投资者现在不是在用”研究项目”的标准来评估AI制药,而是在用”下一个Google DeepMind”的标准在下注。

    AI设计的药物真的要上临床了

    Isomorphic Labs在融资公告中提到,他们第一个AI设计的分子即将进入人体临床试验。这意味着,从AlphaFold获诺贝尔奖到第一款AI设计药物进入临床,只用了不到两年。这个速度在传统制药界是不可想象的——一个新药从发现到临床,通常需要5到10年。

    • 传统制药:5-10年药物发现 + 临床试验,成功率低于10%
    • AI制药(Isomorphic模式):18个月完成药物设计,靶点预测精度大幅提升
    • 第一家AI设计药物进入临床的时间节点:2026年内

    为什么是现在

    AI制药不是一个新概念,但之前一直卡在两个地方:一是蛋白质结构预测不够准,二是AI设计的分子在真实生物系统里不一定work。AlphaFold把第一个问题解决了,第二个问题现在也有了进展——Isomorphic用的是”闭环验证”策略,AI设计分子后会用湿实验(wet lab)验证,再把结果喂回模型。

    这个21亿美元的融资轮,本质上是在赌一件事:AI设计的分子能在人体里安全地起作用。如果Isomorphic的临床实验数据好,整个制药行业的研发范式会被重写。如果失败了,这21亿就是目前为止AI泡沫最大的单笔”学费用”。

  • 微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    📖 项目简介

    这是微软官方推出的AI智能体零基础入门免费课程,包含12+节核心课程,覆盖从基础概念到生产落地的全流程。支持50+种语言本地化,每节课配套文字教程、视频讲解、可运行代码示例和扩展学习资源,是系统学习AI智能体开发的最佳起点。

    63.2k+
    GitHub Stars

    🔧 安装要求和过程

    环境要求

    • Python 3.8+ 环境
    • Azure账户(用于Microsoft Foundry和Azure AI Foundry Agent Service V2)
    • Git(用于克隆仓库)

    快速安装步骤

    # 稀疏克隆(推荐,不包含50+语言翻译文件)
    git clone --filter=blob:none --sparse https://github.com/microsoft/ai-agents-for-beginners.git
    cd ai-agents-for-beginners
    git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
    
    # 安装依赖
    pip install -r requirements.txt
    
    # 配置环境变量(复制示例文件)
    cp .env.example .env
    # 编辑.env文件,填入Azure/OpenAI配置
    ⚠️ 注意:如果是首次接触生成式AI开发,建议先学习微软出品的《Generative AI For Beginners》21节入门课打好基础。

    ✨ 核心功能

    🎓 完整课程体系

    12+节核心课程,从AI智能体介绍、设计模式到生产环境部署,每节课包含文字教程+视频+代码示例。

    🌍 多语言支持

    支持50+种语言本地化,包含中文(简体、繁体)、日语、韩语、法语、德语等主流语言。

    🔌 技术栈兼容

    优先采用微软智能体技术栈,同时支持OpenAI兼容的第三方提供商(如MiniMax,支持204K token上下文)。

    🛡️ 生产级内容

    覆盖可信智能体构建、内存管理、上下文工程、安全防护、部署可扩展智能体等实战内容。

    🎯 典型使用场景

    场景1:零基础系统学习AI智能体开发

    适合没有AI智能体开发经验的开发者,通过12+节课程系统学习概念、框架、设计模式等入门知识,每节课都有可运行的代码示例。

    场景2:学习智能体从开发到生产落地的全流程

    包含可信智能体构建、内存管理、上下文工程、安全防护等实战内容,帮助开发者掌握生产级AI智能体的开发技能。

    场景3:熟悉微软智能体技术栈

    学习Microsoft Agent Framework、Azure AI Foundry等微软官方智能体框架的使用,适合需要在Azure平台部署AI智能体的开发者。

    💡 推荐理由

    说实话,如果你想要系统学习AI智能体开发,这门课程绝对是最佳起点。我特别喜欢它的几个设计:

    • 官方出品,质量有保障:微软官方团队维护,内容紧跟技术前沿,包含最新的MCP、A2A、NLWeb等智能体协议。
    • 理论与实践结合:每节课不仅有文字教程,还有配套视频讲解和可运行的Python代码示例,学完就能动手实践。
    • 多语言支持:支持50+种语言,中文开发者可以直接看中文教程,降低学习门槛。
    • 社区活跃:有官方Discord交流频道和开发者反馈论坛,遇到问题可以快速获得帮助。

    我觉得这门课程最值得称赞的是它的系统性——从基础概念到生产落地,从单智能体到多智能体协作,从设计模式到安全防护,几乎覆盖了AI智能体开发的方方面面。无论你是刚入门的新手,还是有一定经验的开发者,都能从中获得价值。

    📥 下载地址


    📌 数据来源:GitHub + 微软官方文档 | 更新时间:2026-05-18

  • Anthropic接近$900B估值融资关闭:算力军备竞赛进入新量级

    Bloomberg的消息说,Anthropic这笔至少$300亿的新融资、投后估值$900亿以上的轮次,预计5月底就能关闭。截至5月16日,条款清单还没签,但各方已经在按这个时间表推进。

    如果最终落在$900B,Anthropic的估值将首次超过OpenAI——后者今年3月刚拿到$852B的投后估值。而更夸张的是,Anthropic自己今年2月的估值才$380B。三个月涨了2.37倍,这不是普通的增长型融资,这是算力军备竞赛的入场券。

    领投方阵容:硅谷最豪华的算力押注

    这一轮的联合领投方是Sequoia、Dragoneer、Greenoaks和Altimeter。这个组合本身就说明了很多问题——不是早期VC在赌概率,而是成长期的重量级基金在押注”算力即护城河”这个逻辑。

    Anthropic CEO Dario Amodei已经明确说了,这笔钱主要去向是两个:Amazon Web Services和Google Cloud的算力承诺,合同已经签到了2027年。翻译一下就是:我先把未来三年的算力锁死,你们其他家自己去排队吧。


    为什么是现在?Google I/O前的时间窗口

    把时间线摆在一起看就很有意思了。Google I/O是5月19日,Anthropic选在I/O之前把融资消息放出来,战略意图相当明显——在谷歌可能凭借Gemini 4.0夺回叙事主导权之前,先把自己的估值天花板顶上去。

    这也解释了为什么Anthropic愿意以$900B的估值融资。不是因为这个价格”合理”,而是因为他们在跟时间赛跑——在谷歌、Meta、xAI全部加码算力的窗口里,谁先锁定长期算力合同,谁就掌握了下一代模型的上限。


    算力即模型能力:一个被低估的逻辑

    外面很多人还在讨论”哪个模型更聪明”,但Anthropic、OpenAI和谷歌内部的人都知道,2026年的竞争核心不是算法,是算力。你能调度多少H100/B200,决定了你的模型能跑多大、跑多快、跑多稳。

    Anthropic同时还租了SpaceX的Colossus 1超算——22万块以上NVIDIA GPU,300兆瓦的算力规模。这不是临时补救,这是在AWS和Google Cloud的算力完全上线之前(2027年)的一座桥。Dario Amodei的计算是:等竞争对手反应过来,我已经跑了两年了。


    Q1营收80倍增长:融资背后的商业验证

    估值不是凭空来的。Anthropic在5月11日披露,2026年Q1营收同比增长80倍,当前ARR超过$440亿。年消费百万美元以上的客户,两个月内从500家翻倍到1000家以上。

    这些不是试点客户。PwC、Blackstone、Goldman Sachs、Hellman & Friedman、Gates基金会——这些都是生产级部署。Anthropic总裁Daniela Amodei的定位很清晰:Claude不是聊天机器人,是企业的操作系统。80倍的营收增长说明市场正在用真金白银为这个定位投票。


    月底见分晓

    如果这一轮真的在5月底关闭,AI产业格局会在48小时之内被重写。OpenAI盘了三年的”最值钱AI公司”头衔,将被一家成立才五年的公司夺走。

    对开发者来说,这意味着什么?更多的算力意味着Claude的能力上限会持续提升,API的可用性会更高,响应会更快。竞争的受益者永远是用户——这一轮融资的终极输家,可能是那些还在犹豫要不要全面切换到AI工作流的人。

  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜、Aluminium OS,谷歌全产品线押注AI

    明天(5月19日)上午10点PT,Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

    Gemini 4.0:直接对标Claude Mythos

    谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示,这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分,谷歌就能在这一周里重新掌握AI叙事的主导权。

    有意思的是,谷歌在5月12日的Android Show上已经把平台级更新提前发布了,I/O专门留给模型发布和硬件,这个节奏安排相当聪明——避免自家产品抢流量,把最炸的牌留到主会场。


    Android XR眼镜:跟Meta的又一次对决

    硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

    这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是,谷歌的方案更彻底:不靠镜片显示,而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打,I/O上应该会有更详细的交互演示。


    Aluminium OS:ChromeOS的终点,Android桌面的起点

    一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示,这个新系统长得像一个放大版Android:底部Dock、虚拟桌面、完整应用窗口,就是没有传统Linux底层的那种笨重感。

    如果Aluminium OS真的能在2026年完成ChromeOS的替换,谷歌就拥有了一条从手机(Android)到平板(Android XR)到笔记本(Aluminium)到云(Google Cloud Agentic Toolkit)的完整AI设备链路。苹果还没把这个拼图拼完整。


    Google Cloud Agentic Toolkit:企业智能体的定价终于要透明了

    对企业用户来说,这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊,这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

    讲真,企业在选智能体平台的时候,定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里,谷歌如果还在绕圈子,企业客户会用脚投票的。


    战局研判:这一周的胜负手

    把时间线拉远一点看,这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮,谷歌在5月19日放大招,Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

    如果Gemini 4.0的实测表现真的能打,谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平,那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

    明天上午10点PT,答案揭晓。

  • 五大前沿AI实验室被纳入政府监管:模型发布前要先过这一关

    美国商务部下属的AI安全与基础设施局(CAISI)近期悄悄干了一件事——和OpenAI、Anthropic、Google DeepMind、微软、xAI这五家前沿AI实验室全部签署了预部署评估协议。意思是,这些实验室的主流模型在正式发布前,得先过政府这一关。

    不是自愿,是强制

    这份协议已经最终敲定,具有约束力。覆盖范围是五家实验室计划在美国境内发布的所有主流前沿模型。评估由CAISI主导,核心目标是排查模型的安全风险和合规隐患,防止模型发布后引发监管暴露问题。

    具体评估指标和详细内容目前没有公开,但可以参考英国AI安全研究所最新发布的红队测试指南——主要聚焦模型能力边界和潜在滥用风险。这个变化意味着,从模型官宣到API正式对外开放,中间会多一段政府评估的时间窗口。

    这标志着美国AI产业正式从”快速行动、打破常规”的野蛮生长阶段,转向受监管的基础设施类产业的监管逻辑——是行业结构性的监管转向。

    全球监管协同正在形成

    欧盟方面也在跟进。目前欧盟正与Anthropic洽谈Mythos模型的政府访问权限,但尚未达成与美国同等层级的协议。英国AI安全研究所则在Google I/O大会开幕前更新了红队测试指南,表明国际层面在协同关注前沿模型能力监管。

    对企业用户来说,这套新流程相当于给前沿模型加了一层官方信任背书——所有模型在发布前都经过政府评估,理论上能降低企业部署后遭遇监管处罚或合规风险的可能性。

    对行业意味着什么

    短期来看,模型发布节奏会受影响。实验室需要预留政府评估的时间,从完成训练到正式上线的时间窗口会被拉长。对于那些靠”抢先发布”来占据市场注意力的实验室来说,这不是一个好消息。

    但换个角度看,政府背书也能成为竞争优势。Anthropic在企业市场的迅猛增长,部分原因就是它的模型被认为”更安全、更合规”。当监管成为行业标准的一部分,跑赢合规反而可能是最好的市场策略。

    xAI作为名单里最新的成员,它的加入说明监管网已经覆盖了所有主流玩家,不管创始人埃隆·马斯克和华盛顿的关系如何,规则面前暂时人人平等。


  • 欧盟AI法案松口了:合规截止日期推迟,中型企业也能喘口气

    5月7日,欧盟理事会和欧洲议会谈判代表就AI法案简化方案达成临时协议,这是继2024年AI法案正式生效后,欧盟首次对规则进行大规模”松绑”。距离原定8月2日的高风险AI系统合规截止日只剩三个月,很多企业还没摸清门道,欧盟干脆把期限往后推了。

    宽松在哪里

    最直观的变化是截止日期——独立类高风险AI系统的合规期限从今年8月推到了2027年12月2日,嵌入医疗设备等受监管产品的高风险AI更是延至2028年8月2日。中间还有4个月的”水印义务宽限期”,今年8月2日前投放市场的生成式AI,可以等到12月2日再完成水印标注合规。

    受监管范围也在收窄。工业机械内置的AI系统,如果已经受欧盟《机械法规》覆盖,直接被剔除出AI法案监管范围。医疗设备、玩具、电梯等产品中内置的AI”安全组件”,只需要遵守对应行业的安全法规,不用再重复履行AI法案的义务。

    “安全组件”的定义被收窄了——只有当AI功能失效会直接造成健康或安全风险时,才会被认定为高风险AI的”安全组件”。那些只是用来辅助用户、优化性能的AI功能,不会再被自动划为高风险范畴。

    中小企业也受惠

    原来只有小微企业(SME)才能享受的简化合规政策,现在扩展到了员工不超过750人、年营收不超过1.5亿欧元的中型企业。这意味着一大批成长型AI公司可以享用简化合规指南、更低的罚款标准,以及监管沙盒的准入资格。

    还有一个挺有意思的放宽:企业现在可以使用GDPR定义下的特殊类别个人数据(健康信息、生物特征数据、种族、性取向等)来检测和缓解AI模型的偏见,不需要再走此前那套严苛的特殊数据审批流程。

    红线还在

    放宽不等于放任。”nudifier”类AI应用——也就是用来生成未经同意的亲密内容、儿童性虐待材料的系统——被新增为禁止项,今年12月2日起生效,违反禁止性规定的最高罚款是3500万欧元,或全球年营业额的7%,取高者。

    透明度义务(聊天机器人披露、深伪内容水印等)依然在8月2日生效,只是水印部分给了4个月宽限。罚款标准是不超过1500万欧元或全球年营业额的3%。


    企业该怎么应对

    宽限期多出来的这几个月的用处,是让企业把合规框架搭好,而不是继续拖。欧盟委员会到现在还没发布高风险AI系统的协调标准,等标准出来的时候,留给企业调整的时间可能还是不够。提前把风险分类、数据治理、技术文档这些基础工作做扎实,比临时抱佛脚要靠谱得多。

    还有一个现实问题:欧盟数据保护机构已经在AI领域开展GDPR执法了,已经有企业因为违规被罚款、相关AI应用被禁用。AI法案和GDPR是两套并行规则,合规的时候不能只盯着一个看。

  • Google DeepMind启动亚太加速器,用AI守护地球

    谷歌DeepMind最近宣布启动亚太区”AI for the Planet”加速器计划,要把AI用到气候变化这类棘手的环境问题上。亚太地区既是全球经济增长引擎,又是气候变化的高脆弱区,这个选择其实很有战略眼光。

    从生产力工具到行星级解决方案

    DeepMind这个动作,标志着它的定位正在发生根本性转变——不再只是做AlphaFold、大语言模型这类”生产力工具”,而是要把AI变成解决全球性问题的”行星级解决方案”。

    加速器计划为期三个月,入选团队会拿到DeepMind的技术资源、导师指导,还有机会跟DeepMind的研究员直接合作。重点是”AI智能体网络”——不是单个模型,而是多个AI协作去处理复杂的环境治理问题。

    亚太地区既贡献了全球三分之二的经济增长,也承载了最高的气候脆弱性。绿色技术虽然在兴起,但要把AI真正用到环境治理里,还需要更多的创新和实践。

    智能体网络是怎么解决环境问题的

    传统AI应用大多是”一个问题、一个模型”,但环境问题不是这样。气候变化、生物多样性丧失、海洋污染——这些都是系统性的问题,需要多个AI智能体协作,分别处理不同的子任务,然后整合出解决方案。

    举个例子:预测某个地区的洪灾风险,需要同时分析气象数据、地形数据、土地利用数据、人口密度数据……单个模型很难搞定这么复杂的输入。但如果是多个智能体分工——一个专门处理气象、一个专门分析地形、一个负责人口建模——最后把结果整合起来,准确性会高很多。

    亚太地区为什么是首选

    选亚太地区作为首个加速器落地点,背后有几层考虑。一是亚太国家的环境问题迫在眉睫——从东南亚的海平面上升,到印度的极端高温,再到中国的空气污染,都是需要紧急应对的现实挑战。二是亚太地区的科技创新生态正在快速成熟,有大量有潜力的初创团队和研究者。

    三是数据资源。亚太地区有全球最丰富的人口数据和环境监测数据,这对训练AI模型来说是金矿。DeepMind显然想通过这次加速器,跟亚太的研究团队建立深度合作,拿到这些数据资源。


    AI环境治理的想象空间

    这次加速器计划触及的,其实是一个被严重低估的方向:AI在环境科学和气候治理中的应用。过去几年,大家都在关注AI怎么改变办公、怎么颠覆搜索、怎么影响内容创作……但AI在科研、在环境治理、在应对气候变化方面的潜力,其实一点都不比那些”网红应用”小。

    如果这次加速器能跑出几个成功的案例,说不定会带起一波新的AI创业方向——不再是卷聊天机器人、卷内容生成,而是去做真正有社会价值的事情。

  • 前副总裁炮轰微软AI战略:每季度烧钱2700亿,96.7%用户说不

    微软前副总裁马特·韦洛索近日公开开火,说微软已经错失了这波AI浪潮,正在重蹈互联网和移动时代的覆辙。这位曾在微软首席执行官身边担任四年技术顾问的高管,抛出的数据相当刺眼——每季度烧掉375亿美元(约2715亿元人民币),但Microsoft 365的4.5亿用户里,96.7%的人拒绝使用Copilot的高级AI功能。

    强行捆绑反而把用户推远了

    微软的策略说白了就是”强推”——把Copilot直接预装到Windows 11任务栏和Office套件里,以为这样就能让用户就范。结果呢?用户不买账。付费数据更尴尬:4.5亿Microsoft 365用户里,只有约1500万人买了Copilot席位,付费率仅3.3%。

    这让我想起当年Windows Phone的结局。微软在移动互联网时代就是这么输的——有技术、有资源,但就是做不出用户真正想要的产品。现在AI这波,看起来历史正在重演。

    马特·韦洛索的核心观点很直接:微软已经错失了人工智能发展浪潮,当前的AI战略正在重蹈互联网与移动时代的覆辙,属于自嗨行为。

    硬件生态也没带起来

    过去一年,微软极力推动笔记本厂商集成NPU芯片,想复制当年Intel Inside的成功模式。但问题是,Windows和Office压根没开发出什么有价值的NPU用例。厂商跟着微软押注NPU,结果市场根本不买账。

    更要命的是,作为AI编码核心平台的GitHub,服务可靠性已经降到90%以下。对于依赖GitHub的开发者来说,这意味着每十次操作至少有一次会出问题。AI时代的”基础设施”居然这么脆弱,说实话有点不可思议。

    OpenAI绕开微软,直接杀入企业市场

    就在微软还在为Copilot的付费率发愁的时候,OpenAI已经悄悄布局了一手——成立名为”OpenAI部署公司”的新部门,拿到超过40亿美元(约290亿元人民币)的初始投资,配备150名部署工程师,直接驻扎在财富500强企业里提供定制化AI解决方案。

    这个打法很精明:绕开微软Azure这个中间商,直接切入利润最丰厚的企业服务层。对微软来说,这简直是釜底抽薪——全盘押注OpenAI、指望靠云服务变现的算盘,被OpenAI自己给砸了。


    微软正在被动调整

    面对用户的强烈反弹,微软已经开始缩减Windows 11中的Copilot功能,转而去优化原生用户界面性能。这等于承认了此前的策略有问题。但问题在于,每季度375亿美元的AI资本支出已经投进去了,现在调整方向,之前的投入怎么算?

    股东们已经在问了:这么多钱投进去,到底什么时候能看到回报?微软的答案目前看来还很模糊。AI确实是未来,但砸钱不等于能砸出好产品,这个道理微软好像还没真正想明白。

  • OpenClaw:373k Stars!登顶GitHub的AI Agent,让AI从对话进化到执行

    OpenClaw:373k Stars!登顶GitHub的AI Agent,让AI从对话进化到执行

    🔥 302k+ Stars!登顶GitHub的全球最热AI Agent项目

    OpenClaw Logo

    OpenClaw – 个人开源AI助手

    📌 项目简介

    OpenClaw 是一款登顶GitHub全球榜首的开源AI Agent项目(373k+ Stars),它将AI从”对话生成”升级为”任务执行”,可以像私人助理一样直接操作你的电脑、浏览器和文件系统,把自然语言指令转化为实际行动。

    💻 安装要求与过程

    环境要求:

    • Node.js 20+(推荐Node.js 20 LTS)
    • Windows用户需要WSL2(强烈推荐)
    • 开发环境需要pnpm包管理器

    快速安装步骤:

    # 使用npm全局安装
    npm install -g openclaw@latest
    
    # 或使用pnpm
    pnpm add -g openclaw@latest
    
    # 运行引导向导,设置守护进程
    openclaw onboard --install-daemon
    

    开发环境搭建:

    # 克隆仓库
    git clone https://github.com/openclaw/openclaw.git
    cd openclaw
    
    # 安装依赖(仅支持pnpm)
    pnpm install
    
    # 初始化本地配置
    pnpm openclaw setup
    
    # 启动开发服务器(支持热重载)
    pnpm gateway:watch
    

    ✨ 核心功能

    1. 本地优先架构:所有数据存储在本地设备,无需强制上云,隐私完全自主掌控
    2. 20+平台无缝接入:支持WhatsApp、Telegram、Slack、Discord、微信、QQ等主流通讯平台
    3. 多Agent路由:不同渠道的消息可以路由到独立的Agent,每个Agent拥有独立工作空间和会话上下文
    4. 语音交互:支持macOS/iOS语音唤醒、Android连续对话模式,内置ElevenLabs TTS
    5. Live Canvas:Agent驱动的可视化工作空间,支持A2UI(Agent-to-UI)协作执行任务

    🎯 典型使用场景

    场景1:跨平台个人助理
    通过现有通讯应用(如WhatsApp、Telegram)与AI助手交互,无需切换APP即可获取答案、设置提醒、起草内容、自动化日常任务。

    场景2:隐私优先的自托管方案
    在企业或家庭服务器上运行OpenClaw,所有对话和任务数据完全保存在本地,满足对数据主权有严格要求的场景(如医疗、金融、法律)。

    场景3:自定义工作流自动化
    利用cron任务、webhooks和自定义技能,实现每日天气预报、日历提醒、社交媒体定时发布等重复任务的自动化执行。

    💡 推荐理由

    我觉得OpenClaw最厉害的地方在于它真正实现了”AI执行”而不只是”AI对话”。以前的AI工具(包括ChatGPT)主要是帮你生成内容,而OpenClaw可以直接帮你操作电脑——比如你告诉它”帮我下载这个网页的所有图片并分类保存到文件夹”,它真的会去执行!

    另外一个亮点是它的”本地优先”设计理念。现在很多AI工具都强制上云,数据隐私是个大问题。OpenClaw让你可以在自己的设备上运行,数据完全不出本地,这点对我来说很有吸引力。

    当然,目前项目还在快速迭代中,有些版本可能会有bug(比如2026.3.2版本的工具权限问题),建议跟进官方文档和社区讨论。总体来说,如果你想体验最前沿的AI Agent执行能力,OpenClaw绝对值得一试!

    📥 下载地址


    文章来源:GitHub热门AI开源项目自动介绍系列 | 更新日期:2026-05-18