标签: AI

  • Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude






    Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude

    美西时间5月19日10点(北京时间明天凌晨2点),Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数,可能会错过真正值得看的东西。

    Gemini 4.0:谷歌的”必须赢”时刻

    从上次Google I/O到现在,AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场,GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩(GPQA 94.6%),谷歌今年在AI叙事上就又要当配角。

    外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键,也是谷歌云如果能把Gemini嵌进企业工作流的机会。

    外界预测Gemini 4.0的参数规模可能达到3万亿级别,但参数规模已经不是重点。重点是:它能不能在企业生产环境里稳定运行,而不是在 benchmark 上刷分。

    Android XR眼镜:谷歌的硬件”第三次尝试”

    谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook,每一个都曾是”下一代计算平台”。这次的Android XR眼镜,谷歌学聪明了:不搞封闭生态,拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

    无屏版2026年就能买到,价格区间会很宽——从入门级到高端产品都会有。关键是交互:免提召唤Gemini,用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”,这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

    Aluminium OS:ChromeOS的”Android化”

    这个泄露了好几个月的”ChromeOS替代系统”,本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示:底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

    为什么要做这个?因为Chromebook在教育市场站稳了,但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行,对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。


    Google Cloud Agentic Toolkit:企业AI的”最后一公里”

    这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺,很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

    PwC前几天刚宣布把Claude部署到全球几十万员工,用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”,光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”,不是”分数更高的模型”。

    该怎么看这场发布会?

    如果你期待谷歌在I/O上”一统AI江湖”,可能会失望。但如果你关心的是:Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案,会在接下来48小时内慢慢浮现。

    谷歌有什么?Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局,谷歌手里的牌其实比大多数人想的好。

    📎 原文来源:综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道


  • 普华永道把Claude塞进了全球几十万员工的电脑里






    普华永道把Claude塞进了全球几十万员工的电脑里

    5月14日,Anthropic和普华永道(PwC)宣布把战略联盟扩大到一个新量级——Claude要进全球几十万专业人士的工作流。这件事的意义不只是”又一家大公司用了AI”,它其实标志着企业级AI从”试点”正式走向”生产部署”。PwC计划先在美国培训并认证3万名专业人员使用Claude,然后推广到全球网络。

    为什么是现在?

    PwC美国CEO Paul Griggs说得很直白:”AI的对话已经从可能性转向执行。”这句话背后有个残酷的现实——企业买了AI工具,但80%的试点项目死在了PoC阶段,根本没上线。PwC这次不一样,它自己先当”客户零号”(Customer Zero),把Claude在内部跑通了,才推给客户。

    具体怎么跑通的?PwC先把Claude用在自己的财务流程里——会计分录、差异分析、RFP撰写、年度预算优化。这些场景跑顺了,才打包成方案卖给客户。这种”自己先吃狗粮”的路径,比那些直接卖AI咨询的公司靠谱得多。

    效率数据:从10周到10天

    PwC给出的数据是:在已上线的生产部署场景中,客户报告交付时间缩短最高达70%。保险承保周期从10周压缩到10天;安全事件响应从数小时降到数分钟;一个卡了几个月的HR转型项目,1周出原型,2个月完整上线。

    这些数字不是PPT上的数字,是PwC已经在跑的案例。Anthropic CEO Dario Amodei在声明里直接用了这些数字——保险承保10周变10天,安全任务从小时级降到分钟级。对AI公司来说,敢把客户的具体效率数据写进官方新闻稿,说明他们真的有信心。

    三个主攻方向

    PwC和Anthropic把这次数百亿级的合作拆成了三个主攻方向:

    • Agentic技术构建——用Claude Code给大企业交付生产级软件,周期从”季度”压缩到”周”。覆盖金融、制药、医疗、消费品等行业。
    • AI原生交易服务——重新设计并购尽调的全流程,让AI Agent配合交易团队工作,压缩从投资逻辑到价值捕获的周期。
    • 企业职能重塑——用AI原生运营模式重构财务、供应链、HR、工程等职能部门。这不是”加点AI功能”,是把整个职能的工作方式重来一遍。

    还有一个独立的业务单元叫”CFO办公室”,完全基于Claude构建,专门为客户的财务组织做转型。首批盯准的是银行、保险、医疗这些对准确性和可审计性要求极高的行业。

    Claude的全产品矩阵进场

    这次部署不是只用一个聊天窗口。PwC会把Claude的全产品矩阵都推进去:

    • Claude——通用AI助手,已经内置在PwC的内部助手ChatPwC里
    • Claude Code——给工程团队写代码、做主框架现代化
    • Claude Cowork——直接嵌进电子表格、文档、演示软件,通过Anthropic的Model Context Protocol连接企业数据

    为什么这件事值得关注?

    PwC这次的动作,本质上是把”AI咨询”从卖PPT升级成了卖”可运行的系统”。它成立了和Anthropic的联合卓越中心,还加入了Anthropic的1亿美元Claude合作伙伴网络——这个网络专门背书那些能帮企业把AI真正部署上线(而不是只做试点)的服务公司。

    对国内做AI to B的团队来说,这个案例值得仔细看。PwC的打法是:先自己把流程跑通,拿到可验证的效率数据,再打包成方案。这种路径虽然慢,但一旦跑通,客户的付费意愿和续约率会高得多。

    Anthropic这边也拿到了它最需要的东西——在金融、医疗、生命科学这些”准确性比炫技重要”的领域里,有PwC这种级别的系统集成商帮它铺渠道。Dario Amodei说Claude的定位是”企业操作系统而不是聊天机器人”,这次合作算是给这句话补上了落地的一课。

    📎 原文来源:Anthropic官方新闻 – PwC Expands Alliance with Anthropic(2026年5月14日)


  • GPT-5.5 Instant全面上线:ChatGPT默认模型升级,数学推理大涨24%

    OpenAI在5月5日把这周默认模型换成了GPT-5.5 Instant,替代了之前的GPT-5.3 Instant。这次升级不是小修小补——数学测试AIME 2025从65.4分拉到81.2分,多模态推理MMMU-Pro从69.2涨到76分。如果你用过GPT-5.3觉得数学推理还差点意思,这一版能感觉到明显进步。

    GPT-5.5 Instant 记忆功能更新
    GPT-5.5 Instant 新增记忆功能,可引用过往对话和关联Gmail账户(图源:OpenAI)

    幻觉率下降,但OpenAI没给具体数字

    OpenAI在公告里说GPT-5.5 Instant在法律、医疗、金融这些高风险领域的幻觉减少了,但没公布具体百分比。TechCrunch的报道也确认了这一点——知道它减少了,但不知道减少了多少。对比隔壁Claude时不时自己编造个引用来源,GPT-5.5 Instant这波升级至少在”不乱说”这件事上下了功夫。

    GPT-5.3 Instant的AIME 2025分数是65.4,GPT-5.5 Instant是81.2——这个跳跃幅度相当于从”能做对大部分”到”基本不会错”。多模态推理的提升同样显著,这意味着看图做题、理解图表这些能力也跟着涨了。

    新记忆功能有点东西

    这波更新最实用的功能,是GPT-5.5 Instant新增的记忆能力。模型现在可以引用你之前的对话记录、上传过的文件、甚至关联的Gmail账户内容来生成更个性化的回复。比如你之前跟它讨论过某个项目,下次接着问的时候它记得上下文,不用你重新介绍背景。

    • ChatGPT Plus/Pro用户:已可使用(网页版)
    • 移动端:即将推出
    • Free/Go Business/企业用户:未来几周内开放
    • 记忆来源可视化:用户可查看、编辑、删除记忆源

    默认模型这件事意味着什么

    ChatGPT的默认模型,全球有数亿人在用。把GPT-5.5 Instant设成默认,等于OpenAI在对用户说:这是目前综合体验最好的模型,不需要你手动切换。对比Anthropic那边要用户自己选Opus还是Sonnet,OpenAI的策略更直接——我帮你选好了,你就用这个。

    从GPT-5.3到GPT-5.5,中间隔了不到两个月。这个迭代速度说明OpenAI现在已经把模型升级做成了”持续交付”模式,而不是以前那种一年一次大版本的节奏。对开发者来说,这意味着API背后的模型能力在悄悄变强,但你不一定能感知到具体是哪天升级的。

  • Isomorphic Labs完成$21亿B轮融资:AI制药从 Nobel 奖走向临床

    Demis Hassabis 2021年从DeepMind分拆出来的Isomorphic Labs,这周宣布完成21亿美元B轮融资,领投方是Thrive Capital。算上这一轮,公司累计融资接近26亿美金,直接把AI制药这个赛道的天花板顶到了一个新高度。

    Isomorphic Labs的核心资产是AlphaFold——那个2024年拿了诺贝尔化学奖的蛋白质结构预测系统。以前科学家要花数年才能解析一个蛋白质的三维结构,AlphaFold能在几分钟内给出高精度的预测结果。Isomorphic要做的事,就是把这个能力商业化,用AI设计新药分子。

    AlphaFold已经预测了超过2亿个蛋白质结构,覆盖几乎所有已知的蛋白质编码基因。这个数据库对全球科研人员免费开放,但Isomorphic Labs的商业模式是在这个基础上做药物设计,而不只是结构预测。

    投资者的阵容很有意思

    这轮除了Thrive Capital领投,Alphabet(谷歌母公司)和GV(谷歌风投)继续跟投,说明谷歌内部对这个函数还是很有信心。新进来的投资者包括MGX(阿联酋主权基金)、Temasek(新加坡淡马锡)、英国主权AI基金。一个AI制药公司,能让多个国家主权基金同时下注,这个信号值得琢磨。

    融资额21亿美元是什么概念?对比一下:Anthropic最新一轮融资30亿美金,估值900亿;Isomorphic这一轮单轮21亿,已经超过了大部分AI公司的累计融资额。投资者现在不是在用”研究项目”的标准来评估AI制药,而是在用”下一个Google DeepMind”的标准在下注。

    AI设计的药物真的要上临床了

    Isomorphic Labs在融资公告中提到,他们第一个AI设计的分子即将进入人体临床试验。这意味着,从AlphaFold获诺贝尔奖到第一款AI设计药物进入临床,只用了不到两年。这个速度在传统制药界是不可想象的——一个新药从发现到临床,通常需要5到10年。

    • 传统制药:5-10年药物发现 + 临床试验,成功率低于10%
    • AI制药(Isomorphic模式):18个月完成药物设计,靶点预测精度大幅提升
    • 第一家AI设计药物进入临床的时间节点:2026年内

    为什么是现在

    AI制药不是一个新概念,但之前一直卡在两个地方:一是蛋白质结构预测不够准,二是AI设计的分子在真实生物系统里不一定work。AlphaFold把第一个问题解决了,第二个问题现在也有了进展——Isomorphic用的是”闭环验证”策略,AI设计分子后会用湿实验(wet lab)验证,再把结果喂回模型。

    这个21亿美元的融资轮,本质上是在赌一件事:AI设计的分子能在人体里安全地起作用。如果Isomorphic的临床实验数据好,整个制药行业的研发范式会被重写。如果失败了,这21亿就是目前为止AI泡沫最大的单笔”学费用”。

  • 微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    📖 项目简介

    这是微软官方推出的AI智能体零基础入门免费课程,包含12+节核心课程,覆盖从基础概念到生产落地的全流程。支持50+种语言本地化,每节课配套文字教程、视频讲解、可运行代码示例和扩展学习资源,是系统学习AI智能体开发的最佳起点。

    63.2k+
    GitHub Stars

    🔧 安装要求和过程

    环境要求

    • Python 3.8+ 环境
    • Azure账户(用于Microsoft Foundry和Azure AI Foundry Agent Service V2)
    • Git(用于克隆仓库)

    快速安装步骤

    # 稀疏克隆(推荐,不包含50+语言翻译文件)
    git clone --filter=blob:none --sparse https://github.com/microsoft/ai-agents-for-beginners.git
    cd ai-agents-for-beginners
    git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
    
    # 安装依赖
    pip install -r requirements.txt
    
    # 配置环境变量(复制示例文件)
    cp .env.example .env
    # 编辑.env文件,填入Azure/OpenAI配置
    ⚠️ 注意:如果是首次接触生成式AI开发,建议先学习微软出品的《Generative AI For Beginners》21节入门课打好基础。

    ✨ 核心功能

    🎓 完整课程体系

    12+节核心课程,从AI智能体介绍、设计模式到生产环境部署,每节课包含文字教程+视频+代码示例。

    🌍 多语言支持

    支持50+种语言本地化,包含中文(简体、繁体)、日语、韩语、法语、德语等主流语言。

    🔌 技术栈兼容

    优先采用微软智能体技术栈,同时支持OpenAI兼容的第三方提供商(如MiniMax,支持204K token上下文)。

    🛡️ 生产级内容

    覆盖可信智能体构建、内存管理、上下文工程、安全防护、部署可扩展智能体等实战内容。

    🎯 典型使用场景

    场景1:零基础系统学习AI智能体开发

    适合没有AI智能体开发经验的开发者,通过12+节课程系统学习概念、框架、设计模式等入门知识,每节课都有可运行的代码示例。

    场景2:学习智能体从开发到生产落地的全流程

    包含可信智能体构建、内存管理、上下文工程、安全防护等实战内容,帮助开发者掌握生产级AI智能体的开发技能。

    场景3:熟悉微软智能体技术栈

    学习Microsoft Agent Framework、Azure AI Foundry等微软官方智能体框架的使用,适合需要在Azure平台部署AI智能体的开发者。

    💡 推荐理由

    说实话,如果你想要系统学习AI智能体开发,这门课程绝对是最佳起点。我特别喜欢它的几个设计:

    • 官方出品,质量有保障:微软官方团队维护,内容紧跟技术前沿,包含最新的MCP、A2A、NLWeb等智能体协议。
    • 理论与实践结合:每节课不仅有文字教程,还有配套视频讲解和可运行的Python代码示例,学完就能动手实践。
    • 多语言支持:支持50+种语言,中文开发者可以直接看中文教程,降低学习门槛。
    • 社区活跃:有官方Discord交流频道和开发者反馈论坛,遇到问题可以快速获得帮助。

    我觉得这门课程最值得称赞的是它的系统性——从基础概念到生产落地,从单智能体到多智能体协作,从设计模式到安全防护,几乎覆盖了AI智能体开发的方方面面。无论你是刚入门的新手,还是有一定经验的开发者,都能从中获得价值。

    📥 下载地址


    📌 数据来源:GitHub + 微软官方文档 | 更新时间:2026-05-18

  • Anthropic接近$900B估值融资关闭:算力军备竞赛进入新量级

    Bloomberg的消息说,Anthropic这笔至少$300亿的新融资、投后估值$900亿以上的轮次,预计5月底就能关闭。截至5月16日,条款清单还没签,但各方已经在按这个时间表推进。

    如果最终落在$900B,Anthropic的估值将首次超过OpenAI——后者今年3月刚拿到$852B的投后估值。而更夸张的是,Anthropic自己今年2月的估值才$380B。三个月涨了2.37倍,这不是普通的增长型融资,这是算力军备竞赛的入场券。

    领投方阵容:硅谷最豪华的算力押注

    这一轮的联合领投方是Sequoia、Dragoneer、Greenoaks和Altimeter。这个组合本身就说明了很多问题——不是早期VC在赌概率,而是成长期的重量级基金在押注”算力即护城河”这个逻辑。

    Anthropic CEO Dario Amodei已经明确说了,这笔钱主要去向是两个:Amazon Web Services和Google Cloud的算力承诺,合同已经签到了2027年。翻译一下就是:我先把未来三年的算力锁死,你们其他家自己去排队吧。


    为什么是现在?Google I/O前的时间窗口

    把时间线摆在一起看就很有意思了。Google I/O是5月19日,Anthropic选在I/O之前把融资消息放出来,战略意图相当明显——在谷歌可能凭借Gemini 4.0夺回叙事主导权之前,先把自己的估值天花板顶上去。

    这也解释了为什么Anthropic愿意以$900B的估值融资。不是因为这个价格”合理”,而是因为他们在跟时间赛跑——在谷歌、Meta、xAI全部加码算力的窗口里,谁先锁定长期算力合同,谁就掌握了下一代模型的上限。


    算力即模型能力:一个被低估的逻辑

    外面很多人还在讨论”哪个模型更聪明”,但Anthropic、OpenAI和谷歌内部的人都知道,2026年的竞争核心不是算法,是算力。你能调度多少H100/B200,决定了你的模型能跑多大、跑多快、跑多稳。

    Anthropic同时还租了SpaceX的Colossus 1超算——22万块以上NVIDIA GPU,300兆瓦的算力规模。这不是临时补救,这是在AWS和Google Cloud的算力完全上线之前(2027年)的一座桥。Dario Amodei的计算是:等竞争对手反应过来,我已经跑了两年了。


    Q1营收80倍增长:融资背后的商业验证

    估值不是凭空来的。Anthropic在5月11日披露,2026年Q1营收同比增长80倍,当前ARR超过$440亿。年消费百万美元以上的客户,两个月内从500家翻倍到1000家以上。

    这些不是试点客户。PwC、Blackstone、Goldman Sachs、Hellman & Friedman、Gates基金会——这些都是生产级部署。Anthropic总裁Daniela Amodei的定位很清晰:Claude不是聊天机器人,是企业的操作系统。80倍的营收增长说明市场正在用真金白银为这个定位投票。


    月底见分晓

    如果这一轮真的在5月底关闭,AI产业格局会在48小时之内被重写。OpenAI盘了三年的”最值钱AI公司”头衔,将被一家成立才五年的公司夺走。

    对开发者来说,这意味着什么?更多的算力意味着Claude的能力上限会持续提升,API的可用性会更高,响应会更快。竞争的受益者永远是用户——这一轮融资的终极输家,可能是那些还在犹豫要不要全面切换到AI工作流的人。

  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜、Aluminium OS,谷歌全产品线押注AI

    明天(5月19日)上午10点PT,Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

    Gemini 4.0:直接对标Claude Mythos

    谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示,这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分,谷歌就能在这一周里重新掌握AI叙事的主导权。

    有意思的是,谷歌在5月12日的Android Show上已经把平台级更新提前发布了,I/O专门留给模型发布和硬件,这个节奏安排相当聪明——避免自家产品抢流量,把最炸的牌留到主会场。


    Android XR眼镜:跟Meta的又一次对决

    硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

    这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是,谷歌的方案更彻底:不靠镜片显示,而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打,I/O上应该会有更详细的交互演示。


    Aluminium OS:ChromeOS的终点,Android桌面的起点

    一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示,这个新系统长得像一个放大版Android:底部Dock、虚拟桌面、完整应用窗口,就是没有传统Linux底层的那种笨重感。

    如果Aluminium OS真的能在2026年完成ChromeOS的替换,谷歌就拥有了一条从手机(Android)到平板(Android XR)到笔记本(Aluminium)到云(Google Cloud Agentic Toolkit)的完整AI设备链路。苹果还没把这个拼图拼完整。


    Google Cloud Agentic Toolkit:企业智能体的定价终于要透明了

    对企业用户来说,这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊,这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

    讲真,企业在选智能体平台的时候,定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里,谷歌如果还在绕圈子,企业客户会用脚投票的。


    战局研判:这一周的胜负手

    把时间线拉远一点看,这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮,谷歌在5月19日放大招,Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

    如果Gemini 4.0的实测表现真的能打,谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平,那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

    明天上午10点PT,答案揭晓。

  • 五大前沿AI实验室被纳入政府监管:模型发布前要先过这一关

    美国商务部下属的AI安全与基础设施局(CAISI)近期悄悄干了一件事——和OpenAI、Anthropic、Google DeepMind、微软、xAI这五家前沿AI实验室全部签署了预部署评估协议。意思是,这些实验室的主流模型在正式发布前,得先过政府这一关。

    不是自愿,是强制

    这份协议已经最终敲定,具有约束力。覆盖范围是五家实验室计划在美国境内发布的所有主流前沿模型。评估由CAISI主导,核心目标是排查模型的安全风险和合规隐患,防止模型发布后引发监管暴露问题。

    具体评估指标和详细内容目前没有公开,但可以参考英国AI安全研究所最新发布的红队测试指南——主要聚焦模型能力边界和潜在滥用风险。这个变化意味着,从模型官宣到API正式对外开放,中间会多一段政府评估的时间窗口。

    这标志着美国AI产业正式从”快速行动、打破常规”的野蛮生长阶段,转向受监管的基础设施类产业的监管逻辑——是行业结构性的监管转向。

    全球监管协同正在形成

    欧盟方面也在跟进。目前欧盟正与Anthropic洽谈Mythos模型的政府访问权限,但尚未达成与美国同等层级的协议。英国AI安全研究所则在Google I/O大会开幕前更新了红队测试指南,表明国际层面在协同关注前沿模型能力监管。

    对企业用户来说,这套新流程相当于给前沿模型加了一层官方信任背书——所有模型在发布前都经过政府评估,理论上能降低企业部署后遭遇监管处罚或合规风险的可能性。

    对行业意味着什么

    短期来看,模型发布节奏会受影响。实验室需要预留政府评估的时间,从完成训练到正式上线的时间窗口会被拉长。对于那些靠”抢先发布”来占据市场注意力的实验室来说,这不是一个好消息。

    但换个角度看,政府背书也能成为竞争优势。Anthropic在企业市场的迅猛增长,部分原因就是它的模型被认为”更安全、更合规”。当监管成为行业标准的一部分,跑赢合规反而可能是最好的市场策略。

    xAI作为名单里最新的成员,它的加入说明监管网已经覆盖了所有主流玩家,不管创始人埃隆·马斯克和华盛顿的关系如何,规则面前暂时人人平等。


  • 欧盟AI法案松口了:合规截止日期推迟,中型企业也能喘口气

    5月7日,欧盟理事会和欧洲议会谈判代表就AI法案简化方案达成临时协议,这是继2024年AI法案正式生效后,欧盟首次对规则进行大规模”松绑”。距离原定8月2日的高风险AI系统合规截止日只剩三个月,很多企业还没摸清门道,欧盟干脆把期限往后推了。

    宽松在哪里

    最直观的变化是截止日期——独立类高风险AI系统的合规期限从今年8月推到了2027年12月2日,嵌入医疗设备等受监管产品的高风险AI更是延至2028年8月2日。中间还有4个月的”水印义务宽限期”,今年8月2日前投放市场的生成式AI,可以等到12月2日再完成水印标注合规。

    受监管范围也在收窄。工业机械内置的AI系统,如果已经受欧盟《机械法规》覆盖,直接被剔除出AI法案监管范围。医疗设备、玩具、电梯等产品中内置的AI”安全组件”,只需要遵守对应行业的安全法规,不用再重复履行AI法案的义务。

    “安全组件”的定义被收窄了——只有当AI功能失效会直接造成健康或安全风险时,才会被认定为高风险AI的”安全组件”。那些只是用来辅助用户、优化性能的AI功能,不会再被自动划为高风险范畴。

    中小企业也受惠

    原来只有小微企业(SME)才能享受的简化合规政策,现在扩展到了员工不超过750人、年营收不超过1.5亿欧元的中型企业。这意味着一大批成长型AI公司可以享用简化合规指南、更低的罚款标准,以及监管沙盒的准入资格。

    还有一个挺有意思的放宽:企业现在可以使用GDPR定义下的特殊类别个人数据(健康信息、生物特征数据、种族、性取向等)来检测和缓解AI模型的偏见,不需要再走此前那套严苛的特殊数据审批流程。

    红线还在

    放宽不等于放任。”nudifier”类AI应用——也就是用来生成未经同意的亲密内容、儿童性虐待材料的系统——被新增为禁止项,今年12月2日起生效,违反禁止性规定的最高罚款是3500万欧元,或全球年营业额的7%,取高者。

    透明度义务(聊天机器人披露、深伪内容水印等)依然在8月2日生效,只是水印部分给了4个月宽限。罚款标准是不超过1500万欧元或全球年营业额的3%。


    企业该怎么应对

    宽限期多出来的这几个月的用处,是让企业把合规框架搭好,而不是继续拖。欧盟委员会到现在还没发布高风险AI系统的协调标准,等标准出来的时候,留给企业调整的时间可能还是不够。提前把风险分类、数据治理、技术文档这些基础工作做扎实,比临时抱佛脚要靠谱得多。

    还有一个现实问题:欧盟数据保护机构已经在AI领域开展GDPR执法了,已经有企业因为违规被罚款、相关AI应用被禁用。AI法案和GDPR是两套并行规则,合规的时候不能只盯着一个看。

  • Google DeepMind启动亚太加速器,用AI守护地球

    谷歌DeepMind最近宣布启动亚太区”AI for the Planet”加速器计划,要把AI用到气候变化这类棘手的环境问题上。亚太地区既是全球经济增长引擎,又是气候变化的高脆弱区,这个选择其实很有战略眼光。

    从生产力工具到行星级解决方案

    DeepMind这个动作,标志着它的定位正在发生根本性转变——不再只是做AlphaFold、大语言模型这类”生产力工具”,而是要把AI变成解决全球性问题的”行星级解决方案”。

    加速器计划为期三个月,入选团队会拿到DeepMind的技术资源、导师指导,还有机会跟DeepMind的研究员直接合作。重点是”AI智能体网络”——不是单个模型,而是多个AI协作去处理复杂的环境治理问题。

    亚太地区既贡献了全球三分之二的经济增长,也承载了最高的气候脆弱性。绿色技术虽然在兴起,但要把AI真正用到环境治理里,还需要更多的创新和实践。

    智能体网络是怎么解决环境问题的

    传统AI应用大多是”一个问题、一个模型”,但环境问题不是这样。气候变化、生物多样性丧失、海洋污染——这些都是系统性的问题,需要多个AI智能体协作,分别处理不同的子任务,然后整合出解决方案。

    举个例子:预测某个地区的洪灾风险,需要同时分析气象数据、地形数据、土地利用数据、人口密度数据……单个模型很难搞定这么复杂的输入。但如果是多个智能体分工——一个专门处理气象、一个专门分析地形、一个负责人口建模——最后把结果整合起来,准确性会高很多。

    亚太地区为什么是首选

    选亚太地区作为首个加速器落地点,背后有几层考虑。一是亚太国家的环境问题迫在眉睫——从东南亚的海平面上升,到印度的极端高温,再到中国的空气污染,都是需要紧急应对的现实挑战。二是亚太地区的科技创新生态正在快速成熟,有大量有潜力的初创团队和研究者。

    三是数据资源。亚太地区有全球最丰富的人口数据和环境监测数据,这对训练AI模型来说是金矿。DeepMind显然想通过这次加速器,跟亚太的研究团队建立深度合作,拿到这些数据资源。


    AI环境治理的想象空间

    这次加速器计划触及的,其实是一个被严重低估的方向:AI在环境科学和气候治理中的应用。过去几年,大家都在关注AI怎么改变办公、怎么颠覆搜索、怎么影响内容创作……但AI在科研、在环境治理、在应对气候变化方面的潜力,其实一点都不比那些”网红应用”小。

    如果这次加速器能跑出几个成功的案例,说不定会带起一波新的AI创业方向——不再是卷聊天机器人、卷内容生成,而是去做真正有社会价值的事情。