标签: Google

  • Google推出Pics应用:AI设计工具赛道又多了一个重量级玩家

    Google在今年的I/O大会上扔出了一个不太起眼、但挺有意思的新产品——Pics。这是一个跑在Google Workspace里的AI设计和图像生成应用,你可以直接把它理解成”Google版的Canva”,或者”AI版的Photoshop入门工具”。

    这个说法可能有点过于简化了。Pics真正想做的,是让完全不懂设计的人也能用AI生成像样的视觉内容——社交媒体配图、活动邀请函、营销物料、产品原型图,这些都能通过简单的文字描述搞定。

    为啥要做这个?因为改图太麻烦了

    Google在发布Pics的时候说了一个很接地气的痛点:现在的AI图像生成工具,生成质量已经不错了,但如果你想改图中某一个细节,基本没戏——你得重新写一个提示词,然后祈祷这次AI别把其他部分也改掉。

    Pics的思路是:生成图像只是第一步,关键是让图像里的每个元素都可以单独编辑。你可以用新的提示词改局部,也可以直接点击想改的地方写评论——就像在Google Docs里给同事提修改意见一样。

    这个设计逻辑其实挺聪明的。它把AI图像生成从”抽奖式创作”变成了”可迭代设计”,降低了试错成本。底层驱动编辑功能的是Gemini,而图像生成本身则由Nano Banana 2支持——Google说这个模型在精确文本渲染、现实世界知识和细节输出上表现不错。

    Google Pics AI设计应用界面展示
    Google Pics应用界面,用户可通过文字提示生成并编辑设计

    对手不只是Canva

    Google做这个产品,明面上是冲着Canva去的,毕竟Canva这几年在AI设计赛道跑得挺快。但暗地里,Google可能更在意的是Anthropic最近推出的Claude Design——用Claude直接生成可编辑的设计稿,这个思路跟Pics有点像。

    Google的优势在于生态整合。Pics原生嵌入Google Workspace,你可以在Docs、Slides、Sheets之间无缝协作,设计稿可以直接丢进幻灯片里用。对于已经离不开Google办公套件的企业和学校来说,这个整合黏性挺强的。


    谁能用?什么时候能用?

    目前Pics还在测试阶段,I/O期间有一小批测试者拿到了内测资格。Google说今年夏天会先向AI Ultra订阅用户开放,后续再逐步推给更广泛的用户。

    这个节奏其实透露了Google的心思:AI设计工具不只是”做个好用的产品”那么简单,它是拉动高价AI订阅的重要手段。如果你能让用户觉得”每个月花100美元买Ultra,就为了用Pics做图”,那这个订阅就值了。

    当然,最终Pics能不能打,还得看实际体验。AI生成设计这个赛道,嘴上说说都挺厉害,真要做到”生成即可用”的程度,还有不少坑要填。

  • Google I/O 2026全记录:Gemini 3.5、AI搜索和智能眼镜全部到位

    Google I/O 2026的主题只有一个:把Gemini塞进你数字生活的每一个角落。这场发布会5月19日开幕,整整两天的议程里,几乎没有哪个产品没被AI重新做一遍。

    搜索的”十个蓝色链接”时代正式结束

    搜索率先被改造。新搜索框支持长对话式查询,还能给出AI驱动的查询建议,你甚至可以往搜索框里直接拖文档、图片、视频和Chrome标签页。AI Overviews(AI概览)的月活已经摸到25亿,对话式搜索模式的月活也有10亿。

    信息代理(information agents)会在后台7×24小时帮你跑任务,生成式UI即时生成交互式视觉内容,背后由Gemini Flash 3.5驱动。出版商的日子估计不太好过了——referral流量还会继续掉。

    Gemini Flash 3.5驱动的搜索,已经不再是”搜完给你十个链接”的逻辑,而是直接帮你把事情做完。

    Gmail现在能跟你对话了

    Gmail Live语音交互模式在I/O上亮相,直接说话就能查邮件、提取行程、找学校通知。不用再盯着列表一页页翻。Workspace这边还有个AI图像生成应用叫Google Pics,支持点击图片局部标注修改需求,不用把提示词全部重写一遍,背后跑的是Gemini和Nano Banana 2模型。

    Gemini Spark:常驻后台的AI代理

    最值得一提的是Gemini Spark。这不是你叫它才动一下的聊天机器人,而是一个常驻后台的AI代理,能自动写完邮件、生成学习指南、监控订阅费用,还能对接Workspace、Canva、OpenTable这些第三方应用。

    硬件:XR眼镜合作款全部亮相

    Android XR眼镜的合作款全部亮相——三星、Gentle Monster、Warby Parker的版本都出来了,计划2026年年内发布。谷歌自研的Project Aura眼镜也更新了,计算单元更强,加了指纹解锁,还有新的充电盒设计。

    Wear OS 7也有更新,加入了类似iPhone的”实时更新”功能,手表上能同步快递、赛事比分等动态信息,还能查看AI代理的自动化任务进度。

    定价:Ultra订阅拆分两档

    谷歌把AI订阅Ultra拆成了100美元/月和200美元/月两档,200美元那档包含Project Genie世界模型的访问权限。这个定价明显在对标OpenAI Pro,谷歌这次是真的在全栈铺开,而不只是做个 benchmark 冠军。


  • 谷歌搜索亲手埋掉了十个蓝色链接,25年的老界面彻底变了

    “十个蓝色链接”——这个词在互联网上活了25年,从谷歌1990年代把搜索框推向大众开始,就是这个样子。输入关键词,吐出来一排蓝色超链接,点进去自己找答案。这套逻辑所有人习以为常,直到2026年5月19日谷歌I/O大会,它宣布:这个时代结束了。

    新搜索框是这次改造的核心。谷歌说这是搜索框自诞生以来最大的一次改动。它不再只是一个输入框了——能自动扩展长度来容纳长对话式查询,内置AI驱动的查询建议(不是简单的自动补全,而是理解你的意图来帮你构建更复杂的问题),而且你不需要在搜索前选择”要用AI模式还是普通模式”,系统自己判断。

    Google慕尼黑总部外墙
    谷歌慕尼黑总部(图片来源:TechCrunch)

    信息代理:谷歌提醒的进化版

    2003年谷歌推出过”谷歌提醒”(Google Alerts),关键词有新结果就发邮件通知你。那个服务现在还在,但早就不是人们获取信息的主要方式了。

    这次的新东西叫”信息代理”(information agents),背后的逻辑是一样的——追踪变化、推送通知——但能力强了太多。你可以让一个代理7×24小时在后台跑,用你自定义的参数监控某个行业的股市动向,它不只是发现变化,还能理解变化的意义,汇总之后通知你,附带来源链接和进一步查看的信息。

    谷歌搜索负责人Liz Reid在发布会上举了个例子:你可以设置提醒,用非常具体的参数追踪某个特定行业的股票市场动向,代理会为你制定监控计划,包括它需要访问的工具和数据——比如我们的实时金融数据。然后它会持续追踪这些变化,在条件满足时通知你。

    生成式UI:搜索结果变成交互式网页

    另一个有意思的更新是”生成式UI”——根据用户的问题,即时生成动态布局的交互式视觉内容。比如你问关于黑洞的问题,搜索结果不是一段文字,而是一个可以把概念具象化的交互式可视化组件,你接着问,它实时生成全新的视觉内容。

    这套系统由谷歌DeepMind团队用Gemini Flash 3.5模型开发,今年夏天会免费向所有谷歌用户推出。除此之外,用户还能用自然语言指令在搜索里直接搭建自己的小应用(比如根据日历信息做膳食规划、健身追踪等),这背后是谷歌的Antigravity代理开发平台在支撑。


    出版商要紧张了

    这套改动有一个绕不开的副作用:出版商从谷歌搜索拿到的引流会继续大幅下降。AI概览(AI Overviews)已经让很多媒体网站的referral流量掉了不少,现在搜索结果里直接出交互式内容,用户更没有理由点链接出去了。对一些依赖广告的媒体来说,这可能会是最后一根稻草。

    谷歌这边倒是不担心,AI概览的月活已经突破25亿,去年推出的对话式搜索模式月活也过了10亿。用户用脚投票,答案直接在搜索页上给到,何必再跳一次。

    搜索这件事的本质正在发生变化——从”帮你找信息”变成”帮你把信息消化好直接给你”。这个过程里,用户省了事,但整个内容生态的流量分配逻辑也被重新洗牌了。出版商适应得过来吗?今年夏天见分晓。

  • Google把20年街景数据喂给了Genie,AI现在能模拟你家门口的街道了

    你有没有在Google Maps的街景里「逛」过别人的 neighborhood?把那个小黄人往巴黎某条街上一扔,看看酒店是不是在安全的地段。Google现在想把这件事变得不止是「看看」,而是让你真正走进去、改天气、看暴风雪里的同一条街是什么样子。

    5月19日的Google I/O大会上,DeepMind宣布把Street View的数据接入Project Genie——Google的通用世界模型。简单来说,Genie可以根据文字或图片提示,生成可交互的游戏式三维环境。现在加上街景,它生成的就是真实世界的地方。

    Google Genie Street View 模拟展示
    Genie接入街景数据后,可生成纽约街景的交互式模拟(图源:TechCrunch)

    为什么这件事有意思

    DeepMind研究员Jack Parker-Holder举了一个很具体的例子:一个即将部署到伦敦的机器人,那边常年见不到什么太阳。用Genie,他们可以模拟阳光从维多利亚式房屋上反射下来的罕见场景,这样机器人真的遇到时就不会「懵掉」。

    「你可以说,我要去纽约,但不是这个季节,是下雪的时候。我想看看那条街在下雪时是什么样子。」

    街景数据积累,Google干了20年。背着摄像头的小车和塞了相机的背包,在全球110个国家和七大洲拍了超过2800亿张图片。这些数据的价值,过去主要体现在地图产品和广告上,现在DeepMind找到了新用法。


    不只是玩游戏

    Genie 3去年8月开放了研究预览,今年1月向美国的Google AI Ultra订阅用户开放。它的目标应用场景有三个:教育、游戏、机器人训练。接上街景之后,机器人训练这个场景立刻变得很实。

    Waymo已经在用Genie的模拟器来训练无人驾驶汽车应对「极罕见事件」——比如龙卷风,或者一头大象突然出现在路上。以前这种场景只能靠人工合成,现在有了街景作为基底,模拟出来的环境至少地理位置是真实的。

    和Waymo自己的模拟器相比,Genie的优势在于视角。Waymo的模拟都是从车载摄像头角度看的,而街景数据可以切换到任意视角——机器人视角、行人视角、甚至无人机视角。

    • 2800亿张街景图片覆盖全球110个国家
    • Waymo已用Genie模拟龙卷风、大象等极端场景
    • 支持任意视角切换(车载/行人/机器人/无人机)
    • 教育、游戏、机器人训练三大目标场景

    还差在哪里

    坦率说,现在的效果还没到「以假乱真」的程度。Google团队给我看的样片,包括我以前住过的一个街区的海底版本,识别度很高,但画质还是电子游戏水准,不是照片级真实。

    更大的问题是物理规律。现在的Genie模型还没有真正理解因果关系——比如在一个约书亚树国家公园的雪地场景模拟里,跑过去的人直接穿过了仙人掌和灌木丛。物理规则不是硬编码进去的,模型是通过被动观察自己「悟」出来的,这个过程还需要时间。

    「这类模型在准确度和质量上,可能比视频生成落后6到12个月。但我认为这是可以解决的。」——Jack Parker-Holder

    对比一下,Google自己的图像生成器Nano Banana已经能在信息图里生成完美的文字,视频生成器Veo也理解了纸船会跟着水流漂、烟会在空气中散开这些物理常识。Genie要追上这个水平,还得再跑一阵。

    目前,Street View in Genie已经向部分美国Ultra用户开放,接下来几周会逐步扩展到全球Ultra用户。DeepMind的产品经理Diego Rivas提醒说,这还是一个实验性的东西,准确度方面还有很多要改进的地方。

    但方向是清晰的。Google Maps的前总监Jonathan Herbert说,他们很早就在想怎么把地图数据用在新形式的AI研究上。Genie接入街景,是这个世界模型第一次真正摸到「真实世界的地基」。接下来会发生什么,值得盯着看。

  • Google I/O 2026 Day 1直击:Gemini 4.0、Omni多模态、XR眼镜齐亮相

    今天Google I/O 2026正式开幕,谷歌一口气发布了多个重磅产品。看完整个发布会,感觉谷歌这次是认真了,不再是以前那种”我们有个很酷的研究项目”的画饼风格,而是实打实地把AI塞进了每一个产品线里。

    Gemini 4.0:不止是基准测试

    Gemini 4.0这次是真的来了。谷歌没有只拿基准测试分数说事,而是把重点放在了实际应用场景上——Workspace集成、多模态推理、智能体可靠性,这些都是企业用户真正关心的东西。

    外界预期Gemini 4.0在多模态推理上会有显著提升,如果它能接近Claude Mythos Preview的94.6% GPQA成绩,那谷歌就真的把今年早些时候丢掉的话语权给抢回来了。

    谷歌的优势在于生态。安卓30亿+设备、搜索数据、Workspace 2亿+用户,这不是OpenAI或者Anthropic短时间内能追上的。

    Gemini Omni:文本+图像+视频统一管线

    这次最让我意外的是Gemini Omni。它不是Veo的升级版,而是一个统一的文本/图像/视频生成管线,可以在对话窗口里直接生成和编辑视频,还会自动配背景音乐。

    早期泄露的测试报告显示,Omni在提示词保真度和音频质量上都比Veo 3.1强。如果这套系统正式上线,谷歌就是第一个在消费级场景里提供全模态统一生成能力的厂商。叠加安卓生态的分发优势,这个组合拳确实不好接。

    Google I/O 2026
    Google I/O 2026 Day 1 发布会现场

    Android XR眼镜与Aluminium OS

    硬件方面,谷歌和三星、Warby Parker、Gentle Monster、XREAL合作的Android XR眼镜正式亮相。无屏版本重80克以内,售价379-499美元,搭载骁龙AR Gen 3,延迟200ms。这个规格如果能兑现,Meta的Ray-Ban系列可能要感受到压力了。

    更值得关注的是Aluminium OS,这个基于安卓开发的系统将替代ChromeOS,首批笔记本由宏碁、华硕、戴尔、惠普、联想生产,2026年秋季上市。谷歌这是在把安卓的势力范围从手机扩展到PC。


    Gemini Spark:谷歌版的AI智能体

    Gemini Spark是这次发布的一个容易被忽略但很重要的产品。它能自动化跨应用任务——整理收件箱、生成会议简报、追踪新闻事件进展。这和微软的Copilot、Anthropic的Claude Cowork是一个赛道的产品,但谷歌的优势在于它自己的应用生态(Gmail、Calendar、Drive、Docs)。

    总体来看,谷歌这次的策略很清晰:不追求单一的基准测试冠军,而是把Gemini铺到所有能铺的地方——手机、眼镜、笔记本、云端、企业应用。这种打法短期内在基准测试上可能不够性感,但长期来看,生态黏性才是最难被颠覆的壁垒。

  • Google I/O 2026今天开幕:Gemini 4.0、XR眼镜、新系统齐亮相

    Google I/O 2026今天开幕,大家期待的Gemini 4.0终于要亮相了。这次谷歌不只是更新模型,而是打算把AI能力直接塞进操作系统、塞进眼镜里,完成从”AI功能叠加”到”AI原生重构”的战略跨越。

    Gemini 4.0:上下文窗口拉到1000万tokens

    参数规模据说到3-5万亿,上下文窗口突破1000万tokens,是GPT-5.5的25倍,可以一次性加载完整代码库或者整本书籍做深度分析。更重要的是原生多模态,文本、图像、音频、视频统一处理,不用在不同模型之间来回切换。

    深度整合谷歌搜索之后,Gemini 4.0的知识可以实时更新、事实实时核查,幻觉率压到3%以内。定价预计每百万输入2.5美元,性价比相当能打。


    Android XR眼镜:80克、499美元起

    谷歌将推出首款自研Android XR智能眼镜,重量不到80克,售价499美元起,比同类竞品便宜不少。搭载高通骁龙AR Gen 3处理器,内置本地Gemini Nano轻量模型,200毫秒内响应,支持离线导航和实时翻译。

    深度适配Gemini 4.0之后,这副眼镜具备实时视觉理解、主动智能推送、多模态交互能力。谷歌还开放了Android XR SDK,现有安卓应用可以快速迁移到XR场景。


    Aluminum OS:8年磨一剑,三系统合一

    历时8年研发的Aluminum OS将正式落地,把Android、Chrome OS、Fuchsia三个系统揉在一起,手机、电脑、XR设备、智能家居全终端统一适配。

    Gemini 4.0拿到系统级接口,可以打通跨应用数据壁垒,实现实时上下文感知与主动智能执行。该系统将首发搭载于10月发布的Pixel 10系列手机,谷歌的AI硬件闭环生态算是真正立起来了。

    谷歌这次形成”大模型+硬件+操作系统+开发者生态”的全栈布局,直接对标OpenAI和Anthropic,全球AI竞争进入最激烈阶段。

  • Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude






    Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude

    美西时间5月19日10点(北京时间明天凌晨2点),Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数,可能会错过真正值得看的东西。

    Gemini 4.0:谷歌的”必须赢”时刻

    从上次Google I/O到现在,AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场,GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩(GPQA 94.6%),谷歌今年在AI叙事上就又要当配角。

    外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键,也是谷歌云如果能把Gemini嵌进企业工作流的机会。

    外界预测Gemini 4.0的参数规模可能达到3万亿级别,但参数规模已经不是重点。重点是:它能不能在企业生产环境里稳定运行,而不是在 benchmark 上刷分。

    Android XR眼镜:谷歌的硬件”第三次尝试”

    谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook,每一个都曾是”下一代计算平台”。这次的Android XR眼镜,谷歌学聪明了:不搞封闭生态,拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

    无屏版2026年就能买到,价格区间会很宽——从入门级到高端产品都会有。关键是交互:免提召唤Gemini,用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”,这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

    Aluminium OS:ChromeOS的”Android化”

    这个泄露了好几个月的”ChromeOS替代系统”,本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示:底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

    为什么要做这个?因为Chromebook在教育市场站稳了,但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行,对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。


    Google Cloud Agentic Toolkit:企业AI的”最后一公里”

    这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺,很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

    PwC前几天刚宣布把Claude部署到全球几十万员工,用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”,光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”,不是”分数更高的模型”。

    该怎么看这场发布会?

    如果你期待谷歌在I/O上”一统AI江湖”,可能会失望。但如果你关心的是:Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案,会在接下来48小时内慢慢浮现。

    谷歌有什么?Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局,谷歌手里的牌其实比大多数人想的好。

    📎 原文来源:综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道


  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜、Aluminium OS,谷歌全产品线押注AI

    明天(5月19日)上午10点PT,Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

    Gemini 4.0:直接对标Claude Mythos

    谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示,这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分,谷歌就能在这一周里重新掌握AI叙事的主导权。

    有意思的是,谷歌在5月12日的Android Show上已经把平台级更新提前发布了,I/O专门留给模型发布和硬件,这个节奏安排相当聪明——避免自家产品抢流量,把最炸的牌留到主会场。


    Android XR眼镜:跟Meta的又一次对决

    硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

    这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是,谷歌的方案更彻底:不靠镜片显示,而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打,I/O上应该会有更详细的交互演示。


    Aluminium OS:ChromeOS的终点,Android桌面的起点

    一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示,这个新系统长得像一个放大版Android:底部Dock、虚拟桌面、完整应用窗口,就是没有传统Linux底层的那种笨重感。

    如果Aluminium OS真的能在2026年完成ChromeOS的替换,谷歌就拥有了一条从手机(Android)到平板(Android XR)到笔记本(Aluminium)到云(Google Cloud Agentic Toolkit)的完整AI设备链路。苹果还没把这个拼图拼完整。


    Google Cloud Agentic Toolkit:企业智能体的定价终于要透明了

    对企业用户来说,这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊,这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

    讲真,企业在选智能体平台的时候,定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里,谷歌如果还在绕圈子,企业客户会用脚投票的。


    战局研判:这一周的胜负手

    把时间线拉远一点看,这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮,谷歌在5月19日放大招,Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

    如果Gemini 4.0的实测表现真的能打,谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平,那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

    明天上午10点PT,答案揭晓。

  • 五大前沿AI实验室被纳入政府监管:模型发布前要先过这一关

    美国商务部下属的AI安全与基础设施局(CAISI)近期悄悄干了一件事——和OpenAI、Anthropic、Google DeepMind、微软、xAI这五家前沿AI实验室全部签署了预部署评估协议。意思是,这些实验室的主流模型在正式发布前,得先过政府这一关。

    不是自愿,是强制

    这份协议已经最终敲定,具有约束力。覆盖范围是五家实验室计划在美国境内发布的所有主流前沿模型。评估由CAISI主导,核心目标是排查模型的安全风险和合规隐患,防止模型发布后引发监管暴露问题。

    具体评估指标和详细内容目前没有公开,但可以参考英国AI安全研究所最新发布的红队测试指南——主要聚焦模型能力边界和潜在滥用风险。这个变化意味着,从模型官宣到API正式对外开放,中间会多一段政府评估的时间窗口。

    这标志着美国AI产业正式从”快速行动、打破常规”的野蛮生长阶段,转向受监管的基础设施类产业的监管逻辑——是行业结构性的监管转向。

    全球监管协同正在形成

    欧盟方面也在跟进。目前欧盟正与Anthropic洽谈Mythos模型的政府访问权限,但尚未达成与美国同等层级的协议。英国AI安全研究所则在Google I/O大会开幕前更新了红队测试指南,表明国际层面在协同关注前沿模型能力监管。

    对企业用户来说,这套新流程相当于给前沿模型加了一层官方信任背书——所有模型在发布前都经过政府评估,理论上能降低企业部署后遭遇监管处罚或合规风险的可能性。

    对行业意味着什么

    短期来看,模型发布节奏会受影响。实验室需要预留政府评估的时间,从完成训练到正式上线的时间窗口会被拉长。对于那些靠”抢先发布”来占据市场注意力的实验室来说,这不是一个好消息。

    但换个角度看,政府背书也能成为竞争优势。Anthropic在企业市场的迅猛增长,部分原因就是它的模型被认为”更安全、更合规”。当监管成为行业标准的一部分,跑赢合规反而可能是最好的市场策略。

    xAI作为名单里最新的成员,它的加入说明监管网已经覆盖了所有主流玩家,不管创始人埃隆·马斯克和华盛顿的关系如何,规则面前暂时人人平等。


  • Google DeepMind启动亚太加速器,用AI守护地球

    谷歌DeepMind最近宣布启动亚太区”AI for the Planet”加速器计划,要把AI用到气候变化这类棘手的环境问题上。亚太地区既是全球经济增长引擎,又是气候变化的高脆弱区,这个选择其实很有战略眼光。

    从生产力工具到行星级解决方案

    DeepMind这个动作,标志着它的定位正在发生根本性转变——不再只是做AlphaFold、大语言模型这类”生产力工具”,而是要把AI变成解决全球性问题的”行星级解决方案”。

    加速器计划为期三个月,入选团队会拿到DeepMind的技术资源、导师指导,还有机会跟DeepMind的研究员直接合作。重点是”AI智能体网络”——不是单个模型,而是多个AI协作去处理复杂的环境治理问题。

    亚太地区既贡献了全球三分之二的经济增长,也承载了最高的气候脆弱性。绿色技术虽然在兴起,但要把AI真正用到环境治理里,还需要更多的创新和实践。

    智能体网络是怎么解决环境问题的

    传统AI应用大多是”一个问题、一个模型”,但环境问题不是这样。气候变化、生物多样性丧失、海洋污染——这些都是系统性的问题,需要多个AI智能体协作,分别处理不同的子任务,然后整合出解决方案。

    举个例子:预测某个地区的洪灾风险,需要同时分析气象数据、地形数据、土地利用数据、人口密度数据……单个模型很难搞定这么复杂的输入。但如果是多个智能体分工——一个专门处理气象、一个专门分析地形、一个负责人口建模——最后把结果整合起来,准确性会高很多。

    亚太地区为什么是首选

    选亚太地区作为首个加速器落地点,背后有几层考虑。一是亚太国家的环境问题迫在眉睫——从东南亚的海平面上升,到印度的极端高温,再到中国的空气污染,都是需要紧急应对的现实挑战。二是亚太地区的科技创新生态正在快速成熟,有大量有潜力的初创团队和研究者。

    三是数据资源。亚太地区有全球最丰富的人口数据和环境监测数据,这对训练AI模型来说是金矿。DeepMind显然想通过这次加速器,跟亚太的研究团队建立深度合作,拿到这些数据资源。


    AI环境治理的想象空间

    这次加速器计划触及的,其实是一个被严重低估的方向:AI在环境科学和气候治理中的应用。过去几年,大家都在关注AI怎么改变办公、怎么颠覆搜索、怎么影响内容创作……但AI在科研、在环境治理、在应对气候变化方面的潜力,其实一点都不比那些”网红应用”小。

    如果这次加速器能跑出几个成功的案例,说不定会带起一波新的AI创业方向——不再是卷聊天机器人、卷内容生成,而是去做真正有社会价值的事情。