标签： Google

Google推出Pics应用：AI设计工具赛道又多了一个重量级玩家

Google在今年的I/O大会上扔出了一个不太起眼、但挺有意思的新产品——Pics。这是一个跑在Google Workspace里的AI设计和图像生成应用，你可以直接把它理解成”Google版的Canva”，或者”AI版的Photoshop入门工具”。

这个说法可能有点过于简化了。Pics真正想做的，是让完全不懂设计的人也能用AI生成像样的视觉内容——社交媒体配图、活动邀请函、营销物料、产品原型图，这些都能通过简单的文字描述搞定。

为啥要做这个？因为改图太麻烦了

Google在发布Pics的时候说了一个很接地气的痛点：现在的AI图像生成工具，生成质量已经不错了，但如果你想改图中某一个细节，基本没戏——你得重新写一个提示词，然后祈祷这次AI别把其他部分也改掉。

Pics的思路是：生成图像只是第一步，关键是让图像里的每个元素都可以单独编辑。你可以用新的提示词改局部，也可以直接点击想改的地方写评论——就像在Google Docs里给同事提修改意见一样。

这个设计逻辑其实挺聪明的。它把AI图像生成从”抽奖式创作”变成了”可迭代设计”，降低了试错成本。底层驱动编辑功能的是Gemini，而图像生成本身则由Nano Banana 2支持——Google说这个模型在精确文本渲染、现实世界知识和细节输出上表现不错。

Google Pics应用界面，用户可通过文字提示生成并编辑设计

对手不只是Canva

Google做这个产品，明面上是冲着Canva去的，毕竟Canva这几年在AI设计赛道跑得挺快。但暗地里，Google可能更在意的是Anthropic最近推出的Claude Design——用Claude直接生成可编辑的设计稿，这个思路跟Pics有点像。

Google的优势在于生态整合。Pics原生嵌入Google Workspace，你可以在Docs、Slides、Sheets之间无缝协作，设计稿可以直接丢进幻灯片里用。对于已经离不开Google办公套件的企业和学校来说，这个整合黏性挺强的。

谁能用？什么时候能用？

目前Pics还在测试阶段，I/O期间有一小批测试者拿到了内测资格。Google说今年夏天会先向AI Ultra订阅用户开放，后续再逐步推给更广泛的用户。

这个节奏其实透露了Google的心思：AI设计工具不只是”做个好用的产品”那么简单，它是拉动高价AI订阅的重要手段。如果你能让用户觉得”每个月花100美元买Ultra，就为了用Pics做图”，那这个订阅就值了。

当然，最终Pics能不能打，还得看实际体验。AI生成设计这个赛道，嘴上说说都挺厉害，真要做到”生成即可用”的程度，还有不少坑要填。

📎 原文来源：Google just declared itself a contender in AI design at IO 2026 – TechCrunch

2026年5月20日
Google I/O 2026全记录：Gemini 3.5、AI搜索和智能眼镜全部到位

Google I/O 2026的主题只有一个：把Gemini塞进你数字生活的每一个角落。这场发布会5月19日开幕，整整两天的议程里，几乎没有哪个产品没被AI重新做一遍。

搜索的”十个蓝色链接”时代正式结束

搜索率先被改造。新搜索框支持长对话式查询，还能给出AI驱动的查询建议，你甚至可以往搜索框里直接拖文档、图片、视频和Chrome标签页。AI Overviews（AI概览）的月活已经摸到25亿，对话式搜索模式的月活也有10亿。

信息代理（information agents）会在后台7×24小时帮你跑任务，生成式UI即时生成交互式视觉内容，背后由Gemini Flash 3.5驱动。出版商的日子估计不太好过了——referral流量还会继续掉。

Gemini Flash 3.5驱动的搜索，已经不再是”搜完给你十个链接”的逻辑，而是直接帮你把事情做完。

Gmail现在能跟你对话了

Gmail Live语音交互模式在I/O上亮相，直接说话就能查邮件、提取行程、找学校通知。不用再盯着列表一页页翻。Workspace这边还有个AI图像生成应用叫Google Pics，支持点击图片局部标注修改需求，不用把提示词全部重写一遍，背后跑的是Gemini和Nano Banana 2模型。

Gemini Spark：常驻后台的AI代理

最值得一提的是Gemini Spark。这不是你叫它才动一下的聊天机器人，而是一个常驻后台的AI代理，能自动写完邮件、生成学习指南、监控订阅费用，还能对接Workspace、Canva、OpenTable这些第三方应用。

硬件：XR眼镜合作款全部亮相

Android XR眼镜的合作款全部亮相——三星、Gentle Monster、Warby Parker的版本都出来了，计划2026年年内发布。谷歌自研的Project Aura眼镜也更新了，计算单元更强，加了指纹解锁，还有新的充电盒设计。

Wear OS 7也有更新，加入了类似iPhone的”实时更新”功能，手表上能同步快递、赛事比分等动态信息，还能查看AI代理的自动化任务进度。

定价：Ultra订阅拆分两档

谷歌把AI订阅Ultra拆成了100美元/月和200美元/月两档，200美元那档包含Project Genie世界模型的访问权限。这个定价明显在对标OpenAI Pro，谷歌这次是真的在全栈铺开，而不只是做个 benchmark 冠军。

📎 原文来源：Google I/O 2026: All the news and announcements – The Verge

2026年5月20日
谷歌搜索亲手埋掉了十个蓝色链接，25年的老界面彻底变了

“十个蓝色链接”——这个词在互联网上活了25年，从谷歌1990年代把搜索框推向大众开始，就是这个样子。输入关键词，吐出来一排蓝色超链接，点进去自己找答案。这套逻辑所有人习以为常，直到2026年5月19日谷歌I/O大会，它宣布：这个时代结束了。

新搜索框是这次改造的核心。谷歌说这是搜索框自诞生以来最大的一次改动。它不再只是一个输入框了——能自动扩展长度来容纳长对话式查询，内置AI驱动的查询建议（不是简单的自动补全，而是理解你的意图来帮你构建更复杂的问题），而且你不需要在搜索前选择”要用AI模式还是普通模式”，系统自己判断。

谷歌慕尼黑总部（图片来源：TechCrunch）

信息代理：谷歌提醒的进化版

2003年谷歌推出过”谷歌提醒”（Google Alerts），关键词有新结果就发邮件通知你。那个服务现在还在，但早就不是人们获取信息的主要方式了。

这次的新东西叫”信息代理”（information agents），背后的逻辑是一样的——追踪变化、推送通知——但能力强了太多。你可以让一个代理7×24小时在后台跑，用你自定义的参数监控某个行业的股市动向，它不只是发现变化，还能理解变化的意义，汇总之后通知你，附带来源链接和进一步查看的信息。

谷歌搜索负责人Liz Reid在发布会上举了个例子：你可以设置提醒，用非常具体的参数追踪某个特定行业的股票市场动向，代理会为你制定监控计划，包括它需要访问的工具和数据——比如我们的实时金融数据。然后它会持续追踪这些变化，在条件满足时通知你。

生成式UI：搜索结果变成交互式网页

另一个有意思的更新是”生成式UI”——根据用户的问题，即时生成动态布局的交互式视觉内容。比如你问关于黑洞的问题，搜索结果不是一段文字，而是一个可以把概念具象化的交互式可视化组件，你接着问，它实时生成全新的视觉内容。

这套系统由谷歌DeepMind团队用Gemini Flash 3.5模型开发，今年夏天会免费向所有谷歌用户推出。除此之外，用户还能用自然语言指令在搜索里直接搭建自己的小应用（比如根据日历信息做膳食规划、健身追踪等），这背后是谷歌的Antigravity代理开发平台在支撑。

出版商要紧张了

这套改动有一个绕不开的副作用：出版商从谷歌搜索拿到的引流会继续大幅下降。AI概览（AI Overviews）已经让很多媒体网站的referral流量掉了不少，现在搜索结果里直接出交互式内容，用户更没有理由点链接出去了。对一些依赖广告的媒体来说，这可能会是最后一根稻草。

谷歌这边倒是不担心，AI概览的月活已经突破25亿，去年推出的对话式搜索模式月活也过了10亿。用户用脚投票，答案直接在搜索页上给到，何必再跳一次。

搜索这件事的本质正在发生变化——从”帮你找信息”变成”帮你把信息消化好直接给你”。这个过程里，用户省了事，但整个内容生态的流量分配逻辑也被重新洗牌了。出版商适应得过来吗？今年夏天见分晓。

📎 原文来源：Google Search as you know it is over — TechCrunch

2026年5月20日
Google把20年街景数据喂给了Genie，AI现在能模拟你家门口的街道了
你有没有在Google Maps的街景里「逛」过别人的 neighborhood？把那个小黄人往巴黎某条街上一扔，看看酒店是不是在安全的地段。Google现在想把这件事变得不止是「看看」，而是让你真正走进去、改天气、看暴风雪里的同一条街是什么样子。

5月19日的Google I/O大会上，DeepMind宣布把Street View的数据接入Project Genie——Google的通用世界模型。简单来说，Genie可以根据文字或图片提示，生成可交互的游戏式三维环境。现在加上街景，它生成的就是真实世界的地方。

Genie接入街景数据后，可生成纽约街景的交互式模拟（图源：TechCrunch）

为什么这件事有意思

DeepMind研究员Jack Parker-Holder举了一个很具体的例子：一个即将部署到伦敦的机器人，那边常年见不到什么太阳。用Genie，他们可以模拟阳光从维多利亚式房屋上反射下来的罕见场景，这样机器人真的遇到时就不会「懵掉」。

「你可以说，我要去纽约，但不是这个季节，是下雪的时候。我想看看那条街在下雪时是什么样子。」

街景数据积累，Google干了20年。背着摄像头的小车和塞了相机的背包，在全球110个国家和七大洲拍了超过2800亿张图片。这些数据的价值，过去主要体现在地图产品和广告上，现在DeepMind找到了新用法。

不只是玩游戏

Genie 3去年8月开放了研究预览，今年1月向美国的Google AI Ultra订阅用户开放。它的目标应用场景有三个：教育、游戏、机器人训练。接上街景之后，机器人训练这个场景立刻变得很实。

Waymo已经在用Genie的模拟器来训练无人驾驶汽车应对「极罕见事件」——比如龙卷风，或者一头大象突然出现在路上。以前这种场景只能靠人工合成，现在有了街景作为基底，模拟出来的环境至少地理位置是真实的。

和Waymo自己的模拟器相比，Genie的优势在于视角。Waymo的模拟都是从车载摄像头角度看的，而街景数据可以切换到任意视角——机器人视角、行人视角、甚至无人机视角。
- 2800亿张街景图片覆盖全球110个国家
- Waymo已用Genie模拟龙卷风、大象等极端场景
- 支持任意视角切换（车载/行人/机器人/无人机）
- 教育、游戏、机器人训练三大目标场景
还差在哪里

坦率说，现在的效果还没到「以假乱真」的程度。Google团队给我看的样片，包括我以前住过的一个街区的海底版本，识别度很高，但画质还是电子游戏水准，不是照片级真实。

更大的问题是物理规律。现在的Genie模型还没有真正理解因果关系——比如在一个约书亚树国家公园的雪地场景模拟里，跑过去的人直接穿过了仙人掌和灌木丛。物理规则不是硬编码进去的，模型是通过被动观察自己「悟」出来的，这个过程还需要时间。

「这类模型在准确度和质量上，可能比视频生成落后6到12个月。但我认为这是可以解决的。」——Jack Parker-Holder

对比一下，Google自己的图像生成器Nano Banana已经能在信息图里生成完美的文字，视频生成器Veo也理解了纸船会跟着水流漂、烟会在空气中散开这些物理常识。Genie要追上这个水平，还得再跑一阵。

目前，Street View in Genie已经向部分美国Ultra用户开放，接下来几周会逐步扩展到全球Ultra用户。DeepMind的产品经理Diego Rivas提醒说，这还是一个实验性的东西，准确度方面还有很多要改进的地方。

但方向是清晰的。Google Maps的前总监Jonathan Herbert说，他们很早就在想怎么把地图数据用在新形式的AI研究上。Genie接入街景，是这个世界模型第一次真正摸到「真实世界的地基」。接下来会发生什么，值得盯着看。

📎 原文来源：TechCrunch – Google’s Genie world model can now simulate real streets with Street View
2026年5月20日
Google I/O 2026 Day 1直击：Gemini 4.0、Omni多模态、XR眼镜齐亮相

今天Google I/O 2026正式开幕，谷歌一口气发布了多个重磅产品。看完整个发布会，感觉谷歌这次是认真了，不再是以前那种”我们有个很酷的研究项目”的画饼风格，而是实打实地把AI塞进了每一个产品线里。

Gemini 4.0：不止是基准测试

Gemini 4.0这次是真的来了。谷歌没有只拿基准测试分数说事，而是把重点放在了实际应用场景上——Workspace集成、多模态推理、智能体可靠性，这些都是企业用户真正关心的东西。

外界预期Gemini 4.0在多模态推理上会有显著提升，如果它能接近Claude Mythos Preview的94.6% GPQA成绩，那谷歌就真的把今年早些时候丢掉的话语权给抢回来了。

谷歌的优势在于生态。安卓30亿+设备、搜索数据、Workspace 2亿+用户，这不是OpenAI或者Anthropic短时间内能追上的。

Gemini Omni：文本+图像+视频统一管线

这次最让我意外的是Gemini Omni。它不是Veo的升级版，而是一个统一的文本/图像/视频生成管线，可以在对话窗口里直接生成和编辑视频，还会自动配背景音乐。

早期泄露的测试报告显示，Omni在提示词保真度和音频质量上都比Veo 3.1强。如果这套系统正式上线，谷歌就是第一个在消费级场景里提供全模态统一生成能力的厂商。叠加安卓生态的分发优势，这个组合拳确实不好接。

Google I/O 2026 Day 1 发布会现场

Android XR眼镜与Aluminium OS

硬件方面，谷歌和三星、Warby Parker、Gentle Monster、XREAL合作的Android XR眼镜正式亮相。无屏版本重80克以内，售价379-499美元，搭载骁龙AR Gen 3，延迟200ms。这个规格如果能兑现，Meta的Ray-Ban系列可能要感受到压力了。

更值得关注的是Aluminium OS，这个基于安卓开发的系统将替代ChromeOS，首批笔记本由宏碁、华硕、戴尔、惠普、联想生产，2026年秋季上市。谷歌这是在把安卓的势力范围从手机扩展到PC。

Gemini Spark：谷歌版的AI智能体

Gemini Spark是这次发布的一个容易被忽略但很重要的产品。它能自动化跨应用任务——整理收件箱、生成会议简报、追踪新闻事件进展。这和微软的Copilot、Anthropic的Claude Cowork是一个赛道的产品，但谷歌的优势在于它自己的应用生态（Gmail、Calendar、Drive、Docs）。

总体来看，谷歌这次的策略很清晰：不追求单一的基准测试冠军，而是把Gemini铺到所有能铺的地方——手机、眼镜、笔记本、云端、企业应用。这种打法短期内在基准测试上可能不够性感，但长期来看，生态黏性才是最难被颠覆的壁垒。

📎 原文来源：Google I/O 2026 Live – Gemini 4, Omni Video Model, Android XR Glasses, Aluminium OS

2026年5月19日
Google I/O 2026今天开幕：Gemini 4.0、XR眼镜、新系统齐亮相

Google I/O 2026今天开幕，大家期待的Gemini 4.0终于要亮相了。这次谷歌不只是更新模型，而是打算把AI能力直接塞进操作系统、塞进眼镜里，完成从”AI功能叠加”到”AI原生重构”的战略跨越。

Gemini 4.0：上下文窗口拉到1000万tokens

参数规模据说到3-5万亿，上下文窗口突破1000万tokens，是GPT-5.5的25倍，可以一次性加载完整代码库或者整本书籍做深度分析。更重要的是原生多模态，文本、图像、音频、视频统一处理，不用在不同模型之间来回切换。

深度整合谷歌搜索之后，Gemini 4.0的知识可以实时更新、事实实时核查，幻觉率压到3%以内。定价预计每百万输入2.5美元，性价比相当能打。

Android XR眼镜：80克、499美元起

谷歌将推出首款自研Android XR智能眼镜，重量不到80克，售价499美元起，比同类竞品便宜不少。搭载高通骁龙AR Gen 3处理器，内置本地Gemini Nano轻量模型，200毫秒内响应，支持离线导航和实时翻译。

深度适配Gemini 4.0之后，这副眼镜具备实时视觉理解、主动智能推送、多模态交互能力。谷歌还开放了Android XR SDK，现有安卓应用可以快速迁移到XR场景。

Aluminum OS：8年磨一剑，三系统合一

历时8年研发的Aluminum OS将正式落地，把Android、Chrome OS、Fuchsia三个系统揉在一起，手机、电脑、XR设备、智能家居全终端统一适配。

Gemini 4.0拿到系统级接口，可以打通跨应用数据壁垒，实现实时上下文感知与主动智能执行。该系统将首发搭载于10月发布的Pixel 10系列手机，谷歌的AI硬件闭环生态算是真正立起来了。

谷歌这次形成”大模型+硬件+操作系统+开发者生态”的全栈布局，直接对标OpenAI和Anthropic，全球AI竞争进入最激烈阶段。

📎 原文来源：Google I/O 2026倒计时：Gemini 4.0、Android XR眼镜、Aluminium OS 三大重磅将登场

2026年5月19日
Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

美西时间5月19日10点（北京时间明天凌晨2点），Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数，可能会错过真正值得看的东西。

Gemini 4.0：谷歌的”必须赢”时刻

从上次Google I/O到现在，AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场，GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩（GPQA 94.6%），谷歌今年在AI叙事上就又要当配角。

外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键，也是谷歌云如果能把Gemini嵌进企业工作流的机会。

外界预测Gemini 4.0的参数规模可能达到3万亿级别，但参数规模已经不是重点。重点是：它能不能在企业生产环境里稳定运行，而不是在 benchmark 上刷分。

Android XR眼镜：谷歌的硬件”第三次尝试”

谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook，每一个都曾是”下一代计算平台”。这次的Android XR眼镜，谷歌学聪明了：不搞封闭生态，拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

无屏版2026年就能买到，价格区间会很宽——从入门级到高端产品都会有。关键是交互：免提召唤Gemini，用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”，这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

Aluminium OS：ChromeOS的”Android化”

这个泄露了好几个月的”ChromeOS替代系统”，本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示：底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

为什么要做这个？因为Chromebook在教育市场站稳了，但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行，对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。

Google Cloud Agentic Toolkit：企业AI的”最后一公里”

这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺，很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

PwC前几天刚宣布把Claude部署到全球几十万员工，用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”，光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”，不是”分数更高的模型”。

该怎么看这场发布会？

如果你期待谷歌在I/O上”一统AI江湖”，可能会失望。但如果你关心的是：Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案，会在接下来48小时内慢慢浮现。

谷歌有什么？Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局，谷歌手里的牌其实比大多数人想的好。

📎 原文来源：综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道

2026年5月19日
Google I/O 2026明天开幕：Gemini 4.0、XR眼镜、Aluminium OS，谷歌全产品线押注AI

明天（5月19日）上午10点PT，Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

Gemini 4.0：直接对标Claude Mythos

谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示，这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分，谷歌就能在这一周里重新掌握AI叙事的主导权。

有意思的是，谷歌在5月12日的Android Show上已经把平台级更新提前发布了，I/O专门留给模型发布和硬件，这个节奏安排相当聪明——避免自家产品抢流量，把最炸的牌留到主会场。

Android XR眼镜：跟Meta的又一次对决

硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是，谷歌的方案更彻底：不靠镜片显示，而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打，I/O上应该会有更详细的交互演示。

Aluminium OS：ChromeOS的终点，Android桌面的起点

一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示，这个新系统长得像一个放大版Android：底部Dock、虚拟桌面、完整应用窗口，就是没有传统Linux底层的那种笨重感。

如果Aluminium OS真的能在2026年完成ChromeOS的替换，谷歌就拥有了一条从手机（Android）到平板（Android XR）到笔记本（Aluminium）到云（Google Cloud Agentic Toolkit）的完整AI设备链路。苹果还没把这个拼图拼完整。

Google Cloud Agentic Toolkit：企业智能体的定价终于要透明了

对企业用户来说，这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊，这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

讲真，企业在选智能体平台的时候，定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里，谷歌如果还在绕圈子，企业客户会用脚投票的。

战局研判：这一周的胜负手

把时间线拉远一点看，这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮，谷歌在5月19日放大招，Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

如果Gemini 4.0的实测表现真的能打，谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平，那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

明天上午10点PT，答案揭晓。

📎 原文来源：AI News Today – May 18, 2026: 13 Biggest Stories

2026年5月18日
五大前沿AI实验室被纳入政府监管：模型发布前要先过这一关

美国商务部下属的AI安全与基础设施局（CAISI）近期悄悄干了一件事——和OpenAI、Anthropic、Google DeepMind、微软、xAI这五家前沿AI实验室全部签署了预部署评估协议。意思是，这些实验室的主流模型在正式发布前，得先过政府这一关。

不是自愿，是强制

这份协议已经最终敲定，具有约束力。覆盖范围是五家实验室计划在美国境内发布的所有主流前沿模型。评估由CAISI主导，核心目标是排查模型的安全风险和合规隐患，防止模型发布后引发监管暴露问题。

具体评估指标和详细内容目前没有公开，但可以参考英国AI安全研究所最新发布的红队测试指南——主要聚焦模型能力边界和潜在滥用风险。这个变化意味着，从模型官宣到API正式对外开放，中间会多一段政府评估的时间窗口。

这标志着美国AI产业正式从”快速行动、打破常规”的野蛮生长阶段，转向受监管的基础设施类产业的监管逻辑——是行业结构性的监管转向。

全球监管协同正在形成

欧盟方面也在跟进。目前欧盟正与Anthropic洽谈Mythos模型的政府访问权限，但尚未达成与美国同等层级的协议。英国AI安全研究所则在Google I/O大会开幕前更新了红队测试指南，表明国际层面在协同关注前沿模型能力监管。

对企业用户来说，这套新流程相当于给前沿模型加了一层官方信任背书——所有模型在发布前都经过政府评估，理论上能降低企业部署后遭遇监管处罚或合规风险的可能性。

对行业意味着什么

短期来看，模型发布节奏会受影响。实验室需要预留政府评估的时间，从完成训练到正式上线的时间窗口会被拉长。对于那些靠”抢先发布”来占据市场注意力的实验室来说，这不是一个好消息。

但换个角度看，政府背书也能成为竞争优势。Anthropic在企业市场的迅猛增长，部分原因就是它的模型被认为”更安全、更合规”。当监管成为行业标准的一部分，跑赢合规反而可能是最好的市场策略。

xAI作为名单里最新的成员，它的加入说明监管网已经覆盖了所有主流玩家，不管创始人埃隆·马斯克和华盛顿的关系如何，规则面前暂时人人平等。

📎 原文来源：AI News Today – May 18, 2026 | Build Fast with AI

2026年5月18日
Google DeepMind启动亚太加速器，用AI守护地球

谷歌DeepMind最近宣布启动亚太区”AI for the Planet”加速器计划，要把AI用到气候变化这类棘手的环境问题上。亚太地区既是全球经济增长引擎，又是气候变化的高脆弱区，这个选择其实很有战略眼光。

从生产力工具到行星级解决方案

DeepMind这个动作，标志着它的定位正在发生根本性转变——不再只是做AlphaFold、大语言模型这类”生产力工具”，而是要把AI变成解决全球性问题的”行星级解决方案”。

加速器计划为期三个月，入选团队会拿到DeepMind的技术资源、导师指导，还有机会跟DeepMind的研究员直接合作。重点是”AI智能体网络”——不是单个模型，而是多个AI协作去处理复杂的环境治理问题。

亚太地区既贡献了全球三分之二的经济增长，也承载了最高的气候脆弱性。绿色技术虽然在兴起，但要把AI真正用到环境治理里，还需要更多的创新和实践。

智能体网络是怎么解决环境问题的

传统AI应用大多是”一个问题、一个模型”，但环境问题不是这样。气候变化、生物多样性丧失、海洋污染——这些都是系统性的问题，需要多个AI智能体协作，分别处理不同的子任务，然后整合出解决方案。

举个例子：预测某个地区的洪灾风险，需要同时分析气象数据、地形数据、土地利用数据、人口密度数据……单个模型很难搞定这么复杂的输入。但如果是多个智能体分工——一个专门处理气象、一个专门分析地形、一个负责人口建模——最后把结果整合起来，准确性会高很多。

亚太地区为什么是首选

选亚太地区作为首个加速器落地点，背后有几层考虑。一是亚太国家的环境问题迫在眉睫——从东南亚的海平面上升，到印度的极端高温，再到中国的空气污染，都是需要紧急应对的现实挑战。二是亚太地区的科技创新生态正在快速成熟，有大量有潜力的初创团队和研究者。

三是数据资源。亚太地区有全球最丰富的人口数据和环境监测数据，这对训练AI模型来说是金矿。DeepMind显然想通过这次加速器，跟亚太的研究团队建立深度合作，拿到这些数据资源。

AI环境治理的想象空间

这次加速器计划触及的，其实是一个被严重低估的方向：AI在环境科学和气候治理中的应用。过去几年，大家都在关注AI怎么改变办公、怎么颠覆搜索、怎么影响内容创作……但AI在科研、在环境治理、在应对气候变化方面的潜力，其实一点都不比那些”网红应用”小。

如果这次加速器能跑出几个成功的案例，说不定会带起一波新的AI创业方向——不再是卷聊天机器人、卷内容生成，而是去做真正有社会价值的事情。

📎 原文来源：Google DeepMind Accelerator program in Asia Pacific

2026年5月18日

标签： Google

为啥要做这个？因为改图太麻烦了

对手不只是Canva

谁能用？什么时候能用？

搜索的”十个蓝色链接”时代正式结束

Gmail现在能跟你对话了

Gemini Spark：常驻后台的AI代理

硬件：XR眼镜合作款全部亮相

定价：Ultra订阅拆分两档

信息代理：谷歌提醒的进化版

生成式UI：搜索结果变成交互式网页

出版商要紧张了

为什么这件事有意思

不只是玩游戏

还差在哪里

Gemini 4.0：不止是基准测试

Gemini Omni：文本+图像+视频统一管线

Android XR眼镜与Aluminium OS

Gemini Spark：谷歌版的AI智能体

Gemini 4.0：上下文窗口拉到1000万tokens

Android XR眼镜：80克、499美元起

Aluminum OS：8年磨一剑，三系统合一

Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

Gemini 4.0：谷歌的”必须赢”时刻

Android XR眼镜：谷歌的硬件”第三次尝试”

Aluminium OS：ChromeOS的”Android化”

Google Cloud Agentic Toolkit：企业AI的”最后一公里”

该怎么看这场发布会？

Gemini 4.0：直接对标Claude Mythos

Android XR眼镜：跟Meta的又一次对决

Aluminium OS：ChromeOS的终点，Android桌面的起点

Google Cloud Agentic Toolkit：企业智能体的定价终于要透明了

战局研判：这一周的胜负手

不是自愿，是强制

全球监管协同正在形成

对行业意味着什么

从生产力工具到行星级解决方案

智能体网络是怎么解决环境问题的

亚太地区为什么是首选

AI环境治理的想象空间