标签： Gemini

2026谷歌I/O大会：AI智能体全面接管，Gemini 3.5速度提升4倍

谷歌I/O 2026：从搜索公司到AI智能体平台的惊险一跃

5月20日凌晨1点，加州山景城的谷歌总部灯火通明。Sundar Pichai站在台上的时候，我突然意识到一个问题——这家公司真的在All in AI。不是口号，是真金白银那种all in。

过去12个月，谷歌处理的Token总量达到了3.2千万亿个。这个数字什么概念？比去年增长了7倍。Gemini应用的月活用户也突破了9亿。当一家公司的AI产品能做到这个量级，它就已经不是在”尝试”AI了，而是在用AI重新定义自己。

Gemini不再只是聊天机器人

这次大会最核心的变化，是谷歌对AI智能体的重新定义。Gemini不再是那个你问它答的工具，而是一个持续运行、跨应用执行任务的智能代理。它能替你追踪信息、生成内容、调用工具，甚至直接完成下单和操作流程。

谷歌今年在AI基础设施上的投入预计达到1800亿到1900亿美元。这不是研发费用，是实打实的算力、数据中心、TPU采购。TPU8分成了两类——一类专门做大规模训练，一类负责快速响应用户请求。

这个信号很明确：谷歌要把AI变成一种基础设施，就像当年的搜索引擎一样，让所有人都跑在它的平台上。

几个让我印象深刻的功能

AskYouTube——YouTube要加聊天机器人了。你可以用自然语言描述你想看的内容，系统直接跳转到视频的对应片段。比如你说”我想看那段讲Transformer架构的部分”，它真的能找到。这个功能今年夏天会在美国推广，国内估计还得等等。

DocsLive——用语音直接跟Google Docs对话。现场演示的时候，Gemini自动提取演讲要点，还从Google Drive和Gmail里调信息来帮你写文档。这个对办公场景的提升是实打实的，不用再来回复制粘贴了。

GeminiOmni——DeepMind推出的视频生成模型，基于世界模型架构。你可以用自然语言改视频里的角色、背景、场景。这个技术如果能成熟，视频创作的门槛会进一步降低。

速度战：Gemini 3.5 Flash来了

谷歌这次特别强调速度。Gemini 3.5 Flash的生成速度是其他前沿模型的4倍。为什么这么在意速度？因为AI代理要真正可用，响应延迟必须降到人类感知的阈值以下。

你可以把这理解为AI版的”即时满足”——用户问一个问题，如果超过2秒才响应，体验就断了。谷歌显然在这个方向上押了重注。

搜索的AI重构

谷歌搜索也在变。新的搜索框不只是自动补全，还会给AI生成的搜索建议，支持多模态搜索（文字+图片一起搜）。AIMode和AIOverview这两个功能正在把搜索引擎从”找链接”变成”给答案”。

这对内容创作者来说是个挑战——如果谷歌直接给答案，用户还点不点你的链接？

硬件端：Android XR智能眼镜

谷歌还预告了跟GentleMonster、Warby Parker和三星合作的Android XR智能眼镜。分两种：一种是语音交互版，一种是信息投影版。你戴着眼镜就能导航、下单、查信息。

这个方向跟Meta的Ray-Ban眼镜其实是同一个赛道，但谷歌的优势是软件和生态。如果它真的能把Gemini塞进眼镜里，体验可能会比Meta更完整。

我的判断

2026年的谷歌I/O，本质上是一场”AI基础设施化”的宣言。它不再满足于做一个搜索公司或者广告公司，而是要把自己变成AI时代的水电煤。

智能体、TPU、Gemini生态、Android XR——这些布局如果都能落地，谷歌在AI时代的护城河会比很多人想象的更深。当然，执行才是关键。发布是一回事，真正让几亿用户每天离不开这些功能，是另一回事。

接下来就看OpenAI和Anthropic怎么接招了。

📎 原文来源：2026年谷歌I/O大会全景解析：AI助手Spark与Gemini 3.5全面升级，智能体引领新潮流

2026年5月22日
谷歌I/O 2026大会：Gemini 3.5亮相，AI生态全面升级
昨天凌晨1点，谷歌在山景城开了2026年的I/O大会。如果你关注AI，这场发布会基本等于谷歌今年的「底牌曝光」——新一代Gemini模型、搜索大改版、还有那副看起来有点怪的AI眼镜，全都一次性端了出来。

Gemini Omni：把图像、音频、视频揉进一个模型

谷歌把图像生成、文本处理、音频分析和视频编辑全部整合进了Gemini Omni。现场演示的时候，工作人员直接对着手机说了一句「帮我把这段视频加个字幕，背景音乐换成爵士乐」，模型真的就跑起来了，而且速度不算慢。

这个功能的核心价值在于：你不再需要打开Premiere或者Final Cut，也不用在不同AI工具之间倒腾文件。自然语言直接驱动多模态编辑，这才是「AI助手」该有的样子。

Gemini 3.5 Flash已经向全球用户开放，Pro版本还在内部测试。谷歌这次明显在打「速度牌」——Flash系列主打低延迟，瞄准的是开发者和移动端场景。

搜索的「25年来最大改版」

谷歌把新搜索框叫做「动态扩展搜索」——你可以输入一段混合了文字、图片、视频的复杂问题，AI不再只返回十个蓝色链接，而是直接给你出一份带图表的研究报告。

现场演示了一个「帮我规划欧洲十日游」的例子：AI自动拉取了航班价格、酒店评价、景点开放时间，甚至还提醒你「5月22日巴黎有罢工，建议调整行程」。这种级别的个性化，背后是谷歌搜索团队攒了20年的数据在撑着。

Gemini应用：从聊天机器人到生活管家

过去一年，Gemini的月活从4亿涨到了9亿。谷歌显然不满足于只做一个「问答工具」，这次他们推出了两个新功能：
- Daily Brief：每天早上给你生成一份个性化简报，整合了你的日历、邮件、新闻推送
- Gemini Spark：任务管理助手，可以自动规划日程、提醒待办、甚至帮你给邮件分类
这两个功能的逻辑很清楚：谷歌想让Gemini成为你每天第一个打开、最后一个关闭的应用。从「聊天」到「管家」，这个转型如果能跑通，谷歌在AI入口之争里的筹码就厚重多了。

硬件：AI眼镜和Android XR

谷歌在大会上展示了一副AI智能眼镜的原型机——可以实时翻译路标、识别商品信息、提供导航指引。现场演示的时候，工作人员戴着眼镜在舞台上走来走去，眼镜里的AI助手实时把英语字幕打在了镜片上。

这东西目前看起来还比较粗糙，但方向是对的。Meta的Ray-Ban眼镜已经卖了100多万副，谷歌这时候进场，时间点不算晚，但也不算早。

财报数字：AI投入的底气

Alphabet今年第一季度的总营收是1099亿美元，同比增长22%。搜索和广告业务贡献了604亿美元——这些钱，很大一部分会投进AI研发里。

谷歌的优势在于「垂直整合」：从TPU芯片到Gemini模型，再到Chrome浏览器和Android手机，整个技术栈都是自己的。这种打法，OpenAI和Anthropic短期内追不上。

📎 原文来源：ITBear – 谷歌I/O 2026大会：AI深度融入生态，开启全场景智能新篇章
2026年5月21日
谷歌这次把AI科学家搞出来了，7个智能体自己跑实验，还登了Nature

谷歌DeepMind最近搞了个大动作，直接把AI科研助手的水平拉到了《Nature》正刊的级别——他们推出的Co-Scientist系统，现在已经能自主完成从提假设到验证的全科研流程，而且在肝纤维化、衰老这些之前啃不动的生命科学领域，已经拿出了实打实的成果。

谷歌DeepMind Co-Scientist系统架构图（来源：新浪财经）

Co-Scientist的核心是基于Gemini大模型的7大智能体体系，模拟完整科学研究循环（提出假设→质疑修正→迭代完善）。

7大智能体怎么分工？

这7个智能体各有分工，合起来就是一个不用休息的科研团队：生成代理负责基于已有文献提初步假说；邻近性代理给这些假说分类，避免漏了潜在的研究路径；反思代理相当于虚拟同行评审，专门挑假设的错误；排名代理让假说两两比拼，筛选出最有前景的方向；进化代理对排名靠前的假说迭代优化；元评审代理汇总结果，生成完整研究方案给人类科学家审阅；监督代理是总指挥，拆解大目标为具体任务，协调所有智能体并行工作。

为了保证质量，系统还借鉴了AlphaGo的博弈逻辑，让假说之间“打擂台”，把大部分算力投入假设验证环节——反复核对假设和现有文献、数据的一致性，确保假设有依据、逻辑通顺、能实验验证。另外还能调用ChEMBL、UniProt这些专业数据库，以及AlphaFold等第三方AI工具，吸收多维度的知识。

已经在哪些领域出了成果？

目前这个系统优先在生命科学领域落地，已经搞出了不少突破：肝纤维化治疗方向，筛选出的老药新用候选药物，在实验室里能抑制91%的纤维化相关反应，效果比传统方案好得多；渐冻症（ALS）研究，整合了几十年的领域文献，提出了全新的RNA疗法思路，现在已经在推动跨实验室联合攻关；细胞衰老逆转研究，精准锁定了关键基因靶点，把原本需要数月的数据处理工作压缩到了数天完成。

其他方向也有进展：肝病机制研究，解析出了不同药物疗效差异的核心原因，结论经实验100%验证；新发传染病研究，能快速锁定致病关键氨基酸，把原本需要数年的实验周期缩短到数周；衰老生物学研究，提出了应激反应的全新假设，已经经过多家实验室独立验证。

AI for Science成巨头新战场

谷歌这次突破之后，AI for Science赛道已经成了科技巨头和初创公司都在抢的香饽饽：2025年12月FutureHouse推出AI科学家Robin，首轮融资就拿了7000万美元；英伟达和礼来宣布未来5年共同投资10亿美元，共建全球首个AI药物共创实验室；科学智能公司Lila Sciences刚完成3.5亿美元A轮融资，估值就超过了13亿美元。

以前搞科研靠天才的灵感和运气，现在有了这套系统，相当于给每个科学家配了一个24小时不睡觉、能读完所有文献、还能自己设计实验的助手——科研效率的革命，真的要来了。

📎 原文来源：登顶Nature！谷歌最强AI科学家问世，7大智能体独立做研究，攻克肝纤维化、衰老难题！

2026年5月21日
谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态
谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

谷歌I/O 2026开发者大会现场 (图源：腾讯新闻)

北京时间5月20日凌晨1点，谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天（5月19-20日），核心主题只有一个：把AI智能体塞进你生活的每一个角落。

先说最硬核的模型更新。Gemini 3.5 Flash来了，官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么？你让AI帮你写代码、跑长任务，别的模型还在”思考”，它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的，速度就是生产力。

Gemini 3.5 Flash的定位很清晰：不是最聪明的模型，但是最快的。对于那些需要反复调用、长工作流的场景，速度比绝对智能更重要。

视频生成模型Gemini Omni亮相

DeepMind首席执行官德米斯·哈萨比斯亲自登台，发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频，还能用自然语言对话式编辑——你想改角色、换背景、调场景，直接说就行。

首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块，谷歌终于开始认真跟Sora、Runway们掰手腕了。

Android XR智能眼镜，手机可以不用掏了

Android XR智能眼镜演示 (图源：腾讯新闻)

谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜，分两类：一类是纯语音眼镜（没有显示屏），另一类可以把信息投射到视野前方。

现场演示很有意思：佩戴者要让Gemini帮自己点一杯咖啡，导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单，全程没掏手机，最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版，2026年秋季上市，支持配对iOS和Android设备。

Gemini Spark：关机的手机也能跑AI助手

这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手，即使你的设备关机了，它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

本周向受信任测试人员开放，下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐，2026年夏季将支持在Chrome浏览器中运行。

其他值得关注的更新
- Ask YouTube：在YouTube网站加入聊天机器人交互界面，支持自然语言搜索直接跳转至视频对应片段，2026年夏季将在美国扩大推广
- Docs Live：支持通过语音与Google Docs对话，无需输入提示词，可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
- Antigravity 2.0：面向AI Agent时代的编程平台，直接对标Anthropic Claude Code、OpenAI Codex
- Universal Cart：AI智能体驱动的通用购物车，可跨场景添加商品，追踪优惠、监控价格变动、显示价格历史
- SynthID扩展：可识别图片是否为AI生成，用户可直接询问图片的生成属性
整体来看，谷歌这次的方向非常明确：AI不再是一个需要单独打开的App，而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代，谷歌想做那个无处不在的底色。

📎 原文来源：一文看懂2026年谷歌I/O大会：Gemini 3.5 Flash、视频模型…
2026年5月21日
Antigravity 2.0发布：Google把智能体编程玩出了新花样

Google I/O 2026第一天，全场都在聊Gemini 4.0和那些炫酷的XR眼镜，但我觉得真正值得开发者关注的，反而是这个看起来没那么起眼的Antigravity 2.0。要知道，上次Google推出Antigravity 1.0的时候，大家还在拿它跟Cursor对比，觉得Google不过是做个”追随者”。但这次2.0版本一出来，味道完全变了。

从编程工具到智能体平台

Antigravity 2.0最核心的变化，是它不再只是一个”帮你写代码的AI工具”，而是一个完整的智能体编程平台。这个定位变化很关键，意味着Google对这类产品的理解已经往前走了一大步。

你可以把它理解成：之前1.0版本是”你问它答”的单兵作战模式，现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度，你可以让一个智能体去写前端，同时另一个去处理后端的API，还有一个在后台跑测试。这种”智能体编排”能力，是目前市面上大多数AI编程工具还没摸到门槛的东西。

Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动，这个模型本身就是和Antigravity团队协同开发的。换句话说，Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

三个细节看出Google的野心

第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”，它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”，而是它意味着Antigravity正在向Google的消费级产品（Gmail、Docs的语音交互）对齐。未来的开发工具，可能真的就是”动动嘴皮子”的事。

第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力，搜索结果页面不只是给你一堆蓝色链接，而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味：Google正在把它的”智能体能力”渗透到用户旅程的每一个触点，而不只是局限在一个独立的IDE或者编辑器里。

第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发，也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显：Google不想让你”只在Antigravity里干活”，而是希望你用它的全套开发栈。

订阅体系背后的算盘

这次Antigravity 2.0是跟着Google的AI Ultra订阅计划（100美元/月）一起推出的。在这个价位下，Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法：他们不是想靠Antigravity单独赚钱，而是想用这个工具把开发者”锁”在Google的AI生态里。

你可以对比一下：Cursor的订阅是20美元/月，GitHub Copilot是10美元/月，但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”，这个定位差异决定了它的定价空间可以更高。

桌面应用和CLI双双升级

除了核心的智能体编排能力，Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流，你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程，然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”，Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

总体来看，Antigravity 2.0的这次更新，信号很明确：Google不想在AI编程这个赛道里只做一个”中庸的跟随者”，它想用生态优势（搜索、Workspace、Android、Firebase）和智能体编排能力，重新定义”什么是AI时代的开发工具”。

📎 原文来源：TechCrunch – Google launches Antigravity 2.0 with an updated desktop app and CLI tool at I/O 2026

2026年5月20日
谷歌Gemini要进Siri了，苹果的AI牌终于亮出来

苹果和谷歌这两个老对手，在AI这件事上居然握手了。2026年4月，谷歌云CEO Thomas Kurian在Google Cloud Next大会上亲口确认：谷歌正在作为苹果的首选云供应商，合作开发基于Gemini技术的下一代苹果基础模型，用来驱动未来的Apple Intelligence功能，包括那个大家都等了很久的新版Siri。

每年10亿美元，苹果买了个什么样的Gemini

2026年1月，苹果和谷歌签了一份多年协议，苹果每年支付大约10亿美元，授权使用1.2万亿参数的定制Gemini模型来支撑苹果自己的基础模型。这个价格不便宜，但苹果看重的是Gemini的多模态能力和谷歌在AI基础设施上的积累。

隐私规则没变——Apple Intelligence仍然在设备端或者苹果自己的私有云上运行，不会把用户数据送到谷歌的服务器去。苹果在这件事上很谨慎，引入Gemini的能力，但数据流自己掌控，相当于用谷歌的”大脑”，但”记忆”和”执行”还是苹果自己的地盘。

谷歌云CEO Thomas Kurian在大会上说得很直接：Gemini将驱动新一代Siri，带来更个性化的AI助手体验。预计2026年内上线。

新版Siri到底变了什么

WWDC 2026定于6月8日至12日在Apple Park举行，主题演讲在北京时间6月9日凌晨1点。苹果已经罕见地在3月就预告会带来”AI新进展”，外界普遍预期这届WWDC是苹果近年来战略意义最重大的一次。

新版Siri最大的变化是从”系统附件”变成了一款真正的独立App。以前Siri是依附在系统界面里的，现在用户可以像打开ChatGPT那样，随时随地一键开启Siri聊天界面。支持文字和语音两种交互方式，还能直接上传文件——这个在以前的Siri上是不可想象的。

对话记录的管理也更像一款正经的AI助手了：你可以选择类似ChatGPT的单次对话视图，也可以切换到类似iMessage的聊天列表视图，方便回溯和延续之前的对话线程。隐私设置里还可以自主决定聊天记录的存活周期——30天、一年或者永久保留，数据生命周期完全由用户自己掌控。

苹果的AI时间表

按照目前的节奏：2026年春季的iOS 26.4会先上线Gemini支撑的Siri上下文感知能力；9月iPhone 18发布时，推出支持多轮对话、复杂任务完成的全对话式Siri；6月8日的WWDC上，应该会展示iOS 27里相关的功能预览。

这个项目曾经延期了整整两年。苹果在AI上的节奏确实比竞争对手慢了一拍，但一旦决定押注，投入的资源也不小。每年10亿美元给谷歌，再加上自己的私有云基础设施，苹果显然是把AI助手这件事当成了下一个十年的核心战场。

6月9日凌晨1点，库克主题演讲见分晓。

📎 原文来源：WWDC 2026重磅前瞻：新版Siri蜕变独立App，拥抱Gemini模型与苹果私有云

2026年5月20日
Google AI Ultra大降价：从250美元砍到100美元，对标OpenAI

Google在I/O 2026上悄悄调整了AI Ultra订阅的价格体系——从原来的249.99美元/月，改成100美元/月起。这个降幅，说实话，挺狠的。

新的Ultra分两档：100美元/月是基础档，200美元/月的高档则包含Project Genie世界模型的访问权限。这个定价策略，明眼人一看就知道是冲着OpenAI去的——OpenAI的Pro订阅也是100美元和200美元两档，完全对标。

之前249.99美元/月的Ultra，说白了就是”劝退价”——贵到大多数人连试都不想试。Google这一刀砍下去，明显是想把那些在ChatGPT Plus和Gemini之间犹豫的用户拉过来。

为什么要降价？因为AI订阅这件事快卷不动了

过去一年，AI公司的订阅定价基本是”高位默契”——大家都不敢轻易降价，怕被市场认为”模型不值钱”。但实际情况是，大多数用户根本用不着每月100美元那么高端的功能。

Google这一降价，实际上是在重新定义”AI订阅的门槛”。如果100美元/月能用到Gemini 3.5 Flash、AI搜索增强、Gmail AI交互这些功能，那OpenAI的100美元Pro还剩多少差异化优势？

200美元档的杀手锏：Project Genie

200美元/月的高档Ultra，核心卖点是Project Genie世界模型的访问权限。这个东西我们在之前的文章里提到过——它能用Google街景的2800亿张图片生成可交互的3D世界，用来训练自动驾驶、机器人，或者做游戏开发。

这个功能的算力消耗非常大，所以Google把它放在高档订阅里作为差异化卖点，逻辑上说得通。问题就在于——有多少普通用户真的需要生成”可交互的3D世界”？这个项目更像是为开发者、研究机构、企业用户准备的。

OpenAI怎么跟？

Google降价之后，压力就转到OpenAI那边了。目前OpenAI的Pro订阅也是100/200美元两档，功能包括GPT-5.5访问、高级语音模式、代码解释器等。如果Google的Ultra在功能上追平甚至超过OpenAI Pro，那OpenAI可能也得考虑调整定价。

不过，AI订阅这件事最终的竞争点，可能不是价格，而是”用户到底信谁”。ChatGPT的品牌认知度目前还是领先Gemini不少，Google要想靠降价逆转局面，还得在产品体验上真正拉开差距。

降价是个开始，不是结束。接来下的几个月，AI订阅市场的价格战，估计会越打越激烈。

📎 原文来源：Google’s super expensive AI plan is getting cheaper – The Verge

2026年5月20日
Google推出Pics应用：AI设计工具赛道又多了一个重量级玩家

Google在今年的I/O大会上扔出了一个不太起眼、但挺有意思的新产品——Pics。这是一个跑在Google Workspace里的AI设计和图像生成应用，你可以直接把它理解成”Google版的Canva”，或者”AI版的Photoshop入门工具”。

这个说法可能有点过于简化了。Pics真正想做的，是让完全不懂设计的人也能用AI生成像样的视觉内容——社交媒体配图、活动邀请函、营销物料、产品原型图，这些都能通过简单的文字描述搞定。

为啥要做这个？因为改图太麻烦了

Google在发布Pics的时候说了一个很接地气的痛点：现在的AI图像生成工具，生成质量已经不错了，但如果你想改图中某一个细节，基本没戏——你得重新写一个提示词，然后祈祷这次AI别把其他部分也改掉。

Pics的思路是：生成图像只是第一步，关键是让图像里的每个元素都可以单独编辑。你可以用新的提示词改局部，也可以直接点击想改的地方写评论——就像在Google Docs里给同事提修改意见一样。

这个设计逻辑其实挺聪明的。它把AI图像生成从”抽奖式创作”变成了”可迭代设计”，降低了试错成本。底层驱动编辑功能的是Gemini，而图像生成本身则由Nano Banana 2支持——Google说这个模型在精确文本渲染、现实世界知识和细节输出上表现不错。

Google Pics应用界面，用户可通过文字提示生成并编辑设计

对手不只是Canva

Google做这个产品，明面上是冲着Canva去的，毕竟Canva这几年在AI设计赛道跑得挺快。但暗地里，Google可能更在意的是Anthropic最近推出的Claude Design——用Claude直接生成可编辑的设计稿，这个思路跟Pics有点像。

Google的优势在于生态整合。Pics原生嵌入Google Workspace，你可以在Docs、Slides、Sheets之间无缝协作，设计稿可以直接丢进幻灯片里用。对于已经离不开Google办公套件的企业和学校来说，这个整合黏性挺强的。

谁能用？什么时候能用？

目前Pics还在测试阶段，I/O期间有一小批测试者拿到了内测资格。Google说今年夏天会先向AI Ultra订阅用户开放，后续再逐步推给更广泛的用户。

这个节奏其实透露了Google的心思：AI设计工具不只是”做个好用的产品”那么简单，它是拉动高价AI订阅的重要手段。如果你能让用户觉得”每个月花100美元买Ultra，就为了用Pics做图”，那这个订阅就值了。

当然，最终Pics能不能打，还得看实际体验。AI生成设计这个赛道，嘴上说说都挺厉害，真要做到”生成即可用”的程度，还有不少坑要填。

📎 原文来源：Google just declared itself a contender in AI design at IO 2026 – TechCrunch

2026年5月20日
Google I/O 2026全记录：Gemini 3.5、AI搜索和智能眼镜全部到位

Google I/O 2026的主题只有一个：把Gemini塞进你数字生活的每一个角落。这场发布会5月19日开幕，整整两天的议程里，几乎没有哪个产品没被AI重新做一遍。

搜索的”十个蓝色链接”时代正式结束

搜索率先被改造。新搜索框支持长对话式查询，还能给出AI驱动的查询建议，你甚至可以往搜索框里直接拖文档、图片、视频和Chrome标签页。AI Overviews（AI概览）的月活已经摸到25亿，对话式搜索模式的月活也有10亿。

信息代理（information agents）会在后台7×24小时帮你跑任务，生成式UI即时生成交互式视觉内容，背后由Gemini Flash 3.5驱动。出版商的日子估计不太好过了——referral流量还会继续掉。

Gemini Flash 3.5驱动的搜索，已经不再是”搜完给你十个链接”的逻辑，而是直接帮你把事情做完。

Gmail现在能跟你对话了

Gmail Live语音交互模式在I/O上亮相，直接说话就能查邮件、提取行程、找学校通知。不用再盯着列表一页页翻。Workspace这边还有个AI图像生成应用叫Google Pics，支持点击图片局部标注修改需求，不用把提示词全部重写一遍，背后跑的是Gemini和Nano Banana 2模型。

Gemini Spark：常驻后台的AI代理

最值得一提的是Gemini Spark。这不是你叫它才动一下的聊天机器人，而是一个常驻后台的AI代理，能自动写完邮件、生成学习指南、监控订阅费用，还能对接Workspace、Canva、OpenTable这些第三方应用。

硬件：XR眼镜合作款全部亮相

Android XR眼镜的合作款全部亮相——三星、Gentle Monster、Warby Parker的版本都出来了，计划2026年年内发布。谷歌自研的Project Aura眼镜也更新了，计算单元更强，加了指纹解锁，还有新的充电盒设计。

Wear OS 7也有更新，加入了类似iPhone的”实时更新”功能，手表上能同步快递、赛事比分等动态信息，还能查看AI代理的自动化任务进度。

定价：Ultra订阅拆分两档

谷歌把AI订阅Ultra拆成了100美元/月和200美元/月两档，200美元那档包含Project Genie世界模型的访问权限。这个定价明显在对标OpenAI Pro，谷歌这次是真的在全栈铺开，而不只是做个 benchmark 冠军。

📎 原文来源：Google I/O 2026: All the news and announcements – The Verge

2026年5月20日
谷歌搜索亲手埋掉了十个蓝色链接，25年的老界面彻底变了

“十个蓝色链接”——这个词在互联网上活了25年，从谷歌1990年代把搜索框推向大众开始，就是这个样子。输入关键词，吐出来一排蓝色超链接，点进去自己找答案。这套逻辑所有人习以为常，直到2026年5月19日谷歌I/O大会，它宣布：这个时代结束了。

新搜索框是这次改造的核心。谷歌说这是搜索框自诞生以来最大的一次改动。它不再只是一个输入框了——能自动扩展长度来容纳长对话式查询，内置AI驱动的查询建议（不是简单的自动补全，而是理解你的意图来帮你构建更复杂的问题），而且你不需要在搜索前选择”要用AI模式还是普通模式”，系统自己判断。

谷歌慕尼黑总部（图片来源：TechCrunch）

信息代理：谷歌提醒的进化版

2003年谷歌推出过”谷歌提醒”（Google Alerts），关键词有新结果就发邮件通知你。那个服务现在还在，但早就不是人们获取信息的主要方式了。

这次的新东西叫”信息代理”（information agents），背后的逻辑是一样的——追踪变化、推送通知——但能力强了太多。你可以让一个代理7×24小时在后台跑，用你自定义的参数监控某个行业的股市动向，它不只是发现变化，还能理解变化的意义，汇总之后通知你，附带来源链接和进一步查看的信息。

谷歌搜索负责人Liz Reid在发布会上举了个例子：你可以设置提醒，用非常具体的参数追踪某个特定行业的股票市场动向，代理会为你制定监控计划，包括它需要访问的工具和数据——比如我们的实时金融数据。然后它会持续追踪这些变化，在条件满足时通知你。

生成式UI：搜索结果变成交互式网页

另一个有意思的更新是”生成式UI”——根据用户的问题，即时生成动态布局的交互式视觉内容。比如你问关于黑洞的问题，搜索结果不是一段文字，而是一个可以把概念具象化的交互式可视化组件，你接着问，它实时生成全新的视觉内容。

这套系统由谷歌DeepMind团队用Gemini Flash 3.5模型开发，今年夏天会免费向所有谷歌用户推出。除此之外，用户还能用自然语言指令在搜索里直接搭建自己的小应用（比如根据日历信息做膳食规划、健身追踪等），这背后是谷歌的Antigravity代理开发平台在支撑。

出版商要紧张了

这套改动有一个绕不开的副作用：出版商从谷歌搜索拿到的引流会继续大幅下降。AI概览（AI Overviews）已经让很多媒体网站的referral流量掉了不少，现在搜索结果里直接出交互式内容，用户更没有理由点链接出去了。对一些依赖广告的媒体来说，这可能会是最后一根稻草。

谷歌这边倒是不担心，AI概览的月活已经突破25亿，去年推出的对话式搜索模式月活也过了10亿。用户用脚投票，答案直接在搜索页上给到，何必再跳一次。

搜索这件事的本质正在发生变化——从”帮你找信息”变成”帮你把信息消化好直接给你”。这个过程里，用户省了事，但整个内容生态的流量分配逻辑也被重新洗牌了。出版商适应得过来吗？今年夏天见分晓。

📎 原文来源：Google Search as you know it is over — TechCrunch

2026年5月20日

标签： Gemini

谷歌I/O 2026：从搜索公司到AI智能体平台的惊险一跃

Gemini不再只是聊天机器人

几个让我印象深刻的功能

速度战：Gemini 3.5 Flash来了

搜索的AI重构

硬件端：Android XR智能眼镜

我的判断

Gemini Omni：把图像、音频、视频揉进一个模型

搜索的「25年来最大改版」

Gemini应用：从聊天机器人到生活管家

硬件：AI眼镜和Android XR

财报数字：AI投入的底气

7大智能体怎么分工？

已经在哪些领域出了成果？

AI for Science成巨头新战场

谷歌I/O 2026大会落幕：Gemini 3.5 Flash速度飙升4倍，AI智能体全面入侵安卓生态

视频生成模型Gemini Omni亮相

Android XR智能眼镜，手机可以不用掏了

Gemini Spark：关机的手机也能跑AI助手

其他值得关注的更新

从编程工具到智能体平台

三个细节看出Google的野心

订阅体系背后的算盘

桌面应用和CLI双双升级

每年10亿美元，苹果买了个什么样的Gemini

新版Siri到底变了什么

苹果的AI时间表

为什么要降价？因为AI订阅这件事快卷不动了

200美元档的杀手锏：Project Genie

OpenAI怎么跟？

为啥要做这个？因为改图太麻烦了

对手不只是Canva

谁能用？什么时候能用？

搜索的”十个蓝色链接”时代正式结束

Gmail现在能跟你对话了

Gemini Spark：常驻后台的AI代理

硬件：XR眼镜合作款全部亮相

定价：Ultra订阅拆分两档

信息代理：谷歌提醒的进化版

生成式UI：搜索结果变成交互式网页

出版商要紧张了