标签: Gemini

  • 2026谷歌I/O大会:AI智能体全面接管,Gemini 3.5速度提升4倍

    谷歌I/O 2026:从搜索公司到AI智能体平台的惊险一跃

    5月20日凌晨1点,加州山景城的谷歌总部灯火通明。Sundar Pichai站在台上的时候,我突然意识到一个问题——这家公司真的在All in AI。不是口号,是真金白银那种all in。

    过去12个月,谷歌处理的Token总量达到了3.2千万亿个。这个数字什么概念?比去年增长了7倍。Gemini应用的月活用户也突破了9亿。当一家公司的AI产品能做到这个量级,它就已经不是在”尝试”AI了,而是在用AI重新定义自己。


    Gemini不再只是聊天机器人

    这次大会最核心的变化,是谷歌对AI智能体的重新定义。Gemini不再是那个你问它答的工具,而是一个持续运行、跨应用执行任务的智能代理。它能替你追踪信息、生成内容、调用工具,甚至直接完成下单和操作流程。

    谷歌今年在AI基础设施上的投入预计达到1800亿到1900亿美元。这不是研发费用,是实打实的算力、数据中心、TPU采购。TPU8分成了两类——一类专门做大规模训练,一类负责快速响应用户请求。

    这个信号很明确:谷歌要把AI变成一种基础设施,就像当年的搜索引擎一样,让所有人都跑在它的平台上。

    几个让我印象深刻的功能

    AskYouTube——YouTube要加聊天机器人了。你可以用自然语言描述你想看的内容,系统直接跳转到视频的对应片段。比如你说”我想看那段讲Transformer架构的部分”,它真的能找到。这个功能今年夏天会在美国推广,国内估计还得等等。

    DocsLive——用语音直接跟Google Docs对话。现场演示的时候,Gemini自动提取演讲要点,还从Google Drive和Gmail里调信息来帮你写文档。这个对办公场景的提升是实打实的,不用再来回复制粘贴了。

    GeminiOmni——DeepMind推出的视频生成模型,基于世界模型架构。你可以用自然语言改视频里的角色、背景、场景。这个技术如果能成熟,视频创作的门槛会进一步降低。

    速度战:Gemini 3.5 Flash来了

    谷歌这次特别强调速度。Gemini 3.5 Flash的生成速度是其他前沿模型的4倍。为什么这么在意速度?因为AI代理要真正可用,响应延迟必须降到人类感知的阈值以下。

    你可以把这理解为AI版的”即时满足”——用户问一个问题,如果超过2秒才响应,体验就断了。谷歌显然在这个方向上押了重注。

    搜索的AI重构

    谷歌搜索也在变。新的搜索框不只是自动补全,还会给AI生成的搜索建议,支持多模态搜索(文字+图片一起搜)。AIMode和AIOverview这两个功能正在把搜索引擎从”找链接”变成”给答案”。

    这对内容创作者来说是个挑战——如果谷歌直接给答案,用户还点不点你的链接?

    硬件端:Android XR智能眼镜

    谷歌还预告了跟GentleMonster、Warby Parker和三星合作的Android XR智能眼镜。分两种:一种是语音交互版,一种是信息投影版。你戴着眼镜就能导航、下单、查信息。

    这个方向跟Meta的Ray-Ban眼镜其实是同一个赛道,但谷歌的优势是软件和生态。如果它真的能把Gemini塞进眼镜里,体验可能会比Meta更完整。


    我的判断

    2026年的谷歌I/O,本质上是一场”AI基础设施化”的宣言。它不再满足于做一个搜索公司或者广告公司,而是要把自己变成AI时代的水电煤。

    智能体、TPU、Gemini生态、Android XR——这些布局如果都能落地,谷歌在AI时代的护城河会比很多人想象的更深。当然,执行才是关键。发布是一回事,真正让几亿用户每天离不开这些功能,是另一回事。

    接下来就看OpenAI和Anthropic怎么接招了。

  • 谷歌I/O 2026大会:Gemini 3.5亮相,AI生态全面升级

    昨天凌晨1点,谷歌在山景城开了2026年的I/O大会。如果你关注AI,这场发布会基本等于谷歌今年的「底牌曝光」——新一代Gemini模型、搜索大改版、还有那副看起来有点怪的AI眼镜,全都一次性端了出来。

    Gemini Omni:把图像、音频、视频揉进一个模型

    谷歌把图像生成、文本处理、音频分析和视频编辑全部整合进了Gemini Omni。现场演示的时候,工作人员直接对着手机说了一句「帮我把这段视频加个字幕,背景音乐换成爵士乐」,模型真的就跑起来了,而且速度不算慢。

    这个功能的核心价值在于:你不再需要打开Premiere或者Final Cut,也不用在不同AI工具之间倒腾文件。自然语言直接驱动多模态编辑,这才是「AI助手」该有的样子。

    Gemini 3.5 Flash已经向全球用户开放,Pro版本还在内部测试。谷歌这次明显在打「速度牌」——Flash系列主打低延迟,瞄准的是开发者和移动端场景。

    搜索的「25年来最大改版」

    谷歌把新搜索框叫做「动态扩展搜索」——你可以输入一段混合了文字、图片、视频的复杂问题,AI不再只返回十个蓝色链接,而是直接给你出一份带图表的研究报告。

    现场演示了一个「帮我规划欧洲十日游」的例子:AI自动拉取了航班价格、酒店评价、景点开放时间,甚至还提醒你「5月22日巴黎有罢工,建议调整行程」。这种级别的个性化,背后是谷歌搜索团队攒了20年的数据在撑着。


    Gemini应用:从聊天机器人到生活管家

    过去一年,Gemini的月活从4亿涨到了9亿。谷歌显然不满足于只做一个「问答工具」,这次他们推出了两个新功能:

    • Daily Brief:每天早上给你生成一份个性化简报,整合了你的日历、邮件、新闻推送
    • Gemini Spark:任务管理助手,可以自动规划日程、提醒待办、甚至帮你给邮件分类

    这两个功能的逻辑很清楚:谷歌想让Gemini成为你每天第一个打开、最后一个关闭的应用。从「聊天」到「管家」,这个转型如果能跑通,谷歌在AI入口之争里的筹码就厚重多了。

    硬件:AI眼镜和Android XR

    谷歌在大会上展示了一副AI智能眼镜的原型机——可以实时翻译路标、识别商品信息、提供导航指引。现场演示的时候,工作人员戴着眼镜在舞台上走来走去,眼镜里的AI助手实时把英语字幕打在了镜片上。

    这东西目前看起来还比较粗糙,但方向是对的。Meta的Ray-Ban眼镜已经卖了100多万副,谷歌这时候进场,时间点不算晚,但也不算早。


    财报数字:AI投入的底气

    Alphabet今年第一季度的总营收是1099亿美元,同比增长22%。搜索和广告业务贡献了604亿美元——这些钱,很大一部分会投进AI研发里。

    谷歌的优势在于「垂直整合」:从TPU芯片到Gemini模型,再到Chrome浏览器和Android手机,整个技术栈都是自己的。这种打法,OpenAI和Anthropic短期内追不上。

  • 谷歌这次把AI科学家搞出来了,7个智能体自己跑实验,还登了Nature

    谷歌DeepMind最近搞了个大动作,直接把AI科研助手的水平拉到了《Nature》正刊的级别——他们推出的Co-Scientist系统,现在已经能自主完成从提假设到验证的全科研流程,而且在肝纤维化、衰老这些之前啃不动的生命科学领域,已经拿出了实打实的成果。

    谷歌Co-Scientist系统登顶Nature
    谷歌DeepMind Co-Scientist系统架构图(来源:新浪财经)

    Co-Scientist的核心是基于Gemini大模型的7大智能体体系,模拟完整科学研究循环(提出假设→质疑修正→迭代完善)。

    7大智能体怎么分工?

    这7个智能体各有分工,合起来就是一个不用休息的科研团队:生成代理负责基于已有文献提初步假说;邻近性代理给这些假说分类,避免漏了潜在的研究路径;反思代理相当于虚拟同行评审,专门挑假设的错误;排名代理让假说两两比拼,筛选出最有前景的方向;进化代理对排名靠前的假说迭代优化;元评审代理汇总结果,生成完整研究方案给人类科学家审阅;监督代理是总指挥,拆解大目标为具体任务,协调所有智能体并行工作。

    为了保证质量,系统还借鉴了AlphaGo的博弈逻辑,让假说之间“打擂台”,把大部分算力投入假设验证环节——反复核对假设和现有文献、数据的一致性,确保假设有依据、逻辑通顺、能实验验证。另外还能调用ChEMBL、UniProt这些专业数据库,以及AlphaFold等第三方AI工具,吸收多维度的知识。

    已经在哪些领域出了成果?

    目前这个系统优先在生命科学领域落地,已经搞出了不少突破:肝纤维化治疗方向,筛选出的老药新用候选药物,在实验室里能抑制91%的纤维化相关反应,效果比传统方案好得多;渐冻症(ALS)研究,整合了几十年的领域文献,提出了全新的RNA疗法思路,现在已经在推动跨实验室联合攻关;细胞衰老逆转研究,精准锁定了关键基因靶点,把原本需要数月的数据处理工作压缩到了数天完成。

    其他方向也有进展:肝病机制研究,解析出了不同药物疗效差异的核心原因,结论经实验100%验证;新发传染病研究,能快速锁定致病关键氨基酸,把原本需要数年的实验周期缩短到数周;衰老生物学研究,提出了应激反应的全新假设,已经经过多家实验室独立验证。

    AI for Science成巨头新战场

    谷歌这次突破之后,AI for Science赛道已经成了科技巨头和初创公司都在抢的香饽饽:2025年12月FutureHouse推出AI科学家Robin,首轮融资就拿了7000万美元;英伟达和礼来宣布未来5年共同投资10亿美元,共建全球首个AI药物共创实验室;科学智能公司Lila Sciences刚完成3.5亿美元A轮融资,估值就超过了13亿美元。

    以前搞科研靠天才的灵感和运气,现在有了这套系统,相当于给每个科学家配了一个24小时不睡觉、能读完所有文献、还能自己设计实验的助手——科研效率的革命,真的要来了。


  • 谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态






    谷歌I/O 2026大会落幕:Gemini 3.5 Flash速度飙升4倍,AI智能体全面入侵安卓生态

    谷歌I/O 2026大会
    谷歌I/O 2026开发者大会现场 (图源:腾讯新闻)

    北京时间5月20日凌晨1点,谷歌I/O 2026开发者大会在美国加州山景城开幕。这场发布会持续了两天(5月19-20日),核心主题只有一个:把AI智能体塞进你生活的每一个角落。

    先说最硬核的模型更新。Gemini 3.5 Flash来了,官方数据是输出Token速度约其他前沿模型的4倍。这个数字背后意味着什么?你让AI帮你写代码、跑长任务,别的模型还在”思考”,它已经把结果甩到你脸上了。谷歌这次明显是冲着AI Agent和编程工具场景去的,速度就是生产力。

    Gemini 3.5 Flash的定位很清晰:不是最聪明的模型,但是最快的。对于那些需要反复调用、长工作流的场景,速度比绝对智能更重要。

    视频生成模型Gemini Omni亮相

    DeepMind首席执行官德米斯·哈萨比斯亲自登台,发布了基于世界模型能力的视频生成模型Gemini Omni。这个模型支持多模态输入生成视频,还能用自然语言对话式编辑——你想改角色、换背景、调场景,直接说就行。

    首款面向用户的模型Gemini Omni Flash将于2026年夏季推出。视频生成这块,谷歌终于开始认真跟Sora、Runway们掰手腕了。

    Android XR智能眼镜,手机可以不用掏了

    Android XR智能眼镜
    Android XR智能眼镜演示 (图源:腾讯新闻)

    谷歌联合Gentle Monster、Warby Parker、三星推出了Android XR智能眼镜,分两类:一类是纯语音眼镜(没有显示屏),另一类可以把信息投射到视野前方。

    现场演示很有意思:佩戴者要让Gemini帮自己点一杯咖啡,导航到咖啡馆、打开DoorDash、准备好常点的氮气冷萃订单,全程没掏手机,最后只需点头确认下单。Gentle Monster和Warby Parker联名款是语音版,2026年秋季上市,支持配对iOS和Android设备。

    Gemini Spark:关机的手机也能跑AI助手

    这个产品有点颠覆认知。Gemini Spark是运行在Google Cloud虚拟机上的全天候个人AI助手,即使你的设备关机了,它还能在后台继续工作。它能自动汇总信息、追踪活动参与情况、发送跟进邮件、生成表格和宣传册。

    本周向受信任测试人员开放,下周向美国Google AI Ultra订阅用户开放。谷歌还新推出了100美元/月的低价Ultra套餐,2026年夏季将支持在Chrome浏览器中运行。

    其他值得关注的更新

    • Ask YouTube:在YouTube网站加入聊天机器人交互界面,支持自然语言搜索直接跳转至视频对应片段,2026年夏季将在美国扩大推广
    • Docs Live:支持通过语音与Google Docs对话,无需输入提示词,可自动从Google Drive、Gmail提取信息辅助文档创建和编辑
    • Antigravity 2.0:面向AI Agent时代的编程平台,直接对标Anthropic Claude Code、OpenAI Codex
    • Universal Cart:AI智能体驱动的通用购物车,可跨场景添加商品,追踪优惠、监控价格变动、显示价格历史
    • SynthID扩展:可识别图片是否为AI生成,用户可直接询问图片的生成属性

    整体来看,谷歌这次的方向非常明确:AI不再是一个需要单独打开的App,而是融入你打字的每一个瞬间、导航的每一个路口、购物的每一个决策。智能体时代,谷歌想做那个无处不在的底色。


  • Antigravity 2.0发布:Google把智能体编程玩出了新花样

    Google I/O 2026第一天,全场都在聊Gemini 4.0和那些炫酷的XR眼镜,但我觉得真正值得开发者关注的,反而是这个看起来没那么起眼的Antigravity 2.0。要知道,上次Google推出Antigravity 1.0的时候,大家还在拿它跟Cursor对比,觉得Google不过是做个”追随者”。但这次2.0版本一出来,味道完全变了。

    从编程工具到智能体平台

    Antigravity 2.0最核心的变化,是它不再只是一个”帮你写代码的AI工具”,而是一个完整的智能体编程平台。这个定位变化很关键,意味着Google对这类产品的理解已经往前走了一大步。

    你可以把它理解成:之前1.0版本是”你问它答”的单兵作战模式,现在2.0版本是”你统领一支AI团队”的指挥中枢。它支持多智能体并行调度,你可以让一个智能体去写前端,同时另一个去处理后端的API,还有一个在后台跑测试。这种”智能体编排”能力,是目前市面上大多数AI编程工具还没摸到门槛的东西。

    Antigravity 2.0由新发布的Gemini 3.5 Flash模型驱动,这个模型本身就是和Antigravity团队协同开发的。换句话说,Google这次是”为自己的智能体编程工具量身定制了一个底层模型”。

    三个细节看出Google的野心

    第一个细节是语音命令的加入。你现在可以直接对着Antigravity说”帮我重构一下这段代码的异常处理逻辑”,它就能理解你的意图并执行。这个功能的意义不只是”多了一种交互方式”,而是它意味着Antigravity正在向Google的消费级产品(Gmail、Docs的语音交互)对齐。未来的开发工具,可能真的就是”动动嘴皮子”的事。

    第二个细节是和Google搜索的深度集成。你现在在Google搜索里就能直接调用Antigravity的能力,搜索结果页面不只是给你一堆蓝色链接,而是可以直接生成一个小应用或者交互式UI。这个动作很值得玩味:Google正在把它的”智能体能力”渗透到用户旅程的每一个触点,而不只是局限在一个独立的IDE或者编辑器里。

    第三个细节是导出和生态打通。Antigravity 2.0现在支持把项目导出到本地继续开发,也可以无缝对接Android Studio、Firebase这些Google自家的开发工具。这个策略很明显:Google不想让你”只在Antigravity里干活”,而是希望你用它的全套开发栈。

    订阅体系背后的算盘

    这次Antigravity 2.0是跟着Google的AI Ultra订阅计划(100美元/月)一起推出的。在这个价位下,Antigravity的使用额度是Pro计划的5倍。这个定价策略其实透露了Google的真实想法:他们不是想靠Antigravity单独赚钱,而是想用这个工具把开发者”锁”在Google的AI生态里。

    你可以对比一下:Cursor的订阅是20美元/月,GitHub Copilot是10美元/月,但这两个工具都只是”帮你写代码”。Antigravity 2.0想做的是”帮你运营一整个AI开发团队”,这个定位差异决定了它的定价空间可以更高。


    桌面应用和CLI双双升级

    除了核心的智能体编排能力,Antigravity 2.0的桌面应用和CLI工具也都有实质升级。桌面端现在支持自定义工作流,你可以设计一个”代码审查→自动修复→运行测试→提交PR”的完整流程,然后让它后台自动跑。CLI工具则是面向那些习惯终端开发的”老炮”,Google甚至还引导原来的Gemini CLI用户迁移到新的Antigravity CLI上来。

    总体来看,Antigravity 2.0的这次更新,信号很明确:Google不想在AI编程这个赛道里只做一个”中庸的跟随者”,它想用生态优势(搜索、Workspace、Android、Firebase)和智能体编排能力,重新定义”什么是AI时代的开发工具”。

  • 谷歌Gemini要进Siri了,苹果的AI牌终于亮出来

    苹果和谷歌这两个老对手,在AI这件事上居然握手了。2026年4月,谷歌云CEO Thomas Kurian在Google Cloud Next大会上亲口确认:谷歌正在作为苹果的首选云供应商,合作开发基于Gemini技术的下一代苹果基础模型,用来驱动未来的Apple Intelligence功能,包括那个大家都等了很久的新版Siri。

    每年10亿美元,苹果买了个什么样的Gemini

    2026年1月,苹果和谷歌签了一份多年协议,苹果每年支付大约10亿美元,授权使用1.2万亿参数的定制Gemini模型来支撑苹果自己的基础模型。这个价格不便宜,但苹果看重的是Gemini的多模态能力和谷歌在AI基础设施上的积累。

    隐私规则没变——Apple Intelligence仍然在设备端或者苹果自己的私有云上运行,不会把用户数据送到谷歌的服务器去。苹果在这件事上很谨慎,引入Gemini的能力,但数据流自己掌控,相当于用谷歌的”大脑”,但”记忆”和”执行”还是苹果自己的地盘。

    谷歌云CEO Thomas Kurian在大会上说得很直接:Gemini将驱动新一代Siri,带来更个性化的AI助手体验。预计2026年内上线。

    新版Siri到底变了什么

    WWDC 2026定于6月8日至12日在Apple Park举行,主题演讲在北京时间6月9日凌晨1点。苹果已经罕见地在3月就预告会带来”AI新进展”,外界普遍预期这届WWDC是苹果近年来战略意义最重大的一次。

    新版Siri最大的变化是从”系统附件”变成了一款真正的独立App。以前Siri是依附在系统界面里的,现在用户可以像打开ChatGPT那样,随时随地一键开启Siri聊天界面。支持文字和语音两种交互方式,还能直接上传文件——这个在以前的Siri上是不可想象的。

    对话记录的管理也更像一款正经的AI助手了:你可以选择类似ChatGPT的单次对话视图,也可以切换到类似iMessage的聊天列表视图,方便回溯和延续之前的对话线程。隐私设置里还可以自主决定聊天记录的存活周期——30天、一年或者永久保留,数据生命周期完全由用户自己掌控。

    苹果的AI时间表

    按照目前的节奏:2026年春季的iOS 26.4会先上线Gemini支撑的Siri上下文感知能力;9月iPhone 18发布时,推出支持多轮对话、复杂任务完成的全对话式Siri;6月8日的WWDC上,应该会展示iOS 27里相关的功能预览。

    这个项目曾经延期了整整两年。苹果在AI上的节奏确实比竞争对手慢了一拍,但一旦决定押注,投入的资源也不小。每年10亿美元给谷歌,再加上自己的私有云基础设施,苹果显然是把AI助手这件事当成了下一个十年的核心战场。

    6月9日凌晨1点,库克主题演讲见分晓。


  • Google AI Ultra大降价:从250美元砍到100美元,对标OpenAI

    Google在I/O 2026上悄悄调整了AI Ultra订阅的价格体系——从原来的249.99美元/月,改成100美元/月起。这个降幅,说实话,挺狠的。

    新的Ultra分两档:100美元/月是基础档,200美元/月的高档则包含Project Genie世界模型的访问权限。这个定价策略,明眼人一看就知道是冲着OpenAI去的——OpenAI的Pro订阅也是100美元和200美元两档,完全对标。

    之前249.99美元/月的Ultra,说白了就是”劝退价”——贵到大多数人连试都不想试。Google这一刀砍下去,明显是想把那些在ChatGPT Plus和Gemini之间犹豫的用户拉过来。

    为什么要降价?因为AI订阅这件事快卷不动了

    过去一年,AI公司的订阅定价基本是”高位默契”——大家都不敢轻易降价,怕被市场认为”模型不值钱”。但实际情况是,大多数用户根本用不着每月100美元那么高端的功能。

    Google这一降价,实际上是在重新定义”AI订阅的门槛”。如果100美元/月能用到Gemini 3.5 Flash、AI搜索增强、Gmail AI交互这些功能,那OpenAI的100美元Pro还剩多少差异化优势?


    200美元档的杀手锏:Project Genie

    200美元/月的高档Ultra,核心卖点是Project Genie世界模型的访问权限。这个东西我们在之前的文章里提到过——它能用Google街景的2800亿张图片生成可交互的3D世界,用来训练自动驾驶、机器人,或者做游戏开发。

    这个功能的算力消耗非常大,所以Google把它放在高档订阅里作为差异化卖点,逻辑上说得通。问题就在于——有多少普通用户真的需要生成”可交互的3D世界”?这个项目更像是为开发者、研究机构、企业用户准备的。

    OpenAI怎么跟?

    Google降价之后,压力就转到OpenAI那边了。目前OpenAI的Pro订阅也是100/200美元两档,功能包括GPT-5.5访问、高级语音模式、代码解释器等。如果Google的Ultra在功能上追平甚至超过OpenAI Pro,那OpenAI可能也得考虑调整定价。

    不过,AI订阅这件事最终的竞争点,可能不是价格,而是”用户到底信谁”。ChatGPT的品牌认知度目前还是领先Gemini不少,Google要想靠降价逆转局面,还得在产品体验上真正拉开差距。

    降价是个开始,不是结束。接来下的几个月,AI订阅市场的价格战,估计会越打越激烈。

  • Google推出Pics应用:AI设计工具赛道又多了一个重量级玩家

    Google在今年的I/O大会上扔出了一个不太起眼、但挺有意思的新产品——Pics。这是一个跑在Google Workspace里的AI设计和图像生成应用,你可以直接把它理解成”Google版的Canva”,或者”AI版的Photoshop入门工具”。

    这个说法可能有点过于简化了。Pics真正想做的,是让完全不懂设计的人也能用AI生成像样的视觉内容——社交媒体配图、活动邀请函、营销物料、产品原型图,这些都能通过简单的文字描述搞定。

    为啥要做这个?因为改图太麻烦了

    Google在发布Pics的时候说了一个很接地气的痛点:现在的AI图像生成工具,生成质量已经不错了,但如果你想改图中某一个细节,基本没戏——你得重新写一个提示词,然后祈祷这次AI别把其他部分也改掉。

    Pics的思路是:生成图像只是第一步,关键是让图像里的每个元素都可以单独编辑。你可以用新的提示词改局部,也可以直接点击想改的地方写评论——就像在Google Docs里给同事提修改意见一样。

    这个设计逻辑其实挺聪明的。它把AI图像生成从”抽奖式创作”变成了”可迭代设计”,降低了试错成本。底层驱动编辑功能的是Gemini,而图像生成本身则由Nano Banana 2支持——Google说这个模型在精确文本渲染、现实世界知识和细节输出上表现不错。

    Google Pics AI设计应用界面展示
    Google Pics应用界面,用户可通过文字提示生成并编辑设计

    对手不只是Canva

    Google做这个产品,明面上是冲着Canva去的,毕竟Canva这几年在AI设计赛道跑得挺快。但暗地里,Google可能更在意的是Anthropic最近推出的Claude Design——用Claude直接生成可编辑的设计稿,这个思路跟Pics有点像。

    Google的优势在于生态整合。Pics原生嵌入Google Workspace,你可以在Docs、Slides、Sheets之间无缝协作,设计稿可以直接丢进幻灯片里用。对于已经离不开Google办公套件的企业和学校来说,这个整合黏性挺强的。


    谁能用?什么时候能用?

    目前Pics还在测试阶段,I/O期间有一小批测试者拿到了内测资格。Google说今年夏天会先向AI Ultra订阅用户开放,后续再逐步推给更广泛的用户。

    这个节奏其实透露了Google的心思:AI设计工具不只是”做个好用的产品”那么简单,它是拉动高价AI订阅的重要手段。如果你能让用户觉得”每个月花100美元买Ultra,就为了用Pics做图”,那这个订阅就值了。

    当然,最终Pics能不能打,还得看实际体验。AI生成设计这个赛道,嘴上说说都挺厉害,真要做到”生成即可用”的程度,还有不少坑要填。

  • Google I/O 2026全记录:Gemini 3.5、AI搜索和智能眼镜全部到位

    Google I/O 2026的主题只有一个:把Gemini塞进你数字生活的每一个角落。这场发布会5月19日开幕,整整两天的议程里,几乎没有哪个产品没被AI重新做一遍。

    搜索的”十个蓝色链接”时代正式结束

    搜索率先被改造。新搜索框支持长对话式查询,还能给出AI驱动的查询建议,你甚至可以往搜索框里直接拖文档、图片、视频和Chrome标签页。AI Overviews(AI概览)的月活已经摸到25亿,对话式搜索模式的月活也有10亿。

    信息代理(information agents)会在后台7×24小时帮你跑任务,生成式UI即时生成交互式视觉内容,背后由Gemini Flash 3.5驱动。出版商的日子估计不太好过了——referral流量还会继续掉。

    Gemini Flash 3.5驱动的搜索,已经不再是”搜完给你十个链接”的逻辑,而是直接帮你把事情做完。

    Gmail现在能跟你对话了

    Gmail Live语音交互模式在I/O上亮相,直接说话就能查邮件、提取行程、找学校通知。不用再盯着列表一页页翻。Workspace这边还有个AI图像生成应用叫Google Pics,支持点击图片局部标注修改需求,不用把提示词全部重写一遍,背后跑的是Gemini和Nano Banana 2模型。

    Gemini Spark:常驻后台的AI代理

    最值得一提的是Gemini Spark。这不是你叫它才动一下的聊天机器人,而是一个常驻后台的AI代理,能自动写完邮件、生成学习指南、监控订阅费用,还能对接Workspace、Canva、OpenTable这些第三方应用。

    硬件:XR眼镜合作款全部亮相

    Android XR眼镜的合作款全部亮相——三星、Gentle Monster、Warby Parker的版本都出来了,计划2026年年内发布。谷歌自研的Project Aura眼镜也更新了,计算单元更强,加了指纹解锁,还有新的充电盒设计。

    Wear OS 7也有更新,加入了类似iPhone的”实时更新”功能,手表上能同步快递、赛事比分等动态信息,还能查看AI代理的自动化任务进度。

    定价:Ultra订阅拆分两档

    谷歌把AI订阅Ultra拆成了100美元/月和200美元/月两档,200美元那档包含Project Genie世界模型的访问权限。这个定价明显在对标OpenAI Pro,谷歌这次是真的在全栈铺开,而不只是做个 benchmark 冠军。


  • 谷歌搜索亲手埋掉了十个蓝色链接,25年的老界面彻底变了

    “十个蓝色链接”——这个词在互联网上活了25年,从谷歌1990年代把搜索框推向大众开始,就是这个样子。输入关键词,吐出来一排蓝色超链接,点进去自己找答案。这套逻辑所有人习以为常,直到2026年5月19日谷歌I/O大会,它宣布:这个时代结束了。

    新搜索框是这次改造的核心。谷歌说这是搜索框自诞生以来最大的一次改动。它不再只是一个输入框了——能自动扩展长度来容纳长对话式查询,内置AI驱动的查询建议(不是简单的自动补全,而是理解你的意图来帮你构建更复杂的问题),而且你不需要在搜索前选择”要用AI模式还是普通模式”,系统自己判断。

    Google慕尼黑总部外墙
    谷歌慕尼黑总部(图片来源:TechCrunch)

    信息代理:谷歌提醒的进化版

    2003年谷歌推出过”谷歌提醒”(Google Alerts),关键词有新结果就发邮件通知你。那个服务现在还在,但早就不是人们获取信息的主要方式了。

    这次的新东西叫”信息代理”(information agents),背后的逻辑是一样的——追踪变化、推送通知——但能力强了太多。你可以让一个代理7×24小时在后台跑,用你自定义的参数监控某个行业的股市动向,它不只是发现变化,还能理解变化的意义,汇总之后通知你,附带来源链接和进一步查看的信息。

    谷歌搜索负责人Liz Reid在发布会上举了个例子:你可以设置提醒,用非常具体的参数追踪某个特定行业的股票市场动向,代理会为你制定监控计划,包括它需要访问的工具和数据——比如我们的实时金融数据。然后它会持续追踪这些变化,在条件满足时通知你。

    生成式UI:搜索结果变成交互式网页

    另一个有意思的更新是”生成式UI”——根据用户的问题,即时生成动态布局的交互式视觉内容。比如你问关于黑洞的问题,搜索结果不是一段文字,而是一个可以把概念具象化的交互式可视化组件,你接着问,它实时生成全新的视觉内容。

    这套系统由谷歌DeepMind团队用Gemini Flash 3.5模型开发,今年夏天会免费向所有谷歌用户推出。除此之外,用户还能用自然语言指令在搜索里直接搭建自己的小应用(比如根据日历信息做膳食规划、健身追踪等),这背后是谷歌的Antigravity代理开发平台在支撑。


    出版商要紧张了

    这套改动有一个绕不开的副作用:出版商从谷歌搜索拿到的引流会继续大幅下降。AI概览(AI Overviews)已经让很多媒体网站的referral流量掉了不少,现在搜索结果里直接出交互式内容,用户更没有理由点链接出去了。对一些依赖广告的媒体来说,这可能会是最后一根稻草。

    谷歌这边倒是不担心,AI概览的月活已经突破25亿,去年推出的对话式搜索模式月活也过了10亿。用户用脚投票,答案直接在搜索页上给到,何必再跳一次。

    搜索这件事的本质正在发生变化——从”帮你找信息”变成”帮你把信息消化好直接给你”。这个过程里,用户省了事,但整个内容生态的流量分配逻辑也被重新洗牌了。出版商适应得过来吗?今年夏天见分晓。