标签: Gemini

  • Google把20年街景数据喂给了Genie,AI现在能模拟你家门口的街道了

    你有没有在Google Maps的街景里「逛」过别人的 neighborhood?把那个小黄人往巴黎某条街上一扔,看看酒店是不是在安全的地段。Google现在想把这件事变得不止是「看看」,而是让你真正走进去、改天气、看暴风雪里的同一条街是什么样子。

    5月19日的Google I/O大会上,DeepMind宣布把Street View的数据接入Project Genie——Google的通用世界模型。简单来说,Genie可以根据文字或图片提示,生成可交互的游戏式三维环境。现在加上街景,它生成的就是真实世界的地方。

    Google Genie Street View 模拟展示
    Genie接入街景数据后,可生成纽约街景的交互式模拟(图源:TechCrunch)

    为什么这件事有意思

    DeepMind研究员Jack Parker-Holder举了一个很具体的例子:一个即将部署到伦敦的机器人,那边常年见不到什么太阳。用Genie,他们可以模拟阳光从维多利亚式房屋上反射下来的罕见场景,这样机器人真的遇到时就不会「懵掉」。

    「你可以说,我要去纽约,但不是这个季节,是下雪的时候。我想看看那条街在下雪时是什么样子。」

    街景数据积累,Google干了20年。背着摄像头的小车和塞了相机的背包,在全球110个国家和七大洲拍了超过2800亿张图片。这些数据的价值,过去主要体现在地图产品和广告上,现在DeepMind找到了新用法。


    不只是玩游戏

    Genie 3去年8月开放了研究预览,今年1月向美国的Google AI Ultra订阅用户开放。它的目标应用场景有三个:教育、游戏、机器人训练。接上街景之后,机器人训练这个场景立刻变得很实。

    Waymo已经在用Genie的模拟器来训练无人驾驶汽车应对「极罕见事件」——比如龙卷风,或者一头大象突然出现在路上。以前这种场景只能靠人工合成,现在有了街景作为基底,模拟出来的环境至少地理位置是真实的。

    和Waymo自己的模拟器相比,Genie的优势在于视角。Waymo的模拟都是从车载摄像头角度看的,而街景数据可以切换到任意视角——机器人视角、行人视角、甚至无人机视角。

    • 2800亿张街景图片覆盖全球110个国家
    • Waymo已用Genie模拟龙卷风、大象等极端场景
    • 支持任意视角切换(车载/行人/机器人/无人机)
    • 教育、游戏、机器人训练三大目标场景

    还差在哪里

    坦率说,现在的效果还没到「以假乱真」的程度。Google团队给我看的样片,包括我以前住过的一个街区的海底版本,识别度很高,但画质还是电子游戏水准,不是照片级真实。

    更大的问题是物理规律。现在的Genie模型还没有真正理解因果关系——比如在一个约书亚树国家公园的雪地场景模拟里,跑过去的人直接穿过了仙人掌和灌木丛。物理规则不是硬编码进去的,模型是通过被动观察自己「悟」出来的,这个过程还需要时间。

    「这类模型在准确度和质量上,可能比视频生成落后6到12个月。但我认为这是可以解决的。」——Jack Parker-Holder

    对比一下,Google自己的图像生成器Nano Banana已经能在信息图里生成完美的文字,视频生成器Veo也理解了纸船会跟着水流漂、烟会在空气中散开这些物理常识。Genie要追上这个水平,还得再跑一阵。

    目前,Street View in Genie已经向部分美国Ultra用户开放,接下来几周会逐步扩展到全球Ultra用户。DeepMind的产品经理Diego Rivas提醒说,这还是一个实验性的东西,准确度方面还有很多要改进的地方。

    但方向是清晰的。Google Maps的前总监Jonathan Herbert说,他们很早就在想怎么把地图数据用在新形式的AI研究上。Genie接入街景,是这个世界模型第一次真正摸到「真实世界的地基」。接下来会发生什么,值得盯着看。

  • Google I/O 2026 Day 1直击:Gemini 4.0、Omni多模态、XR眼镜齐亮相

    今天Google I/O 2026正式开幕,谷歌一口气发布了多个重磅产品。看完整个发布会,感觉谷歌这次是认真了,不再是以前那种”我们有个很酷的研究项目”的画饼风格,而是实打实地把AI塞进了每一个产品线里。

    Gemini 4.0:不止是基准测试

    Gemini 4.0这次是真的来了。谷歌没有只拿基准测试分数说事,而是把重点放在了实际应用场景上——Workspace集成、多模态推理、智能体可靠性,这些都是企业用户真正关心的东西。

    外界预期Gemini 4.0在多模态推理上会有显著提升,如果它能接近Claude Mythos Preview的94.6% GPQA成绩,那谷歌就真的把今年早些时候丢掉的话语权给抢回来了。

    谷歌的优势在于生态。安卓30亿+设备、搜索数据、Workspace 2亿+用户,这不是OpenAI或者Anthropic短时间内能追上的。

    Gemini Omni:文本+图像+视频统一管线

    这次最让我意外的是Gemini Omni。它不是Veo的升级版,而是一个统一的文本/图像/视频生成管线,可以在对话窗口里直接生成和编辑视频,还会自动配背景音乐。

    早期泄露的测试报告显示,Omni在提示词保真度和音频质量上都比Veo 3.1强。如果这套系统正式上线,谷歌就是第一个在消费级场景里提供全模态统一生成能力的厂商。叠加安卓生态的分发优势,这个组合拳确实不好接。

    Google I/O 2026
    Google I/O 2026 Day 1 发布会现场

    Android XR眼镜与Aluminium OS

    硬件方面,谷歌和三星、Warby Parker、Gentle Monster、XREAL合作的Android XR眼镜正式亮相。无屏版本重80克以内,售价379-499美元,搭载骁龙AR Gen 3,延迟200ms。这个规格如果能兑现,Meta的Ray-Ban系列可能要感受到压力了。

    更值得关注的是Aluminium OS,这个基于安卓开发的系统将替代ChromeOS,首批笔记本由宏碁、华硕、戴尔、惠普、联想生产,2026年秋季上市。谷歌这是在把安卓的势力范围从手机扩展到PC。


    Gemini Spark:谷歌版的AI智能体

    Gemini Spark是这次发布的一个容易被忽略但很重要的产品。它能自动化跨应用任务——整理收件箱、生成会议简报、追踪新闻事件进展。这和微软的Copilot、Anthropic的Claude Cowork是一个赛道的产品,但谷歌的优势在于它自己的应用生态(Gmail、Calendar、Drive、Docs)。

    总体来看,谷歌这次的策略很清晰:不追求单一的基准测试冠军,而是把Gemini铺到所有能铺的地方——手机、眼镜、笔记本、云端、企业应用。这种打法短期内在基准测试上可能不够性感,但长期来看,生态黏性才是最难被颠覆的壁垒。

  • Google I/O 2026今天开幕:Gemini 4.0、XR眼镜、新系统齐亮相

    Google I/O 2026今天开幕,大家期待的Gemini 4.0终于要亮相了。这次谷歌不只是更新模型,而是打算把AI能力直接塞进操作系统、塞进眼镜里,完成从”AI功能叠加”到”AI原生重构”的战略跨越。

    Gemini 4.0:上下文窗口拉到1000万tokens

    参数规模据说到3-5万亿,上下文窗口突破1000万tokens,是GPT-5.5的25倍,可以一次性加载完整代码库或者整本书籍做深度分析。更重要的是原生多模态,文本、图像、音频、视频统一处理,不用在不同模型之间来回切换。

    深度整合谷歌搜索之后,Gemini 4.0的知识可以实时更新、事实实时核查,幻觉率压到3%以内。定价预计每百万输入2.5美元,性价比相当能打。


    Android XR眼镜:80克、499美元起

    谷歌将推出首款自研Android XR智能眼镜,重量不到80克,售价499美元起,比同类竞品便宜不少。搭载高通骁龙AR Gen 3处理器,内置本地Gemini Nano轻量模型,200毫秒内响应,支持离线导航和实时翻译。

    深度适配Gemini 4.0之后,这副眼镜具备实时视觉理解、主动智能推送、多模态交互能力。谷歌还开放了Android XR SDK,现有安卓应用可以快速迁移到XR场景。


    Aluminum OS:8年磨一剑,三系统合一

    历时8年研发的Aluminum OS将正式落地,把Android、Chrome OS、Fuchsia三个系统揉在一起,手机、电脑、XR设备、智能家居全终端统一适配。

    Gemini 4.0拿到系统级接口,可以打通跨应用数据壁垒,实现实时上下文感知与主动智能执行。该系统将首发搭载于10月发布的Pixel 10系列手机,谷歌的AI硬件闭环生态算是真正立起来了。

    谷歌这次形成”大模型+硬件+操作系统+开发者生态”的全栈布局,直接对标OpenAI和Anthropic,全球AI竞争进入最激烈阶段。

  • Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude






    Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude

    美西时间5月19日10点(北京时间明天凌晨2点),Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数,可能会错过真正值得看的东西。

    Gemini 4.0:谷歌的”必须赢”时刻

    从上次Google I/O到现在,AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场,GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩(GPQA 94.6%),谷歌今年在AI叙事上就又要当配角。

    外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键,也是谷歌云如果能把Gemini嵌进企业工作流的机会。

    外界预测Gemini 4.0的参数规模可能达到3万亿级别,但参数规模已经不是重点。重点是:它能不能在企业生产环境里稳定运行,而不是在 benchmark 上刷分。

    Android XR眼镜:谷歌的硬件”第三次尝试”

    谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook,每一个都曾是”下一代计算平台”。这次的Android XR眼镜,谷歌学聪明了:不搞封闭生态,拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

    无屏版2026年就能买到,价格区间会很宽——从入门级到高端产品都会有。关键是交互:免提召唤Gemini,用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”,这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

    Aluminium OS:ChromeOS的”Android化”

    这个泄露了好几个月的”ChromeOS替代系统”,本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示:底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

    为什么要做这个?因为Chromebook在教育市场站稳了,但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行,对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。


    Google Cloud Agentic Toolkit:企业AI的”最后一公里”

    这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺,很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

    PwC前几天刚宣布把Claude部署到全球几十万员工,用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”,光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”,不是”分数更高的模型”。

    该怎么看这场发布会?

    如果你期待谷歌在I/O上”一统AI江湖”,可能会失望。但如果你关心的是:Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案,会在接下来48小时内慢慢浮现。

    谷歌有什么?Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局,谷歌手里的牌其实比大多数人想的好。

    📎 原文来源:综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道


  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜、Aluminium OS,谷歌全产品线押注AI

    明天(5月19日)上午10点PT,Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

    Gemini 4.0:直接对标Claude Mythos

    谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示,这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分,谷歌就能在这一周里重新掌握AI叙事的主导权。

    有意思的是,谷歌在5月12日的Android Show上已经把平台级更新提前发布了,I/O专门留给模型发布和硬件,这个节奏安排相当聪明——避免自家产品抢流量,把最炸的牌留到主会场。


    Android XR眼镜:跟Meta的又一次对决

    硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

    这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是,谷歌的方案更彻底:不靠镜片显示,而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打,I/O上应该会有更详细的交互演示。


    Aluminium OS:ChromeOS的终点,Android桌面的起点

    一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示,这个新系统长得像一个放大版Android:底部Dock、虚拟桌面、完整应用窗口,就是没有传统Linux底层的那种笨重感。

    如果Aluminium OS真的能在2026年完成ChromeOS的替换,谷歌就拥有了一条从手机(Android)到平板(Android XR)到笔记本(Aluminium)到云(Google Cloud Agentic Toolkit)的完整AI设备链路。苹果还没把这个拼图拼完整。


    Google Cloud Agentic Toolkit:企业智能体的定价终于要透明了

    对企业用户来说,这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊,这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

    讲真,企业在选智能体平台的时候,定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里,谷歌如果还在绕圈子,企业客户会用脚投票的。


    战局研判:这一周的胜负手

    把时间线拉远一点看,这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮,谷歌在5月19日放大招,Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

    如果Gemini 4.0的实测表现真的能打,谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平,那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

    明天上午10点PT,答案揭晓。

  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜和Aluminium OS一次看完

    明天(5月19日)凌晨1点,Google I/O 2026就要开幕了。这场在加州山景城Shoreline圆形剧场举办的大会,今年把全部火力集中到了AI上——官方直接放话,主题演讲就讲两件事:最新的Gemini模型更新,以及智能体编程(agentic coding)。

    有意思的是,Google在5月12日的Android Show上已经把平台类消息全放完了,所以这次I/O完全不给别的新闻留活路,就是要让你盯着模型和硬件看。

    Gemini 4.0,这次能打吗?

    行业里普遍预计Google会在本届I/O正式推出Gemini 4.0。这个数字命名很有意思——跳过了3.5、3.8这些中间版本,直接上4.0,摆明了是要跟Claude Opus 4.7和GPT-5.5正面刚。

    核心看点只有一个:Gemini 4.0在GPQA基准测试上能不能摸到Claude Mythos Preview的94.6%水平。如果能,Google这波就拿下了当周AI行业的叙事主导权。

    除了纯性能,这次Gemini的Workspace集成和智能体任务可靠性也是重点。企业用户不在乎你跑分多少,只在乎这东西能不能稳定帮我干活。

    Android XR眼镜终于要见了

    Google的XR眼镜这次真的要亮相了。已确认的硬件合作伙伴包括三星、Warby Parker、Gentle Monster和XREAL。产品规划里有一款无显示屏版本,靠语音调用Gemini交互,不用抬手不用看屏幕,问就行。

    这东西2026年就要上市,比Meta雷声大雨点小的Avocado模型靠谱多了——至少眼镜是实打实的硬件,你能摸到。

    Aluminium OS:ChromeOS的接班人

    这个比较意外。Google副总裁Sameer Samat已经公开确认2026年推出Aluminium OS,定位是ChromeOS的替代系统,面向消费级笔记本市场。

    泄露出来的16分钟上手演示显示,这系统长得像Android的桌面版——底部有Dock栏,支持虚拟桌面,还能通过「Link to iOS」应用跟iPhone互联。对,Google也在打跨设备协同的主意,跟苹果的生态封闭正好反着来。

    对企业用户意味着什么

    预期会同步发布Google Cloud Agentic Toolkit,包含扩展API、明确定价细则和Workspace深度集成。企业要是想用Google的智能体工具,这次应该能拿到一份完整的路线图和价目表。

    对国内做AI应用层的公司来说,Gemini 4.0如果真达到了Claude级别的性能,那模型层的竞争格局又要变。你现在押注的API供应商,半年后可能就不是最优解了。


    为什么这场发布会值得熬夜看

    2026年5月被认为是AI发展史上最繁忙的两周之一,而Google I/O是这波高潮的正式 opening。如果Gemini 4.0表现达到预期,Anthropic和OpenAI苦心经营大半年的叙事优势可能被直接动摇。

    甚至连Meta都推迟了下一代模型Avocado的发布,明说要避免被I/O的新闻热度淹没——你想想,能让竞争对手主动让路的大会,值不值得关注?

  • Google I/O 2026明天开幕:Android 17、Gemini Intelligence和神秘的Googlebook

    Google I/O 2026终于要来了。5月19日到20日,就在明天,加州的海岸线旁边又会挤满开发者、记者和那些靠着发布会找灵感的产品经理。今年的主题一点也不神秘——AI无处不在,或者说,Gemini无处不在。

    Android 17:给创作者和普通用户都上了一课

    这次Android 17一口气带来了9个重大升级,其中最让人眼前一亮的是对创作者群体的重视。Google跟Meta合作深度优化了Instagram在Android上的表现,从拍摄到上传的整个管线都重新调过了,照片和视频的质量保留得比以前好得多。

    还有个很实用的功能叫Screen Reactions。你录屏的时候,可以直接把自己的人像叠加在画面上,不需要绿幕,也不需要装第三方软件。这个功能今年夏天先给Pixel用户用,之后会推广到其他Android设备。对于做教程视频或者游戏实况的人来说,这算是个小而美的改进。

    安全方面也有动作。Live Threat Detection现在会持续在后台监控你装的所有App,看看有没有偷偷转发短信、乱用无障碍权限或者后台窃取敏感数据的行为。Find Hub里那个”标记为丢失”的功能也升级了,以后要锁定设备,除了输PIN码还得过生物识别这一关。就算有人猜出了你的密码,没有你的指纹或脸,手机还是打不开。

    银行来电spoofing保护也值得一说。系统会通过你手机里装的银行App验证来电是不是真的来自银行。目前支持的银行有Revolut、Itaú和Nubank,后面还会加更多。这种把系统层和金融App打通做安全验证的思路,确实比单纯靠用户自己辨别诈骗电话要靠谱。

    Gemini Intelligence:从助手到自动化套件

    如果说去年的Gemini还在追赶ChatGPT,那今年的Gemini Intelligence就是奔着”让你的手机自己干活”去的。这个套件包含了一堆自动化功能,比如Rambler——一个升级版的Gboard语音输入,它会自动把你说话时的”嗯”、”啊”、”那个”之类的filler words过滤掉,转写出来的文字干净得多。

    还有个叫Autobrowse的功能,在Chrome里能帮你后台搞定那些需要在多个网站之间跳来跳去的研究任务。比如你要找某个活动最便宜的停车方案,Autobrowse会在后台帮你把多个预订网站都扫一遍,最后给你一个结果。这种”别盯着进度条了,我去帮你弄”的设计哲学,倒是挺符合大家对AI助手的期待的。

    不过Gemini Intelligence的硬件门槛不低。想要完整体验,手机得有旗舰级芯片、12GB以上内存,还得支持Gemini Nano v3。首批支持的设备只有三星Galaxy S26系列和谷歌Pixel 10系列。你手里的老旗舰,哪怕是去年的型号,大概率都跑不动。Google这一手”软硬件绑定升级”,看起来颇有几分苹果的味道。

    Googlebook:第一款AI原生操作系统?

    今年I/O前放出的一个大招是Googlebook。这个被一些人称作”Chromebook精神续作”的新平台,核心是Gemini,很可能就是业界第一款真正意义的AI原生操作系统。硬件合作伙伴已经就位:Acer、ASUS、Dell、HP、Lenovo都会出机器。

    有意思的是,Googlebook不止用Intel芯片,Qualcomm和MediaTek也会入场。这意味着续航、性能和端侧AI能力都会有明显的提升空间。至于大家念叨了好几年的Pixelbook续作,这次会不会跟着亮相,目前还没有准信。但有Googlebook这个平台在,Pixelbook回来的可能性倒是比以前大了不少。

    还有一些值得盯的细节

    • Android XR眼镜的具体形态应该在I/O上会有更多消息。去年只是预览,今年说不定能见到真的可以买到的产品。
    • Gemini for Home已经给了早期体验用户,响应准确度和对话自然度都有提升。配套的Google Home Speaker那个带着彩色光环的小东西,估计会在I/O上正式亮相。
    • Android Auto的UI改版了,用上了Material 3 Expressive的设计语言,地图也支持全屏模式和3D建筑渲染的”沉浸式导航”。

    明天I/O开幕之后,相信还会有更多细节冒出来。Gemini 4.0会不会来?Android XR眼镜能不能真的买到?Googlebook的定价和上市时间是什么?这些问题,过两天应该就有答案了。对于开发者和科技爱好者来说,这届I/O的关注点已经从”又发布了什么新模型”转向了”AI怎么真正落地到日常使用的设备里”——这个转向,本身就很说明问题。

  • Google I/O 2026明天开幕,Gemini 4.0和XR眼镜值得盯紧

    Google I/O 2026定于5月19日至20日开幕,距现在不到24小时。主旨演讲太平洋时间19日上午10点开始,覆盖Google AI、Android、Chrome等核心更新。

    这届大会的核心焦点毫无悬念是Gemini。新版本可能定名Gemini 4.0或3.8,速度和智能化程度会超过前代。Gemini现在已经深度嵌入谷歌几乎所有产品,新版本向各产品线的渗透传导方式也值得关注。

    AI工具矩阵持续扩张

    除了模型升级,谷歌还会展示Veo(AI视频生成)、Lyria(AI音乐创作)、Beam(三维视频会议)等工具的持续迭代成果。Gemini的笔记本功能也会进一步强化——用户可以把特定主题的参考资料集中存储,Gemini基于这个上下文直接对话,不用每次重复提供信息来源。

    动态可视化生成功能也在路上,要求Gemini”展示”或”可视化”时,它能在对话界面中直接生成动态交互式模拟。这种能力的落地,意味着Gemini从”回答工具”向”演示工具”的跨越。

    Gemini的笔记本功能支持与NotebookLM深度联动,后者可以把笔记本内容生成视频概览、图表等多元输出。两者分工明确:NotebookLM只以用户提供的笔记本为信息来源,Gemini则会在笔记本上下文基础上进一步检索互联网。

    Android XR眼镜从概念走向量产

    硬件方面,Android XR智能眼镜是重头戏。谷歌在2025年I/O大会上展示过原型,今年应该会从概念走向量产。功能包括抬头显示通知、实时语言翻译、Gemini Live AI交互。外观比初代Google Glass低调很多,但隐私争议估计还是免不了。

    当前智能眼镜市场已相对成熟,Meta已经联合Ray-Ban、Oakley等品牌推出合作款。谷歌此时入局,优势在于十余年的技术积累和Android生态的天然协同。参与合作的品牌众多,最终产品价格区间预计将覆盖入门到高端多个层次。

    Aluminum OS:Android与ChromeOS的合并尝试

    另一个值得关注的是代号”Aluminum OS”的新操作系统,目标是把Android和ChromeOS合并为一,在笔记本电脑上运行完整的Android体验,同时保留完整的Chrome浏览体验。ChromeOS主要依赖网页应用,Aluminum OS将拥有更完整的Android应用生态。

    谷歌或许会在本届大会上披露更多合作信息,甚至直接发布产品。自研Pixelbook回归的可能性,同样不能完全排除。

    Android 17稳步迭代

    Android 17的测试版已经出了四个版本,”应用气泡”功能(把任意应用调出为悬浮窗口)是目前的亮点。正式版预计6月至7月发布,时间节点恰好在下一代Pixel系列手机宣布之前。


    明天的大会直播值得盯一下,Gemini新版本和XR硬件的正式亮相应该是确定性最高的两个看点。谷歌在AI领域全力押注的趋势不会改变,这届大会大概率是2026年AI圈最重要的发布会之一。

  • Google I/O 2026本周开幕,但真正值钱的不是Gemini 4.0

    模型版本只是开胃菜

    按约3到4个月一轮的节奏算,2月刚发布Gemini 3.1 Pro,这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能,只是概率没那么高。对投资者来说,模型叫什么名字不重要,重要的是Gemini能不能进更多核心服务,比如Gmail、Maps,还有Genie 3、Gemma 4这些周边生态能不能跟上。

    Google还可能更新Gemini Health、Android XR智能眼镜,把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口,Gemini就不再是聊天或者生成工具,而是变成操作层——这个定位比模型版本号值钱多了。

    过去两年,Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末,Google产品套件订阅用户达到3.5亿。

    AI搜索的算盘

    搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合,还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到,来自这些新入口的更长、更复杂查询,提供了更多基于意图的数据——这句话直接关系广告价值。

    传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板就会往上走。对广告主来说,问题不在于AI功能是否先进,而在于同样CPA下能不能带来更多转化。

    一季度Google查询量创历史新高。2026年4月,Google全球搜索份额90.0%,环比增加10个基点。Chrome全球份额68.0%,环比增加130个基点。这些入口如果继续扩大,AI搜索的商业化基础会更稳。

    Gemini发布节奏相关配图
    Gemini模型迭代节奏(图源:网络)

    广告变现才是重头戏

    如果Google I/O回答”AI能力到哪里”,5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上,覆盖了AI Max、P-Max、Demand Generation等工具。

    AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试,计划在9月完全取代Dynamic Search Ads。早期结果显示,AI Max完整功能组合带来14%更多转化;通过更宽的搜索词匹配,在相近CPA下带来7%更多转化。

    • AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
    • Ads Advisor提供代理式辅助,Smart Bidding Exploration在搜索活动中带来约27%更多转化
    • Campaign Total Budgets减少约66%的手动预算调整

    代理式购物瞄准交易闭环

    Google的购物业务正在从商品发现入口,向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout,以及Google Shopping和Chrome中的代理式购物体验,将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮,而是减少从搜索、比较、选择到结账之间的摩擦。

    Google近期把合作伙伴扩展到若干大型电商公司,还有Meta、Microsoft、Stripe,之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来,Google Shopping的商业角色会更重。Chrome在全球68%的份额(美国50%)如果嵌入代理式购物和个性化推荐,Google将在搜索之外获得新的商业入口。

    云业务正在改写估值逻辑

    Alphabet过去的估值核心是搜索广告,但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元,同比增长63.4%;backlog达到4623亿美元,环比接近翻倍,同比增长400.3%。同期token消耗环比增长60%。

    Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元,再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%,升至2026年的19.5%,并在2028年达到30.6%。

    利润率同样在改善。Google Cloud 2025年经营利润率23.7%,2026年预计升至33.8%。这意味着云业务不再只是高增长板块,而是开始对Alphabet整体利润率形成支撑。I/O上,Gemini Code Assist、Google AI Studio中的”vibe coding”工具,以及TPU销售策略也值得关注。