标签： Gemini

Google把20年街景数据喂给了Genie，AI现在能模拟你家门口的街道了
你有没有在Google Maps的街景里「逛」过别人的 neighborhood？把那个小黄人往巴黎某条街上一扔，看看酒店是不是在安全的地段。Google现在想把这件事变得不止是「看看」，而是让你真正走进去、改天气、看暴风雪里的同一条街是什么样子。

5月19日的Google I/O大会上，DeepMind宣布把Street View的数据接入Project Genie——Google的通用世界模型。简单来说，Genie可以根据文字或图片提示，生成可交互的游戏式三维环境。现在加上街景，它生成的就是真实世界的地方。

Genie接入街景数据后，可生成纽约街景的交互式模拟（图源：TechCrunch）

为什么这件事有意思

DeepMind研究员Jack Parker-Holder举了一个很具体的例子：一个即将部署到伦敦的机器人，那边常年见不到什么太阳。用Genie，他们可以模拟阳光从维多利亚式房屋上反射下来的罕见场景，这样机器人真的遇到时就不会「懵掉」。

「你可以说，我要去纽约，但不是这个季节，是下雪的时候。我想看看那条街在下雪时是什么样子。」

街景数据积累，Google干了20年。背着摄像头的小车和塞了相机的背包，在全球110个国家和七大洲拍了超过2800亿张图片。这些数据的价值，过去主要体现在地图产品和广告上，现在DeepMind找到了新用法。

不只是玩游戏

Genie 3去年8月开放了研究预览，今年1月向美国的Google AI Ultra订阅用户开放。它的目标应用场景有三个：教育、游戏、机器人训练。接上街景之后，机器人训练这个场景立刻变得很实。

Waymo已经在用Genie的模拟器来训练无人驾驶汽车应对「极罕见事件」——比如龙卷风，或者一头大象突然出现在路上。以前这种场景只能靠人工合成，现在有了街景作为基底，模拟出来的环境至少地理位置是真实的。

和Waymo自己的模拟器相比，Genie的优势在于视角。Waymo的模拟都是从车载摄像头角度看的，而街景数据可以切换到任意视角——机器人视角、行人视角、甚至无人机视角。
- 2800亿张街景图片覆盖全球110个国家
- Waymo已用Genie模拟龙卷风、大象等极端场景
- 支持任意视角切换（车载/行人/机器人/无人机）
- 教育、游戏、机器人训练三大目标场景
还差在哪里

坦率说，现在的效果还没到「以假乱真」的程度。Google团队给我看的样片，包括我以前住过的一个街区的海底版本，识别度很高，但画质还是电子游戏水准，不是照片级真实。

更大的问题是物理规律。现在的Genie模型还没有真正理解因果关系——比如在一个约书亚树国家公园的雪地场景模拟里，跑过去的人直接穿过了仙人掌和灌木丛。物理规则不是硬编码进去的，模型是通过被动观察自己「悟」出来的，这个过程还需要时间。

「这类模型在准确度和质量上，可能比视频生成落后6到12个月。但我认为这是可以解决的。」——Jack Parker-Holder

对比一下，Google自己的图像生成器Nano Banana已经能在信息图里生成完美的文字，视频生成器Veo也理解了纸船会跟着水流漂、烟会在空气中散开这些物理常识。Genie要追上这个水平，还得再跑一阵。

目前，Street View in Genie已经向部分美国Ultra用户开放，接下来几周会逐步扩展到全球Ultra用户。DeepMind的产品经理Diego Rivas提醒说，这还是一个实验性的东西，准确度方面还有很多要改进的地方。

但方向是清晰的。Google Maps的前总监Jonathan Herbert说，他们很早就在想怎么把地图数据用在新形式的AI研究上。Genie接入街景，是这个世界模型第一次真正摸到「真实世界的地基」。接下来会发生什么，值得盯着看。

📎 原文来源：TechCrunch – Google’s Genie world model can now simulate real streets with Street View
2026年5月20日
Google I/O 2026 Day 1直击：Gemini 4.0、Omni多模态、XR眼镜齐亮相

今天Google I/O 2026正式开幕，谷歌一口气发布了多个重磅产品。看完整个发布会，感觉谷歌这次是认真了，不再是以前那种”我们有个很酷的研究项目”的画饼风格，而是实打实地把AI塞进了每一个产品线里。

Gemini 4.0：不止是基准测试

Gemini 4.0这次是真的来了。谷歌没有只拿基准测试分数说事，而是把重点放在了实际应用场景上——Workspace集成、多模态推理、智能体可靠性，这些都是企业用户真正关心的东西。

外界预期Gemini 4.0在多模态推理上会有显著提升，如果它能接近Claude Mythos Preview的94.6% GPQA成绩，那谷歌就真的把今年早些时候丢掉的话语权给抢回来了。

谷歌的优势在于生态。安卓30亿+设备、搜索数据、Workspace 2亿+用户，这不是OpenAI或者Anthropic短时间内能追上的。

Gemini Omni：文本+图像+视频统一管线

这次最让我意外的是Gemini Omni。它不是Veo的升级版，而是一个统一的文本/图像/视频生成管线，可以在对话窗口里直接生成和编辑视频，还会自动配背景音乐。

早期泄露的测试报告显示，Omni在提示词保真度和音频质量上都比Veo 3.1强。如果这套系统正式上线，谷歌就是第一个在消费级场景里提供全模态统一生成能力的厂商。叠加安卓生态的分发优势，这个组合拳确实不好接。

Google I/O 2026 Day 1 发布会现场

Android XR眼镜与Aluminium OS

硬件方面，谷歌和三星、Warby Parker、Gentle Monster、XREAL合作的Android XR眼镜正式亮相。无屏版本重80克以内，售价379-499美元，搭载骁龙AR Gen 3，延迟200ms。这个规格如果能兑现，Meta的Ray-Ban系列可能要感受到压力了。

更值得关注的是Aluminium OS，这个基于安卓开发的系统将替代ChromeOS，首批笔记本由宏碁、华硕、戴尔、惠普、联想生产，2026年秋季上市。谷歌这是在把安卓的势力范围从手机扩展到PC。

Gemini Spark：谷歌版的AI智能体

Gemini Spark是这次发布的一个容易被忽略但很重要的产品。它能自动化跨应用任务——整理收件箱、生成会议简报、追踪新闻事件进展。这和微软的Copilot、Anthropic的Claude Cowork是一个赛道的产品，但谷歌的优势在于它自己的应用生态（Gmail、Calendar、Drive、Docs）。

总体来看，谷歌这次的策略很清晰：不追求单一的基准测试冠军，而是把Gemini铺到所有能铺的地方——手机、眼镜、笔记本、云端、企业应用。这种打法短期内在基准测试上可能不够性感，但长期来看，生态黏性才是最难被颠覆的壁垒。

📎 原文来源：Google I/O 2026 Live – Gemini 4, Omni Video Model, Android XR Glasses, Aluminium OS

2026年5月19日
Google I/O 2026今天开幕：Gemini 4.0、XR眼镜、新系统齐亮相

Google I/O 2026今天开幕，大家期待的Gemini 4.0终于要亮相了。这次谷歌不只是更新模型，而是打算把AI能力直接塞进操作系统、塞进眼镜里，完成从”AI功能叠加”到”AI原生重构”的战略跨越。

Gemini 4.0：上下文窗口拉到1000万tokens

参数规模据说到3-5万亿，上下文窗口突破1000万tokens，是GPT-5.5的25倍，可以一次性加载完整代码库或者整本书籍做深度分析。更重要的是原生多模态，文本、图像、音频、视频统一处理，不用在不同模型之间来回切换。

深度整合谷歌搜索之后，Gemini 4.0的知识可以实时更新、事实实时核查，幻觉率压到3%以内。定价预计每百万输入2.5美元，性价比相当能打。

Android XR眼镜：80克、499美元起

谷歌将推出首款自研Android XR智能眼镜，重量不到80克，售价499美元起，比同类竞品便宜不少。搭载高通骁龙AR Gen 3处理器，内置本地Gemini Nano轻量模型，200毫秒内响应，支持离线导航和实时翻译。

深度适配Gemini 4.0之后，这副眼镜具备实时视觉理解、主动智能推送、多模态交互能力。谷歌还开放了Android XR SDK，现有安卓应用可以快速迁移到XR场景。

Aluminum OS：8年磨一剑，三系统合一

历时8年研发的Aluminum OS将正式落地，把Android、Chrome OS、Fuchsia三个系统揉在一起，手机、电脑、XR设备、智能家居全终端统一适配。

Gemini 4.0拿到系统级接口，可以打通跨应用数据壁垒，实现实时上下文感知与主动智能执行。该系统将首发搭载于10月发布的Pixel 10系列手机，谷歌的AI硬件闭环生态算是真正立起来了。

谷歌这次形成”大模型+硬件+操作系统+开发者生态”的全栈布局，直接对标OpenAI和Anthropic，全球AI竞争进入最激烈阶段。

📎 原文来源：Google I/O 2026倒计时：Gemini 4.0、Android XR眼镜、Aluminium OS 三大重磅将登场

2026年5月19日
Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

美西时间5月19日10点（北京时间明天凌晨2点），Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数，可能会错过真正值得看的东西。

Gemini 4.0：谷歌的”必须赢”时刻

从上次Google I/O到现在，AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场，GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩（GPQA 94.6%），谷歌今年在AI叙事上就又要当配角。

外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键，也是谷歌云如果能把Gemini嵌进企业工作流的机会。

外界预测Gemini 4.0的参数规模可能达到3万亿级别，但参数规模已经不是重点。重点是：它能不能在企业生产环境里稳定运行，而不是在 benchmark 上刷分。

Android XR眼镜：谷歌的硬件”第三次尝试”

谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook，每一个都曾是”下一代计算平台”。这次的Android XR眼镜，谷歌学聪明了：不搞封闭生态，拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

无屏版2026年就能买到，价格区间会很宽——从入门级到高端产品都会有。关键是交互：免提召唤Gemini，用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”，这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

Aluminium OS：ChromeOS的”Android化”

这个泄露了好几个月的”ChromeOS替代系统”，本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示：底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

为什么要做这个？因为Chromebook在教育市场站稳了，但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行，对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。

Google Cloud Agentic Toolkit：企业AI的”最后一公里”

这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺，很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

PwC前几天刚宣布把Claude部署到全球几十万员工，用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”，光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”，不是”分数更高的模型”。

该怎么看这场发布会？

如果你期待谷歌在I/O上”一统AI江湖”，可能会失望。但如果你关心的是：Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案，会在接下来48小时内慢慢浮现。

谷歌有什么？Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局，谷歌手里的牌其实比大多数人想的好。

📎 原文来源：综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道

2026年5月19日
Google I/O 2026明天开幕：Gemini 4.0、XR眼镜、Aluminium OS，谷歌全产品线押注AI

明天（5月19日）上午10点PT，Google I/O 2026将在山景城Shoreline露天剧场拉开帷幕。这是48小时之内就要发生的、本月规模最大的AI盛会。谷歌已经确认主题演讲将涵盖”最新Gemini模型更新”和”智能体编程”——业界普遍解读为Gemini 4.0即将亮相。

Gemini 4.0：直接对标Claude Mythos

谷歌这次把赌注全压在了Gemini 4.0上。根据已泄露的路线图材料和官方暗示，这次升级将在多模态推理、Workspace集成和智能体可靠性三个维度全面进化。如果Gemini 4.0的基准测试成绩能接近甚至追平Claude Mythos Preview的94.6% GPQA得分，谷歌就能在这一周里重新掌握AI叙事的主导权。

有意思的是，谷歌在5月12日的Android Show上已经把平台级更新提前发布了，I/O专门留给模型发布和硬件，这个节奏安排相当聪明——避免自家产品抢流量，把最炸的牌留到主会场。

Android XR眼镜：跟Meta的又一次对决

硬件方面最值得关注的是Android XR眼镜。谷歌已经确认了和三星、Warby Parker、Gentle Monster以及XREAL的硬件合作伙伴关系。一款无显示屏的型号——主打免手持Gemini交互——预计2026年内就能上市。

这明显是冲着Meta的Ray-Ban智能眼镜去的。不同的是，谷歌的方案更彻底：不靠镜片显示，而是把Gemini变成你随时可以对话的”副驾驶”。这个方向到底能不能打，I/O上应该会有更详细的交互演示。

Aluminium OS：ChromeOS的终点，Android桌面的起点

一个相对低调但影响深远的发布是Aluminium OS——谷歌用来替代ChromeOS的Android底层系统。副总裁Sameer Samat已经确认2026年推出。最近泄露的一段16分钟上手视频显示，这个新系统长得像一个放大版Android：底部Dock、虚拟桌面、完整应用窗口，就是没有传统Linux底层的那种笨重感。

如果Aluminium OS真的能在2026年完成ChromeOS的替换，谷歌就拥有了一条从手机（Android）到平板（Android XR）到笔记本（Aluminium）到云（Google Cloud Agentic Toolkit）的完整AI设备链路。苹果还没把这个拼图拼完整。

Google Cloud Agentic Toolkit：企业智能体的定价终于要透明了

对企业用户来说，这次I/O最实在的内容可能是Google Cloud Agentic Toolkit的扩展API和定价细节。之前谷歌在企业智能体这块的商业化一直比较模糊，这次应该会把Workspace集成和Agent部署的企业级收费模式说清楚。

讲真，企业在选智能体平台的时候，定价透明度本身就是竞争力。Anthropic把Claude for Small Business的定价和集成直接做进产品里，谷歌如果还在绕圈子，企业客户会用脚投票的。

战局研判：这一周的胜负手

把时间线拉远一点看，这一周很可能是2026年AI竞争的转折点。Anthropic预计在5月底前关闭$900B估值的融资轮，谷歌在5月19日放大招，Meta的Avocado模型跳票到6月——三家的节奏完全错开了。

如果Gemini 4.0的实测表现真的能打，谷歌就能在Anthropic融资关闭之前把叙事抢回来。如果表现平平，那$900B的估值就会让Anthropic在接下来几个月里持续占据头条。

明天上午10点PT，答案揭晓。

📎 原文来源：AI News Today – May 18, 2026: 13 Biggest Stories

2026年5月18日
Google I/O 2026明天开幕：Gemini 4.0、XR眼镜和Aluminium OS一次看完

明天（5月19日）凌晨1点，Google I/O 2026就要开幕了。这场在加州山景城Shoreline圆形剧场举办的大会，今年把全部火力集中到了AI上——官方直接放话，主题演讲就讲两件事：最新的Gemini模型更新，以及智能体编程（agentic coding）。

有意思的是，Google在5月12日的Android Show上已经把平台类消息全放完了，所以这次I/O完全不给别的新闻留活路，就是要让你盯着模型和硬件看。

Gemini 4.0，这次能打吗？

行业里普遍预计Google会在本届I/O正式推出Gemini 4.0。这个数字命名很有意思——跳过了3.5、3.8这些中间版本，直接上4.0，摆明了是要跟Claude Opus 4.7和GPT-5.5正面刚。

核心看点只有一个：Gemini 4.0在GPQA基准测试上能不能摸到Claude Mythos Preview的94.6%水平。如果能，Google这波就拿下了当周AI行业的叙事主导权。

除了纯性能，这次Gemini的Workspace集成和智能体任务可靠性也是重点。企业用户不在乎你跑分多少，只在乎这东西能不能稳定帮我干活。

Android XR眼镜终于要见了

Google的XR眼镜这次真的要亮相了。已确认的硬件合作伙伴包括三星、Warby Parker、Gentle Monster和XREAL。产品规划里有一款无显示屏版本，靠语音调用Gemini交互，不用抬手不用看屏幕，问就行。

这东西2026年就要上市，比Meta雷声大雨点小的Avocado模型靠谱多了——至少眼镜是实打实的硬件，你能摸到。

Aluminium OS：ChromeOS的接班人

这个比较意外。Google副总裁Sameer Samat已经公开确认2026年推出Aluminium OS，定位是ChromeOS的替代系统，面向消费级笔记本市场。

泄露出来的16分钟上手演示显示，这系统长得像Android的桌面版——底部有Dock栏，支持虚拟桌面，还能通过「Link to iOS」应用跟iPhone互联。对，Google也在打跨设备协同的主意，跟苹果的生态封闭正好反着来。

对企业用户意味着什么

预期会同步发布Google Cloud Agentic Toolkit，包含扩展API、明确定价细则和Workspace深度集成。企业要是想用Google的智能体工具，这次应该能拿到一份完整的路线图和价目表。

对国内做AI应用层的公司来说，Gemini 4.0如果真达到了Claude级别的性能，那模型层的竞争格局又要变。你现在押注的API供应商，半年后可能就不是最优解了。

为什么这场发布会值得熬夜看

2026年5月被认为是AI发展史上最繁忙的两周之一，而Google I/O是这波高潮的正式 opening。如果Gemini 4.0表现达到预期，Anthropic和OpenAI苦心经营大半年的叙事优势可能被直接动摇。

甚至连Meta都推迟了下一代模型Avocado的发布，明说要避免被I/O的新闻热度淹没——你想想，能让竞争对手主动让路的大会，值不值得关注？

📎 原文来源：AI News Today – May 18, 2026: 13 Biggest Stories

2026年5月18日
Google I/O 2026明天开幕：Android 17、Gemini Intelligence和神秘的Googlebook
Google I/O 2026终于要来了。5月19日到20日，就在明天，加州的海岸线旁边又会挤满开发者、记者和那些靠着发布会找灵感的产品经理。今年的主题一点也不神秘——AI无处不在，或者说，Gemini无处不在。

Android 17：给创作者和普通用户都上了一课

这次Android 17一口气带来了9个重大升级，其中最让人眼前一亮的是对创作者群体的重视。Google跟Meta合作深度优化了Instagram在Android上的表现，从拍摄到上传的整个管线都重新调过了，照片和视频的质量保留得比以前好得多。

还有个很实用的功能叫Screen Reactions。你录屏的时候，可以直接把自己的人像叠加在画面上，不需要绿幕，也不需要装第三方软件。这个功能今年夏天先给Pixel用户用，之后会推广到其他Android设备。对于做教程视频或者游戏实况的人来说，这算是个小而美的改进。

安全方面也有动作。Live Threat Detection现在会持续在后台监控你装的所有App，看看有没有偷偷转发短信、乱用无障碍权限或者后台窃取敏感数据的行为。Find Hub里那个”标记为丢失”的功能也升级了，以后要锁定设备，除了输PIN码还得过生物识别这一关。就算有人猜出了你的密码，没有你的指纹或脸，手机还是打不开。

银行来电spoofing保护也值得一说。系统会通过你手机里装的银行App验证来电是不是真的来自银行。目前支持的银行有Revolut、Itaú和Nubank，后面还会加更多。这种把系统层和金融App打通做安全验证的思路，确实比单纯靠用户自己辨别诈骗电话要靠谱。

Gemini Intelligence：从助手到自动化套件

如果说去年的Gemini还在追赶ChatGPT，那今年的Gemini Intelligence就是奔着”让你的手机自己干活”去的。这个套件包含了一堆自动化功能，比如Rambler——一个升级版的Gboard语音输入，它会自动把你说话时的”嗯”、”啊”、”那个”之类的filler words过滤掉，转写出来的文字干净得多。

还有个叫Autobrowse的功能，在Chrome里能帮你后台搞定那些需要在多个网站之间跳来跳去的研究任务。比如你要找某个活动最便宜的停车方案，Autobrowse会在后台帮你把多个预订网站都扫一遍，最后给你一个结果。这种”别盯着进度条了，我去帮你弄”的设计哲学，倒是挺符合大家对AI助手的期待的。

不过Gemini Intelligence的硬件门槛不低。想要完整体验，手机得有旗舰级芯片、12GB以上内存，还得支持Gemini Nano v3。首批支持的设备只有三星Galaxy S26系列和谷歌Pixel 10系列。你手里的老旗舰，哪怕是去年的型号，大概率都跑不动。Google这一手”软硬件绑定升级”，看起来颇有几分苹果的味道。

Googlebook：第一款AI原生操作系统？

今年I/O前放出的一个大招是Googlebook。这个被一些人称作”Chromebook精神续作”的新平台，核心是Gemini，很可能就是业界第一款真正意义的AI原生操作系统。硬件合作伙伴已经就位：Acer、ASUS、Dell、HP、Lenovo都会出机器。

有意思的是，Googlebook不止用Intel芯片，Qualcomm和MediaTek也会入场。这意味着续航、性能和端侧AI能力都会有明显的提升空间。至于大家念叨了好几年的Pixelbook续作，这次会不会跟着亮相，目前还没有准信。但有Googlebook这个平台在，Pixelbook回来的可能性倒是比以前大了不少。

还有一些值得盯的细节
- Android XR眼镜的具体形态应该在I/O上会有更多消息。去年只是预览，今年说不定能见到真的可以买到的产品。
- Gemini for Home已经给了早期体验用户，响应准确度和对话自然度都有提升。配套的Google Home Speaker那个带着彩色光环的小东西，估计会在I/O上正式亮相。
- Android Auto的UI改版了，用上了Material 3 Expressive的设计语言，地图也支持全屏模式和3D建筑渲染的”沉浸式导航”。
明天I/O开幕之后，相信还会有更多细节冒出来。Gemini 4.0会不会来？Android XR眼镜能不能真的买到？Googlebook的定价和上市时间是什么？这些问题，过两天应该就有答案了。对于开发者和科技爱好者来说，这届I/O的关注点已经从”又发布了什么新模型”转向了”AI怎么真正落地到日常使用的设备里”——这个转向，本身就很说明问题。

📎 原文来源：Google I/O 2026 Live Blog – Android Central
2026年5月18日
Google I/O 2026明天开幕，Gemini 4.0和XR眼镜值得盯紧

Google I/O 2026定于5月19日至20日开幕，距现在不到24小时。主旨演讲太平洋时间19日上午10点开始，覆盖Google AI、Android、Chrome等核心更新。

这届大会的核心焦点毫无悬念是Gemini。新版本可能定名Gemini 4.0或3.8，速度和智能化程度会超过前代。Gemini现在已经深度嵌入谷歌几乎所有产品，新版本向各产品线的渗透传导方式也值得关注。

AI工具矩阵持续扩张

除了模型升级，谷歌还会展示Veo（AI视频生成）、Lyria（AI音乐创作）、Beam（三维视频会议）等工具的持续迭代成果。Gemini的笔记本功能也会进一步强化——用户可以把特定主题的参考资料集中存储，Gemini基于这个上下文直接对话，不用每次重复提供信息来源。

动态可视化生成功能也在路上，要求Gemini”展示”或”可视化”时，它能在对话界面中直接生成动态交互式模拟。这种能力的落地，意味着Gemini从”回答工具”向”演示工具”的跨越。

Gemini的笔记本功能支持与NotebookLM深度联动，后者可以把笔记本内容生成视频概览、图表等多元输出。两者分工明确：NotebookLM只以用户提供的笔记本为信息来源，Gemini则会在笔记本上下文基础上进一步检索互联网。

Android XR眼镜从概念走向量产

硬件方面，Android XR智能眼镜是重头戏。谷歌在2025年I/O大会上展示过原型，今年应该会从概念走向量产。功能包括抬头显示通知、实时语言翻译、Gemini Live AI交互。外观比初代Google Glass低调很多，但隐私争议估计还是免不了。

当前智能眼镜市场已相对成熟，Meta已经联合Ray-Ban、Oakley等品牌推出合作款。谷歌此时入局，优势在于十余年的技术积累和Android生态的天然协同。参与合作的品牌众多，最终产品价格区间预计将覆盖入门到高端多个层次。

Aluminum OS：Android与ChromeOS的合并尝试

另一个值得关注的是代号”Aluminum OS”的新操作系统，目标是把Android和ChromeOS合并为一，在笔记本电脑上运行完整的Android体验，同时保留完整的Chrome浏览体验。ChromeOS主要依赖网页应用，Aluminum OS将拥有更完整的Android应用生态。

谷歌或许会在本届大会上披露更多合作信息，甚至直接发布产品。自研Pixelbook回归的可能性，同样不能完全排除。

Android 17稳步迭代

Android 17的测试版已经出了四个版本，”应用气泡”功能（把任意应用调出为悬浮窗口）是目前的亮点。正式版预计6月至7月发布，时间节点恰好在下一代Pixel系列手机宣布之前。

明天的大会直播值得盯一下，Gemini新版本和XR硬件的正式亮相应该是确定性最高的两个看点。谷歌在AI领域全力押注的趋势不会改变，这届大会大概率是2026年AI圈最重要的发布会之一。

📎 原文来源：谷歌I/O 2026大会前瞻：AI、新系统与智能眼镜全面解读（澎湃新闻）

2026年5月18日
Google I/O 2026本周开幕，但真正值钱的不是Gemini 4.0
模型版本只是开胃菜

按约3到4个月一轮的节奏算，2月刚发布Gemini 3.1 Pro，这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能，只是概率没那么高。对投资者来说，模型叫什么名字不重要，重要的是Gemini能不能进更多核心服务，比如Gmail、Maps，还有Genie 3、Gemma 4这些周边生态能不能跟上。

Google还可能更新Gemini Health、Android XR智能眼镜，把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口，Gemini就不再是聊天或者生成工具，而是变成操作层——这个定位比模型版本号值钱多了。

过去两年，Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末，Google产品套件订阅用户达到3.5亿。

AI搜索的算盘

搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合，还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到，来自这些新入口的更长、更复杂查询，提供了更多基于意图的数据——这句话直接关系广告价值。

传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图，搜索广告的天花板就会往上走。对广告主来说，问题不在于AI功能是否先进，而在于同样CPA下能不能带来更多转化。

一季度Google查询量创历史新高。2026年4月，Google全球搜索份额90.0%，环比增加10个基点。Chrome全球份额68.0%，环比增加130个基点。这些入口如果继续扩大，AI搜索的商业化基础会更稳。

Gemini模型迭代节奏（图源：网络）

广告变现才是重头戏

如果Google I/O回答”AI能力到哪里”，5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上，覆盖了AI Max、P-Max、Demand Generation等工具。

AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试，计划在9月完全取代Dynamic Search Ads。早期结果显示，AI Max完整功能组合带来14%更多转化；通过更宽的搜索词匹配，在相近CPA下带来7%更多转化。
- AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
- Ads Advisor提供代理式辅助，Smart Bidding Exploration在搜索活动中带来约27%更多转化
- Campaign Total Budgets减少约66%的手动预算调整
代理式购物瞄准交易闭环

Google的购物业务正在从商品发现入口，向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout，以及Google Shopping和Chrome中的代理式购物体验，将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮，而是减少从搜索、比较、选择到结账之间的摩擦。

Google近期把合作伙伴扩展到若干大型电商公司，还有Meta、Microsoft、Stripe，之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来，Google Shopping的商业角色会更重。Chrome在全球68%的份额（美国50%）如果嵌入代理式购物和个性化推荐，Google将在搜索之外获得新的商业入口。

云业务正在改写估值逻辑

Alphabet过去的估值核心是搜索广告，但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元，同比增长63.4%；backlog达到4623亿美元，环比接近翻倍，同比增长400.3%。同期token消耗环比增长60%。

Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元，再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%，升至2026年的19.5%，并在2028年达到30.6%。

利润率同样在改善。Google Cloud 2025年经营利润率23.7%，2026年预计升至33.8%。这意味着云业务不再只是高增长板块，而是开始对Alphabet整体利润率形成支撑。I/O上，Gemini Code Assist、Google AI Studio中的”vibe coding”工具，以及TPU销售策略也值得关注。

📎 原文来源：谷歌I/O大会前瞻：Gemini 4.0要来了？但这不是最重要的
2026年5月17日

标签： Gemini

为什么这件事有意思

不只是玩游戏

还差在哪里

Gemini 4.0：不止是基准测试

Gemini Omni：文本+图像+视频统一管线

Android XR眼镜与Aluminium OS

Gemini Spark：谷歌版的AI智能体

Gemini 4.0：上下文窗口拉到1000万tokens

Android XR眼镜：80克、499美元起

Aluminum OS：8年磨一剑，三系统合一

Google I/O 2026今天开幕，Gemini 4.0要正面硬刚Claude

Gemini 4.0：谷歌的”必须赢”时刻

Android XR眼镜：谷歌的硬件”第三次尝试”

Aluminium OS：ChromeOS的”Android化”

Google Cloud Agentic Toolkit：企业AI的”最后一公里”

该怎么看这场发布会？

Gemini 4.0：直接对标Claude Mythos

Android XR眼镜：跟Meta的又一次对决

Aluminium OS：ChromeOS的终点，Android桌面的起点

Google Cloud Agentic Toolkit：企业智能体的定价终于要透明了

战局研判：这一周的胜负手

Gemini 4.0，这次能打吗？

Android XR眼镜终于要见了

Aluminium OS：ChromeOS的接班人

对企业用户意味着什么

为什么这场发布会值得熬夜看

Android 17：给创作者和普通用户都上了一课

Gemini Intelligence：从助手到自动化套件

Googlebook：第一款AI原生操作系统？

还有一些值得盯的细节

AI工具矩阵持续扩张

Android XR眼镜从概念走向量产

Aluminum OS：Android与ChromeOS的合并尝试

Android 17稳步迭代

模型版本只是开胃菜

AI搜索的算盘

广告变现才是重头戏

代理式购物瞄准交易闭环

云业务正在改写估值逻辑