标签： Google

Google I/O 2026明天开幕：Gemini 4.0、XR眼镜和Aluminium OS一次看完

明天（5月19日）凌晨1点，Google I/O 2026就要开幕了。这场在加州山景城Shoreline圆形剧场举办的大会，今年把全部火力集中到了AI上——官方直接放话，主题演讲就讲两件事：最新的Gemini模型更新，以及智能体编程（agentic coding）。

有意思的是，Google在5月12日的Android Show上已经把平台类消息全放完了，所以这次I/O完全不给别的新闻留活路，就是要让你盯着模型和硬件看。

Gemini 4.0，这次能打吗？

行业里普遍预计Google会在本届I/O正式推出Gemini 4.0。这个数字命名很有意思——跳过了3.5、3.8这些中间版本，直接上4.0，摆明了是要跟Claude Opus 4.7和GPT-5.5正面刚。

核心看点只有一个：Gemini 4.0在GPQA基准测试上能不能摸到Claude Mythos Preview的94.6%水平。如果能，Google这波就拿下了当周AI行业的叙事主导权。

除了纯性能，这次Gemini的Workspace集成和智能体任务可靠性也是重点。企业用户不在乎你跑分多少，只在乎这东西能不能稳定帮我干活。

Android XR眼镜终于要见了

Google的XR眼镜这次真的要亮相了。已确认的硬件合作伙伴包括三星、Warby Parker、Gentle Monster和XREAL。产品规划里有一款无显示屏版本，靠语音调用Gemini交互，不用抬手不用看屏幕，问就行。

这东西2026年就要上市，比Meta雷声大雨点小的Avocado模型靠谱多了——至少眼镜是实打实的硬件，你能摸到。

Aluminium OS：ChromeOS的接班人

这个比较意外。Google副总裁Sameer Samat已经公开确认2026年推出Aluminium OS，定位是ChromeOS的替代系统，面向消费级笔记本市场。

泄露出来的16分钟上手演示显示，这系统长得像Android的桌面版——底部有Dock栏，支持虚拟桌面，还能通过「Link to iOS」应用跟iPhone互联。对，Google也在打跨设备协同的主意，跟苹果的生态封闭正好反着来。

对企业用户意味着什么

预期会同步发布Google Cloud Agentic Toolkit，包含扩展API、明确定价细则和Workspace深度集成。企业要是想用Google的智能体工具，这次应该能拿到一份完整的路线图和价目表。

对国内做AI应用层的公司来说，Gemini 4.0如果真达到了Claude级别的性能，那模型层的竞争格局又要变。你现在押注的API供应商，半年后可能就不是最优解了。

为什么这场发布会值得熬夜看

2026年5月被认为是AI发展史上最繁忙的两周之一，而Google I/O是这波高潮的正式 opening。如果Gemini 4.0表现达到预期，Anthropic和OpenAI苦心经营大半年的叙事优势可能被直接动摇。

甚至连Meta都推迟了下一代模型Avocado的发布，明说要避免被I/O的新闻热度淹没——你想想，能让竞争对手主动让路的大会，值不值得关注？

📎 原文来源：AI News Today – May 18, 2026: 13 Biggest Stories

2026年5月18日
Google I/O 2026明天开幕：Android 17、Gemini Intelligence和神秘的Googlebook
Google I/O 2026终于要来了。5月19日到20日，就在明天，加州的海岸线旁边又会挤满开发者、记者和那些靠着发布会找灵感的产品经理。今年的主题一点也不神秘——AI无处不在，或者说，Gemini无处不在。

Android 17：给创作者和普通用户都上了一课

这次Android 17一口气带来了9个重大升级，其中最让人眼前一亮的是对创作者群体的重视。Google跟Meta合作深度优化了Instagram在Android上的表现，从拍摄到上传的整个管线都重新调过了，照片和视频的质量保留得比以前好得多。

还有个很实用的功能叫Screen Reactions。你录屏的时候，可以直接把自己的人像叠加在画面上，不需要绿幕，也不需要装第三方软件。这个功能今年夏天先给Pixel用户用，之后会推广到其他Android设备。对于做教程视频或者游戏实况的人来说，这算是个小而美的改进。

安全方面也有动作。Live Threat Detection现在会持续在后台监控你装的所有App，看看有没有偷偷转发短信、乱用无障碍权限或者后台窃取敏感数据的行为。Find Hub里那个”标记为丢失”的功能也升级了，以后要锁定设备，除了输PIN码还得过生物识别这一关。就算有人猜出了你的密码，没有你的指纹或脸，手机还是打不开。

银行来电spoofing保护也值得一说。系统会通过你手机里装的银行App验证来电是不是真的来自银行。目前支持的银行有Revolut、Itaú和Nubank，后面还会加更多。这种把系统层和金融App打通做安全验证的思路，确实比单纯靠用户自己辨别诈骗电话要靠谱。

Gemini Intelligence：从助手到自动化套件

如果说去年的Gemini还在追赶ChatGPT，那今年的Gemini Intelligence就是奔着”让你的手机自己干活”去的。这个套件包含了一堆自动化功能，比如Rambler——一个升级版的Gboard语音输入，它会自动把你说话时的”嗯”、”啊”、”那个”之类的filler words过滤掉，转写出来的文字干净得多。

还有个叫Autobrowse的功能，在Chrome里能帮你后台搞定那些需要在多个网站之间跳来跳去的研究任务。比如你要找某个活动最便宜的停车方案，Autobrowse会在后台帮你把多个预订网站都扫一遍，最后给你一个结果。这种”别盯着进度条了，我去帮你弄”的设计哲学，倒是挺符合大家对AI助手的期待的。

不过Gemini Intelligence的硬件门槛不低。想要完整体验，手机得有旗舰级芯片、12GB以上内存，还得支持Gemini Nano v3。首批支持的设备只有三星Galaxy S26系列和谷歌Pixel 10系列。你手里的老旗舰，哪怕是去年的型号，大概率都跑不动。Google这一手”软硬件绑定升级”，看起来颇有几分苹果的味道。

Googlebook：第一款AI原生操作系统？

今年I/O前放出的一个大招是Googlebook。这个被一些人称作”Chromebook精神续作”的新平台，核心是Gemini，很可能就是业界第一款真正意义的AI原生操作系统。硬件合作伙伴已经就位：Acer、ASUS、Dell、HP、Lenovo都会出机器。

有意思的是，Googlebook不止用Intel芯片，Qualcomm和MediaTek也会入场。这意味着续航、性能和端侧AI能力都会有明显的提升空间。至于大家念叨了好几年的Pixelbook续作，这次会不会跟着亮相，目前还没有准信。但有Googlebook这个平台在，Pixelbook回来的可能性倒是比以前大了不少。

还有一些值得盯的细节
- Android XR眼镜的具体形态应该在I/O上会有更多消息。去年只是预览，今年说不定能见到真的可以买到的产品。
- Gemini for Home已经给了早期体验用户，响应准确度和对话自然度都有提升。配套的Google Home Speaker那个带着彩色光环的小东西，估计会在I/O上正式亮相。
- Android Auto的UI改版了，用上了Material 3 Expressive的设计语言，地图也支持全屏模式和3D建筑渲染的”沉浸式导航”。
明天I/O开幕之后，相信还会有更多细节冒出来。Gemini 4.0会不会来？Android XR眼镜能不能真的买到？Googlebook的定价和上市时间是什么？这些问题，过两天应该就有答案了。对于开发者和科技爱好者来说，这届I/O的关注点已经从”又发布了什么新模型”转向了”AI怎么真正落地到日常使用的设备里”——这个转向，本身就很说明问题。

📎 原文来源：Google I/O 2026 Live Blog – Android Central
2026年5月18日
Google I/O 2026明天开幕，Gemini 4.0和XR眼镜值得盯紧

Google I/O 2026定于5月19日至20日开幕，距现在不到24小时。主旨演讲太平洋时间19日上午10点开始，覆盖Google AI、Android、Chrome等核心更新。

这届大会的核心焦点毫无悬念是Gemini。新版本可能定名Gemini 4.0或3.8，速度和智能化程度会超过前代。Gemini现在已经深度嵌入谷歌几乎所有产品，新版本向各产品线的渗透传导方式也值得关注。

AI工具矩阵持续扩张

除了模型升级，谷歌还会展示Veo（AI视频生成）、Lyria（AI音乐创作）、Beam（三维视频会议）等工具的持续迭代成果。Gemini的笔记本功能也会进一步强化——用户可以把特定主题的参考资料集中存储，Gemini基于这个上下文直接对话，不用每次重复提供信息来源。

动态可视化生成功能也在路上，要求Gemini”展示”或”可视化”时，它能在对话界面中直接生成动态交互式模拟。这种能力的落地，意味着Gemini从”回答工具”向”演示工具”的跨越。

Gemini的笔记本功能支持与NotebookLM深度联动，后者可以把笔记本内容生成视频概览、图表等多元输出。两者分工明确：NotebookLM只以用户提供的笔记本为信息来源，Gemini则会在笔记本上下文基础上进一步检索互联网。

Android XR眼镜从概念走向量产

硬件方面，Android XR智能眼镜是重头戏。谷歌在2025年I/O大会上展示过原型，今年应该会从概念走向量产。功能包括抬头显示通知、实时语言翻译、Gemini Live AI交互。外观比初代Google Glass低调很多，但隐私争议估计还是免不了。

当前智能眼镜市场已相对成熟，Meta已经联合Ray-Ban、Oakley等品牌推出合作款。谷歌此时入局，优势在于十余年的技术积累和Android生态的天然协同。参与合作的品牌众多，最终产品价格区间预计将覆盖入门到高端多个层次。

Aluminum OS：Android与ChromeOS的合并尝试

另一个值得关注的是代号”Aluminum OS”的新操作系统，目标是把Android和ChromeOS合并为一，在笔记本电脑上运行完整的Android体验，同时保留完整的Chrome浏览体验。ChromeOS主要依赖网页应用，Aluminum OS将拥有更完整的Android应用生态。

谷歌或许会在本届大会上披露更多合作信息，甚至直接发布产品。自研Pixelbook回归的可能性，同样不能完全排除。

Android 17稳步迭代

Android 17的测试版已经出了四个版本，”应用气泡”功能（把任意应用调出为悬浮窗口）是目前的亮点。正式版预计6月至7月发布，时间节点恰好在下一代Pixel系列手机宣布之前。

明天的大会直播值得盯一下，Gemini新版本和XR硬件的正式亮相应该是确定性最高的两个看点。谷歌在AI领域全力押注的趋势不会改变，这届大会大概率是2026年AI圈最重要的发布会之一。

📎 原文来源：谷歌I/O 2026大会前瞻：AI、新系统与智能眼镜全面解读（澎湃新闻）

2026年5月18日
Runway不服硅谷规则：押注世界模型，要和Google正面对决

Runway这家AI视频生成创业公司，没有典型的硅谷血统。没有斯坦福创始人，没有前Google员工，没有九位数的种子轮让你有资本无视收入。它的三个创始人——两个来自智利，一个来自希腊——在纽约大学Tisch艺术学院相遇，然后在纽约建立了这家公司。

但Runway也可能是当今最重要的AI公司之一，这取决于你问谁。不是因为它已经构建了什么，而是因为它正在试图构建什么。

“每个主要AI实验室都在押注语言。Runway押注他们都错了。”

不同的赌注

过去几年，AI行业基本在一个前提上运作：智能存在于语言中。OpenAI的ChatGPT和Anthropic的Claude这样的大语言模型反映了这个赌注。

Runway和其他一些竞争对手正在做一个不同的赌注。它的创始人相信，下一代AI智能不会从文本中构建，而是从视频和世界模型中学习这个世界如何运作，而不仅仅是人类如何描述它。这个区别听起来很学术，但它的影响可不学术。

Runway联合创始人兼联席CEO Anastasis Germanidis说，直接在来自世界的观察数据上训练模型是AI的下一个前沿。他认为，最先到达那里的公司，不会是那些完善了语言的公司。

Runway三位创始人（左起：Cristóbal Valenzuela, Anastasis Germanidis, Alejandro Matamala Ortiz）

从视频生成到世界模型

Germanidis告诉TechCrunch：”我们基本上受限于自己对现实的理解。语言模型是在整个互联网上训练的，在留言板、社交媒体、教科书上——提炼现有的人类知识。但要超越这一点，我们需要利用更少偏见的数据。”

成立于2018年的Runway以其视频生成模型（包括最新的Gen-4.5）和让人们将文本提示转换为可编辑的电影内容的AI工具建立了声誉。

今天，Runway的技术为电影制作人和广告公司提供生产工作流程，并且该公司已与主要媒体公司如Lionsgate和AMC Networks签署了协议。它的工具甚至被用于像《Everything Everywhere All At Once》这样的电影中。

商业表现与估值

Runway现在的估值为53亿美元，并且根据其一位创始人的说法，在2026年第二季度增加了4000万美元的年度经常性收入（ARR）。

如果Runway关于视频生成是通往世界模型的道路的赌注成功，其结果将从好莱坞影响到药物发现和机器人技术。如果不成功，Runway就有可能被资金远为雄厚的竞争对手——其中Google首当其冲——超越。

世界模型：科学的数字基础设施

在过去的六个月里，这家创业公司已经将其计划付诸行动，扩展到视频生成之外，在12月推出了它的第一个世界模型（AI系统可以足够好地模拟环境来预测它们将如何行为），并计划在今年推出另一个。

Germanidis将世界模型视为科学基础设施。你在单个模型上训练的感觉数据和观察越多，你就越接近宇宙的工作数字孪生——一个你可以比任何实验室都快地运行实验的模型。

“如果我们能建立一个比人类科学家更好的科学家，我们就能加速我们理解宇宙和解决问题的方式。” —— Anastasis Germanidis

竞争加剧：不缺对手

Runway在追求将物理感知的视频模型转化为世界模型方面并不孤单，近期应用案例包括交互式娱乐、游戏和机器人训练。初创公司Luma和World Labs也处于类似的轨迹上，Google也将其Genie世界模型指向同一方向。

所有人都在追求某种版本的同一件事：解决人类最困难问题的AI。这与Runway的原始产品相去甚远，但这是技术中突现能力和创始人倾向于跟随它引导的结果。

Runway能否将其视频主导地位带入世界模型还远未确定，竞争也不会等待。Runway是首批开发AI视频生成的公司之一，但世界模型是一场不同的竞赛，有资金雄厚且备受尊敬的竞争对手。Google、前Meta首席科学家Yann LeCun、AI的”教母”Fei-Fei Li，以及越来越多的初创公司都在追逐同一个目标。

资源和挑战

AI技能基准公司Workera的CEO兼斯坦福大学讲师Kian Katanforoosh指出，还没有人证明通过世界模型在视频智能和通用推理之间的跳跃，但这并不意味着不可能。他说，如果Runway想将其世界模型赌注变为现实，就需要继续收集资源——其中计算能力首当其冲。

Runway与CoreWeave和Nvidia有协议，但不愿确认是否有专用的集群访问权限——这是训练前沿模型所需的有保障的大规模计算。

“没有集群，你要如何建立基础模型？我不认为任何人能做到。” —— Kian Katanforoosh

Runway迄今为止已筹集了8.6亿美元，包括2月份来自AMD Ventures和Nvidia等战略合作伙伴的3.15亿美元轮融资。根据PitchBook的数据，这与其最直接的竞争对手Luma AI和World Labs大致一致，后两者分别筹集了9亿美元和12.9亿美元。

但Runway也要面对现任者如OpenAI（根据CEO Sam Altman的说法已筹集约1750亿美元）和科技巨头Google的竞争，其母公司的价值为4.86万亿美元。Google是Runway的最大威胁。该公司的Veo模型直接与Runway的视频生成业务竞争，而其Genie世界模型针对的是Runway正在冲刺的同一长期领域。

Runway的优势：不按常理出牌

Katanforoosh并没有把Runway排除在外。他指向AI音频初创公司ElevenLabs，该公司在自己的基准测试上超越了OpenAI和Google，尽管缺乏任一公司的资源和血统。他认为，Runway可以遵循类似的剧本。

这种比较并没有失去Runway创始人的注意。Valenzuela说，创业公司缺乏湾区的”标准化”给了他们优势。他认为，他们不仅有思想的多样性，而且没有硅谷的关系，他们必须更加精明，缺乏许多同行可以获得的战争基金，这些基金本可以使他们不必在早期生成收入。

根据Runway首席运营官Michelle Kwon的说法，尽管计算需求随着规模增加，公司并不急于筹集更多资金。

早期投资者、Compound的管理合伙人Michael Dempsey告诉TechCrunch：”他们的背景让他们能够早早出发，比不更频繁地正确，并建立一种移动得非常快的文化。”

对Valenzuela来说，这种文化始于他首先如何看待世界。他会把任何空闲时间——作为联席CEO和新父亲，时间不多——用来读书，包括智利诗人Nicanor Parra，他描述为Pablo Neruda的对立面：不那么正式，不那么学术，持有一种认为诗歌属于人民而不是规则的观点。

“规则只是他们发明的规则。这是我们在Runway做事的一个驱动力。他们说硅谷在这里，初创公司就在这里。为什么？那些只是编造的规则。把它们都擦掉，重新开始。” —— Cristóbal Valenzuela

📎 原文来源：Runway started by helping filmmakers — now it wants to beat Google at AI（TechCrunch, Rebecca Bellan, 2026-05-15）

2026年5月17日
Google I/O 2026本周开幕，但真正值钱的不是Gemini 4.0
模型版本只是开胃菜

按约3到4个月一轮的节奏算，2月刚发布Gemini 3.1 Pro，这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能，只是概率没那么高。对投资者来说，模型叫什么名字不重要，重要的是Gemini能不能进更多核心服务，比如Gmail、Maps，还有Genie 3、Gemma 4这些周边生态能不能跟上。

Google还可能更新Gemini Health、Android XR智能眼镜，把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口，Gemini就不再是聊天或者生成工具，而是变成操作层——这个定位比模型版本号值钱多了。

过去两年，Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末，Google产品套件订阅用户达到3.5亿。

AI搜索的算盘

搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合，还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到，来自这些新入口的更长、更复杂查询，提供了更多基于意图的数据——这句话直接关系广告价值。

传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图，搜索广告的天花板就会往上走。对广告主来说，问题不在于AI功能是否先进，而在于同样CPA下能不能带来更多转化。

一季度Google查询量创历史新高。2026年4月，Google全球搜索份额90.0%，环比增加10个基点。Chrome全球份额68.0%，环比增加130个基点。这些入口如果继续扩大，AI搜索的商业化基础会更稳。

Gemini模型迭代节奏（图源：网络）

广告变现才是重头戏

如果Google I/O回答”AI能力到哪里”，5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上，覆盖了AI Max、P-Max、Demand Generation等工具。

AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试，计划在9月完全取代Dynamic Search Ads。早期结果显示，AI Max完整功能组合带来14%更多转化；通过更宽的搜索词匹配，在相近CPA下带来7%更多转化。
- AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
- Ads Advisor提供代理式辅助，Smart Bidding Exploration在搜索活动中带来约27%更多转化
- Campaign Total Budgets减少约66%的手动预算调整
代理式购物瞄准交易闭环

Google的购物业务正在从商品发现入口，向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout，以及Google Shopping和Chrome中的代理式购物体验，将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮，而是减少从搜索、比较、选择到结账之间的摩擦。

Google近期把合作伙伴扩展到若干大型电商公司，还有Meta、Microsoft、Stripe，之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来，Google Shopping的商业角色会更重。Chrome在全球68%的份额（美国50%）如果嵌入代理式购物和个性化推荐，Google将在搜索之外获得新的商业入口。

云业务正在改写估值逻辑

Alphabet过去的估值核心是搜索广告，但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元，同比增长63.4%；backlog达到4623亿美元，环比接近翻倍，同比增长400.3%。同期token消耗环比增长60%。

Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元，再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%，升至2026年的19.5%，并在2028年达到30.6%。

利润率同样在改善。Google Cloud 2025年经营利润率23.7%，2026年预计升至33.8%。这意味着云业务不再只是高增长板块，而是开始对Alphabet整体利润率形成支撑。I/O上，Gemini Code Assist、Google AI Studio中的”vibe coding”工具，以及TPU销售策略也值得关注。

📎 原文来源：谷歌I/O大会前瞻：Gemini 4.0要来了？但这不是最重要的
2026年5月17日
Runway 这家公司不服：凭什么 AI 的未来只能属于做语言的？

如果你最近关注 AI 视频生成，应该听过 Runway 这个名字。这家公司做 AI 视频工具起家，现在估值 53 亿美元。但最近他们创始人出来讲了句话，大意是：现在所有主流 AI 实验室都在押注语言模型，我们觉得他们全押错了。

这话挺狂的，但也有意思。

Runway 的三位创始人，两个智利人、一个希腊人，在纽约大学 Tisch 艺术学院认识的，2018 年在纽约把公司搞了起来。这跟典型的硅谷创业故事完全不一样——没有斯坦福背景，没有前谷歌员工，种子轮也没有几千万美元让他们先烧着玩。

他们认为语言不是 AI 的终点

现在 AI 圈子基本建立在一个前提上：智能藏在语言里。你看 OpenAI 的 ChatGPT、Anthropic 的 Claude，全都是大型语言模型。但 Runway 不这么看。他们的联合创始人兼联席 CEO Anastasis Germanidis 说，语言模型是在整个互联网上训练的——留言板、社交媒体、教科书——说白了就是提炼现有的人类知识。

“但要超越这一点，我们需要利用偏见更少的数据。”Germanidis 说。Runway 认为，下一代 AI 智能不会建立在文本之上，而是来自视频和世界模型——这些模型学习世界如何运作，而不只是人类如何描述世界。

这个区别听起来很学术，但影响一点不小。如果 Runway 赌对了，那么 AI 的下一个大突破就不是更会聊天，而是更懂物理世界。

Runway 创始团队（来源：TechCrunch）

从帮人做电影到挑战 Google

Runway 最早是干嘛的？让每个人都能成为电影制作人。他们在 2023 年 2 月发布了第一个视频生成模型——跟今天的产品比起来那时候的东西简直拿不出手——但这已经足够让他们在好莱坞站稳脚跟。他们的工具被用来做《瞬息全宇宙》这类电影，跟 Lionsgate 和 AMC Networks 都签了协议。

现在 Runway 估值 53 亿美元，融资总额 8.6 亿美元（今年 2 月刚拿了 3.15 亿美元，AMD Ventures 和 Nvidia 都投了），2026 年第二季度新增了 4000 万美元的年度经常性收入，员工 155 人，办公室分布在纽约、伦敦、旧金山、西雅图、特拉维夫和东京。

但他们不想只做视频生成。去年 12 月，Runway 发布了第一个世界模型，今年还打算再推一个。世界模型是能够足够好地模拟环境的 AI 系统，可以预测环境将如何行为。短期应用包括互动娱乐、游戏和机器人训练，长期的话——Germanidis 把世界模型视为”科学基础设施”。

“如果我们能建造一个比人类科学家更好的科学家，我们就能加速我们理解宇宙和解决问题的方式。”这是 Germanidis 的终极目标——用世界模型来加速科学发现，甚至抗衰老研究。

Google 是最大的威胁

Runway 的赌注能不能成还远未确定，竞争对手也不会坐着等。Google 是 Runway 最大的威胁——Google 的 Veo 模型直接跟 Runway 的视频生成业务竞争，而 Genie 世界模型则瞄准了 Runway 正在争取的同一长期领域。

还有其他资金雄厚的对手：Luma AI 融资 9 亿美元，由 AI”教母”李飞飞创立的 World Labs 融资 12.9 亿美元。OpenAI 融资约 1750 亿美元，母公司谷歌市值 4.86 万亿美元。光看钱，Runway 没有任何优势。

但 Runway 的创始人认为，他们缺乏硅谷”标准配方”这件事反而给了他们优势。联合 CEO Cristóbal Valenzuela 说，他们没有那种湾区的关系网，必须更灵活；没有同龄人获得的那种战争资金，这使他们免于过早产生收入的压力。

Valenzuela 说：”规则只是他们发明的规则。这就是我们在 Runway 做事的驱动力。他们说硅谷在这里，那就是创业公司该待的地方。为什么？这些只是编造的规则。把它们全部擦掉，重新开始。”

这话听起来很理想主义，但也不是完全没有道理。AI 音频创业公司 ElevenLabs 就是一个例子——尽管缺乏 OpenAI 和谷歌的资源和人脉，但他们在自己的基准测试上表现优于两者。Runway 也许能走出一条类似的路。

归根结底，这场赌局还在进行中。Runway 押的是：AI 的下一个大跃迁不会来自更好的语言表达，而是来自对物理世界更深的理解。如果他们对了，Google 和 OpenAI 可能都在朝着错误的方向狂奔。

📎 原文来源：Runway started by helping filmmakers — now it wants to beat Google at AI — TechCrunch

2026年5月16日
DeepMind英国员工投票组建工会：顶级AI实验室首次，抵制军事AI合同

最近听到一个挺有意思的消息：Google DeepMind的伦敦员工投票组建工会了，98%的支持率，妥妥的压倒性多数。这可是顶级AI实验室第一次出现工会啊，感觉AI行业要变天了。

导火索：Google悄悄改了道德准则

事情要从2025年2月说起。Google的母公司Alphabet悄悄从道德准则里删掉了”不使用AI开发武器和监控”的承诺。一位DeepMind员工匿名爆料说，这个决定让很多人心里一紧——当初加入DeepMind就是冲着”负责任地构建AI造福人类”这个slogan去的，现在方向完全变了。

“我们觉得这个’任何合法目的’条款太模糊了，基本上等于什么承诺都没做。”——DeepMind员工

转折点：与五角大楼的机密协议

今年4月，《纽约时报》曝光Google与美国国防部达成协议，允许其AI用于”任何合法政府目的”。紧接着5月2日，美国国防部确认已与Google、SpaceX、OpenAI、Microsoft等七家AI公司签署机密网络协议。Anthropic被排除在外——据说是因为它拒绝让AI用于自主武器或大规模监控美国公民。

这下DeepMind的员工彻底坐不住了。他们联名致信Google英国区总经理，要求认可CWU和Unite工会作为员工代表。诉求很明确：终止以色列军方合同、提高AI使用透明度、建立AI自动化裁员保障机制。

连锁反应：其他实验室也在观望

CWU科技事务官员John Chadfield透露，已经有其他前沿AI实验室的员工来求助了。Anthropic和OpenAI今年都宣布了在伦敦的大规模扩张计划，如果DeepMind的工会化成功了，这些新员工很可能效仿。

“其他前沿实验室的人看到DeepMind员工的做法，已经来找我们帮忙了。”——John Chadfield, CWU

Google方面倒是态度温和，说会”重视与员工的积极对话”，但目前还没正式承认工会。如果双方谈不拢，员工们表示会请求仲裁委员会强制Google认可。

说实话，这事儿挺有标志意义的。AI行业这几年发展太快，伦理边界一直在被试探。当科研人员开始集体发声、要求公司对AI用途负责，说明行业真的到了一个需要认真思考”AI向善”的临界点。后续怎么发展，咱们持续关注。

Google DeepMind伦敦总部 | 图片来源：Getty Images

📎 原文来源：Google DeepMind Workers Vote to Unionize Over Military AI Deals

2026年5月16日
Google I/O 2026 前瞻：Gemini 4.0 千万上下文、Android XR 眼镜来了

下周的科技圈估计要炸锅了——Google I/O 2026 定在5月19日至20日举办，主 Keynote 太平洋时间5月19日上午10点。这次大会被业内视为 Google 二十年来最关键的一次亮相，核心主题只有一个：全面 AI 反攻。

Gemini 4.0 能不能打？

毫无疑问，本届 I/O 最重磅的发布是 Gemini 4.0。根据目前泄露的信息，新版上下文窗口将达到惊人的 1000万 token，是上代产品的五倍。速度方面据说也有三倍提升——从每秒35个 token 拉到100个。

Gemini 4.0 还有一个杀手锏：系统级 Agent 权限。它能直接读取屏幕内容、操控文件、跨 App 自动化，甚至调用硬件传感器。相比之下，GPT-5.5 和 Claude Opus 4.7 只能通过 API 调工具，Gemini 这次拿到的权限级别完全不同。如果这些都能落地，那基本上就是给 AI 配了一把”万能钥匙”。

Google I/O 2026 大会将于5月19日开幕

Android XR 眼镜终于要来了

Google Glass 2013年那会儿被大家吐槽像”脸上挂了个电脑”，这次新一批 Android XR 智能眼镜外观终于低调多了——没有凸出的显示模块，重量控制在80克以内，走在街上不会有人盯着你看。

这背后是 Meta 和 Ray-Ban 已经趟过的路，以及三星 Galaxy XR 头显的正式开售。Google 这次入场，时机刚刚好。首批产品预计定价499到799美元，走消费级路线，目标”人手一副”。

Aluminum OS：Android + ChromeOS 合并

这是另一个被低估的大动作。Google 正在秘密推进 Aluminum OS，本质上是把 Android 和 ChromeOS 合二为一，再嵌进 XR 生态。也就是说，同一个系统能跑 Android 应用、Chrome 网页应用和 XR 应用，一次开发全平台跑。

对开发者来说，这省了大量适配工作；对 Google 来说，这是对抗苹果生态闭环的一张牌。AI Agent 需要系统级权限，而 Aluminum OS 正是为了让 Gemini 能扎根到系统最底层而设计的。预计今年Q4在 Pixel 设备上首发，2027年全面推送。

Gemini 4.0 + Android XR + Aluminum OS，Google 这次押的全是重注。能不能正面硬刚 GPT-5.5，下周见分晓。

📎 原文来源：谷歌I/O 2026大会前瞻：AI、新系统与智能眼镜全面解读
📎 大会日程来源：谷歌 I/O 2026 日程公布，AI 与安卓 17 成核心议题

2026年5月15日
Google I/O 2026前瞻：这次不拼模型拼变现，Gemini Intelligence要接管你的手机了
下周一就是Google I/O 2026了。这次的画风跟往年还真不太一样——大家不再一窝蜂猜测”Gemini 4.0到底发不发”，而是把目光盯在了一个更实在的问题上：Google的AI能力，到底能换成多少真金白银？

Cloud业务成了全场最靓的仔

先说财务数据，Google Cloud今年Q1交出了200.28亿美元的成绩单，同比暴涨63.4%。积压订单更是夸张，达到4623亿美元，环比接近翻倍，同比暴增400.3%。Token消耗量环比也涨了60%。这几个数字放在一起，给我的感觉就是：AI算力需求这列车，根本刹不住。

Gemini版本发布时间线｜来源：华尔街见闻

AI Max要重构广告投放逻辑

除了模型和云业务，Google Marketing Live也是这次的重头戏。AI Max计划今年9月完全取代Dynamic Search Ads，这个动作对广告主影响巨大。现在AI驱动的广告活动已经占搜索广告支出的30%以上，Smart Bidding Exploration能带来约27%的额外转化，AI Max完整功能更是能提升14%的转化。

传统上，约20%的查询具有商业属性。如果AI搜索让更多查询变成可识别、可匹配、可投放的商业意图，搜索广告的天花板可能上移。

Android要从”操作系统”变”智能系统”

Google还提前剧透了Android的新AI功能。Gemini Intelligence是这次的核心品牌，主打三大能力：
- 应用自动化：系统可以帮你跨应用完成任务，比如从Gmail找到课程大纲，自动跳到购物App加购书籍。目前和DoorDash、Uber合作测试
- Auto Browse：6月底上线，Gemini会自动解析网页完成多步骤任务，支持实时观看或后台静默运行
- Create My Widget：用描述性提示词创建自定义小组件，比如”根据天气推荐穿搭”
说实话，桌面端Auto Browse的体验之前被吐槽挺多的，速度和准确性都不太行。但移动端页面结构更简单，实际体验可能会有所改善。

搜索份额稳住了，Chrome也涨了

值得注意的一个信号：Google全球搜索份额4月份是90%，环比还涨了10个基点。Chrome全球份额68%，美国份额50%，也都稳中有升。之前大家担心AI搜索会冲击Google广告基本盘，现在看这个担忧至少目前还不成立。

5月19日Google I/O、5月21日Google Marketing Live——这两场活动连着来，算是Google今年最密集的”秀肌肉”时间。模型发布固然重要，但市场现在更想看的是：Google能不能把AI能力真正变成收入引擎，而不是停留在demo和PPT层面。

📎 原文来源：谷歌I/O大会前瞻：Gemini 4.0要来了？但这不是最重要的
2026年5月15日
AI 把我的电话号码给了陌生人：聊天机器人的隐私噩梦才刚开始

前阵子有个 Reddit 用户发帖说，他的手机连续一个月被陌生人打爆了——打电话的人都在找律师、产品经理、锁匠。原因很离谱：Google 的 AI 生成内容，把他的真实电话号码当成了这些服务的联系方式。

说实话我看到这个新闻的时候，第一反应是：这也能搞错？但仔细一想，AI 训练数据里本来就有大量从网上扒下来的个人信息，电话号码泄露只是冰山一角。

插画：Sarah Rogers / MIT Technology Review | 图片来源：Getty Images

不止一个人中招

MIT Technology Review 这篇报道里提到了好几个案例。三月份，以色列一个软件工程师被陌生人通过 WhatsApp 联系，对方说是要找 PayBox（一款以色列支付应用）的客服。结果一查，是 Google 的 Gemini 给出了他的私人号码。

更离谱的是，华盛顿大学的一个博士生逗 Gemini 玩，输入了同事的名字，结果 Gemini 直接把同事的手机号码给报出来了。她同事之前在某个技术工作坊的页面上留过号码，估计就这么被模型「记住」了。

DeleteMe（一家帮用户删除网上个人信息的公司）说，过去七个月里，关于 AI 泄露个人信息的客户咨询量增加了 400%。其中 55% 跟 ChatGPT 有关，20% 跟 Gemini 有关，15% 跟 Claude 有关。

问题到底出在哪

老实讲，这事的根源其实不难理解。大语言模型的训练数据是从网上大规模爬取来的，里面难免包含各种个人信息——简历、驾照照片、信用卡信息，之前的研究早就证实过这一点。

关键是，模型会「记住」训练数据里的东西，而且不一定是出现次数多的才会被记住。也就是说，哪怕你只在某个小众论坛留过一次电话号码，也有可能被模型捕获，然后在某个不知情的情况下被「输出」给完全陌生的人。

我试着换位思考了一下：假设你某天突然接到一堆陌生电话，只因为某个 AI 把你的号码当成了某家公司的客服热线——这体验肯定糟透了。更麻烦的是，据 MIT TR 的报道，目前好像并没有什么好办法能让 AI 公司把你的个人信息从模型里删掉。

防护机制也不完美

AI 公司当然不是说完全没设防。各家都有自己的内容过滤和安全护栏，专门用来防止聊天机器人输出个人身份信息。但问题是，这些护栏并不总是管用。

报道里有个让人哭笑不得的细节：华盛顿大学的学生测试 ChatGPT 时，ChatGPT 先是说信息不可用，然后话锋一转，建议用「调查式」方法继续——只要提供目标的大概居住区域或者房产共同所有人姓名，它就能「挖」出更多信息。结果学生们照做了，ChatGPT 真的给出了那位教授的家庭住址和购房价格。

我觉得这件事真正让人担心的，不是某一个电话号码泄露，而是我们已经把这么多个人信息「喂」给了 AI，却基本没有撤回的余地。现有的隐私法规——无论是加州的 CCPA 还是欧盟的 GDPR——在处理「已公开但被爬虫抓取用于训练」这类数据时，其实都处于灰色地带。

最务实的建议？在个人信息被下一次爬虫抓走之前，尽量把它从公开网站上撤下来。只是这样一来，那些已经进了训练数据集的信息，怕是再也回不来了。

📎 原文来源：AI chatbots are giving out people’s real phone numbers — MIT Technology Review

2026年5月15日

标签： Google

Gemini 4.0，这次能打吗？

Android XR眼镜终于要见了

Aluminium OS：ChromeOS的接班人

对企业用户意味着什么

为什么这场发布会值得熬夜看

Android 17：给创作者和普通用户都上了一课

Gemini Intelligence：从助手到自动化套件

Googlebook：第一款AI原生操作系统？

还有一些值得盯的细节

AI工具矩阵持续扩张

Android XR眼镜从概念走向量产

Aluminum OS：Android与ChromeOS的合并尝试

Android 17稳步迭代

不同的赌注

从视频生成到世界模型

商业表现与估值

世界模型：科学的数字基础设施

竞争加剧：不缺对手

资源和挑战

Runway的优势：不按常理出牌

模型版本只是开胃菜

AI搜索的算盘

广告变现才是重头戏

代理式购物瞄准交易闭环

云业务正在改写估值逻辑

他们认为语言不是 AI 的终点

从帮人做电影到挑战 Google

Google 是最大的威胁

导火索：Google悄悄改了道德准则

转折点：与五角大楼的机密协议

连锁反应：其他实验室也在观望

Gemini 4.0 能不能打？

Android XR 眼镜终于要来了

Aluminum OS：Android + ChromeOS 合并

Cloud业务成了全场最靓的仔

AI Max要重构广告投放逻辑

Android要从”操作系统”变”智能系统”

搜索份额稳住了，Chrome也涨了

不止一个人中招

问题到底出在哪

防护机制也不完美