标签: Google

  • Google I/O 2026明天开幕:Gemini 4.0、XR眼镜和Aluminium OS一次看完

    明天(5月19日)凌晨1点,Google I/O 2026就要开幕了。这场在加州山景城Shoreline圆形剧场举办的大会,今年把全部火力集中到了AI上——官方直接放话,主题演讲就讲两件事:最新的Gemini模型更新,以及智能体编程(agentic coding)。

    有意思的是,Google在5月12日的Android Show上已经把平台类消息全放完了,所以这次I/O完全不给别的新闻留活路,就是要让你盯着模型和硬件看。

    Gemini 4.0,这次能打吗?

    行业里普遍预计Google会在本届I/O正式推出Gemini 4.0。这个数字命名很有意思——跳过了3.5、3.8这些中间版本,直接上4.0,摆明了是要跟Claude Opus 4.7和GPT-5.5正面刚。

    核心看点只有一个:Gemini 4.0在GPQA基准测试上能不能摸到Claude Mythos Preview的94.6%水平。如果能,Google这波就拿下了当周AI行业的叙事主导权。

    除了纯性能,这次Gemini的Workspace集成和智能体任务可靠性也是重点。企业用户不在乎你跑分多少,只在乎这东西能不能稳定帮我干活。

    Android XR眼镜终于要见了

    Google的XR眼镜这次真的要亮相了。已确认的硬件合作伙伴包括三星、Warby Parker、Gentle Monster和XREAL。产品规划里有一款无显示屏版本,靠语音调用Gemini交互,不用抬手不用看屏幕,问就行。

    这东西2026年就要上市,比Meta雷声大雨点小的Avocado模型靠谱多了——至少眼镜是实打实的硬件,你能摸到。

    Aluminium OS:ChromeOS的接班人

    这个比较意外。Google副总裁Sameer Samat已经公开确认2026年推出Aluminium OS,定位是ChromeOS的替代系统,面向消费级笔记本市场。

    泄露出来的16分钟上手演示显示,这系统长得像Android的桌面版——底部有Dock栏,支持虚拟桌面,还能通过「Link to iOS」应用跟iPhone互联。对,Google也在打跨设备协同的主意,跟苹果的生态封闭正好反着来。

    对企业用户意味着什么

    预期会同步发布Google Cloud Agentic Toolkit,包含扩展API、明确定价细则和Workspace深度集成。企业要是想用Google的智能体工具,这次应该能拿到一份完整的路线图和价目表。

    对国内做AI应用层的公司来说,Gemini 4.0如果真达到了Claude级别的性能,那模型层的竞争格局又要变。你现在押注的API供应商,半年后可能就不是最优解了。


    为什么这场发布会值得熬夜看

    2026年5月被认为是AI发展史上最繁忙的两周之一,而Google I/O是这波高潮的正式 opening。如果Gemini 4.0表现达到预期,Anthropic和OpenAI苦心经营大半年的叙事优势可能被直接动摇。

    甚至连Meta都推迟了下一代模型Avocado的发布,明说要避免被I/O的新闻热度淹没——你想想,能让竞争对手主动让路的大会,值不值得关注?

  • Google I/O 2026明天开幕:Android 17、Gemini Intelligence和神秘的Googlebook

    Google I/O 2026终于要来了。5月19日到20日,就在明天,加州的海岸线旁边又会挤满开发者、记者和那些靠着发布会找灵感的产品经理。今年的主题一点也不神秘——AI无处不在,或者说,Gemini无处不在。

    Android 17:给创作者和普通用户都上了一课

    这次Android 17一口气带来了9个重大升级,其中最让人眼前一亮的是对创作者群体的重视。Google跟Meta合作深度优化了Instagram在Android上的表现,从拍摄到上传的整个管线都重新调过了,照片和视频的质量保留得比以前好得多。

    还有个很实用的功能叫Screen Reactions。你录屏的时候,可以直接把自己的人像叠加在画面上,不需要绿幕,也不需要装第三方软件。这个功能今年夏天先给Pixel用户用,之后会推广到其他Android设备。对于做教程视频或者游戏实况的人来说,这算是个小而美的改进。

    安全方面也有动作。Live Threat Detection现在会持续在后台监控你装的所有App,看看有没有偷偷转发短信、乱用无障碍权限或者后台窃取敏感数据的行为。Find Hub里那个”标记为丢失”的功能也升级了,以后要锁定设备,除了输PIN码还得过生物识别这一关。就算有人猜出了你的密码,没有你的指纹或脸,手机还是打不开。

    银行来电spoofing保护也值得一说。系统会通过你手机里装的银行App验证来电是不是真的来自银行。目前支持的银行有Revolut、Itaú和Nubank,后面还会加更多。这种把系统层和金融App打通做安全验证的思路,确实比单纯靠用户自己辨别诈骗电话要靠谱。

    Gemini Intelligence:从助手到自动化套件

    如果说去年的Gemini还在追赶ChatGPT,那今年的Gemini Intelligence就是奔着”让你的手机自己干活”去的。这个套件包含了一堆自动化功能,比如Rambler——一个升级版的Gboard语音输入,它会自动把你说话时的”嗯”、”啊”、”那个”之类的filler words过滤掉,转写出来的文字干净得多。

    还有个叫Autobrowse的功能,在Chrome里能帮你后台搞定那些需要在多个网站之间跳来跳去的研究任务。比如你要找某个活动最便宜的停车方案,Autobrowse会在后台帮你把多个预订网站都扫一遍,最后给你一个结果。这种”别盯着进度条了,我去帮你弄”的设计哲学,倒是挺符合大家对AI助手的期待的。

    不过Gemini Intelligence的硬件门槛不低。想要完整体验,手机得有旗舰级芯片、12GB以上内存,还得支持Gemini Nano v3。首批支持的设备只有三星Galaxy S26系列和谷歌Pixel 10系列。你手里的老旗舰,哪怕是去年的型号,大概率都跑不动。Google这一手”软硬件绑定升级”,看起来颇有几分苹果的味道。

    Googlebook:第一款AI原生操作系统?

    今年I/O前放出的一个大招是Googlebook。这个被一些人称作”Chromebook精神续作”的新平台,核心是Gemini,很可能就是业界第一款真正意义的AI原生操作系统。硬件合作伙伴已经就位:Acer、ASUS、Dell、HP、Lenovo都会出机器。

    有意思的是,Googlebook不止用Intel芯片,Qualcomm和MediaTek也会入场。这意味着续航、性能和端侧AI能力都会有明显的提升空间。至于大家念叨了好几年的Pixelbook续作,这次会不会跟着亮相,目前还没有准信。但有Googlebook这个平台在,Pixelbook回来的可能性倒是比以前大了不少。

    还有一些值得盯的细节

    • Android XR眼镜的具体形态应该在I/O上会有更多消息。去年只是预览,今年说不定能见到真的可以买到的产品。
    • Gemini for Home已经给了早期体验用户,响应准确度和对话自然度都有提升。配套的Google Home Speaker那个带着彩色光环的小东西,估计会在I/O上正式亮相。
    • Android Auto的UI改版了,用上了Material 3 Expressive的设计语言,地图也支持全屏模式和3D建筑渲染的”沉浸式导航”。

    明天I/O开幕之后,相信还会有更多细节冒出来。Gemini 4.0会不会来?Android XR眼镜能不能真的买到?Googlebook的定价和上市时间是什么?这些问题,过两天应该就有答案了。对于开发者和科技爱好者来说,这届I/O的关注点已经从”又发布了什么新模型”转向了”AI怎么真正落地到日常使用的设备里”——这个转向,本身就很说明问题。

  • Google I/O 2026明天开幕,Gemini 4.0和XR眼镜值得盯紧

    Google I/O 2026定于5月19日至20日开幕,距现在不到24小时。主旨演讲太平洋时间19日上午10点开始,覆盖Google AI、Android、Chrome等核心更新。

    这届大会的核心焦点毫无悬念是Gemini。新版本可能定名Gemini 4.0或3.8,速度和智能化程度会超过前代。Gemini现在已经深度嵌入谷歌几乎所有产品,新版本向各产品线的渗透传导方式也值得关注。

    AI工具矩阵持续扩张

    除了模型升级,谷歌还会展示Veo(AI视频生成)、Lyria(AI音乐创作)、Beam(三维视频会议)等工具的持续迭代成果。Gemini的笔记本功能也会进一步强化——用户可以把特定主题的参考资料集中存储,Gemini基于这个上下文直接对话,不用每次重复提供信息来源。

    动态可视化生成功能也在路上,要求Gemini”展示”或”可视化”时,它能在对话界面中直接生成动态交互式模拟。这种能力的落地,意味着Gemini从”回答工具”向”演示工具”的跨越。

    Gemini的笔记本功能支持与NotebookLM深度联动,后者可以把笔记本内容生成视频概览、图表等多元输出。两者分工明确:NotebookLM只以用户提供的笔记本为信息来源,Gemini则会在笔记本上下文基础上进一步检索互联网。

    Android XR眼镜从概念走向量产

    硬件方面,Android XR智能眼镜是重头戏。谷歌在2025年I/O大会上展示过原型,今年应该会从概念走向量产。功能包括抬头显示通知、实时语言翻译、Gemini Live AI交互。外观比初代Google Glass低调很多,但隐私争议估计还是免不了。

    当前智能眼镜市场已相对成熟,Meta已经联合Ray-Ban、Oakley等品牌推出合作款。谷歌此时入局,优势在于十余年的技术积累和Android生态的天然协同。参与合作的品牌众多,最终产品价格区间预计将覆盖入门到高端多个层次。

    Aluminum OS:Android与ChromeOS的合并尝试

    另一个值得关注的是代号”Aluminum OS”的新操作系统,目标是把Android和ChromeOS合并为一,在笔记本电脑上运行完整的Android体验,同时保留完整的Chrome浏览体验。ChromeOS主要依赖网页应用,Aluminum OS将拥有更完整的Android应用生态。

    谷歌或许会在本届大会上披露更多合作信息,甚至直接发布产品。自研Pixelbook回归的可能性,同样不能完全排除。

    Android 17稳步迭代

    Android 17的测试版已经出了四个版本,”应用气泡”功能(把任意应用调出为悬浮窗口)是目前的亮点。正式版预计6月至7月发布,时间节点恰好在下一代Pixel系列手机宣布之前。


    明天的大会直播值得盯一下,Gemini新版本和XR硬件的正式亮相应该是确定性最高的两个看点。谷歌在AI领域全力押注的趋势不会改变,这届大会大概率是2026年AI圈最重要的发布会之一。

  • Runway不服硅谷规则:押注世界模型,要和Google正面对决

    Runway这家AI视频生成创业公司,没有典型的硅谷血统。没有斯坦福创始人,没有前Google员工,没有九位数的种子轮让你有资本无视收入。它的三个创始人——两个来自智利,一个来自希腊——在纽约大学Tisch艺术学院相遇,然后在纽约建立了这家公司。

    但Runway也可能是当今最重要的AI公司之一,这取决于你问谁。不是因为它已经构建了什么,而是因为它正在试图构建什么。

    “每个主要AI实验室都在押注语言。Runway押注他们都错了。”

    不同的赌注

    过去几年,AI行业基本在一个前提上运作:智能存在于语言中。OpenAI的ChatGPT和Anthropic的Claude这样的大语言模型反映了这个赌注。

    Runway和其他一些竞争对手正在做一个不同的赌注。它的创始人相信,下一代AI智能不会从文本中构建,而是从视频和世界模型中学习这个世界如何运作,而不仅仅是人类如何描述它。这个区别听起来很学术,但它的影响可不学术。

    Runway联合创始人兼联席CEO Anastasis Germanidis说,直接在来自世界的观察数据上训练模型是AI的下一个前沿。他认为,最先到达那里的公司,不会是那些完善了语言的公司。

    Runway三位创始人
    Runway三位创始人(左起:Cristóbal Valenzuela, Anastasis Germanidis, Alejandro Matamala Ortiz)

    从视频生成到世界模型

    Germanidis告诉TechCrunch:”我们基本上受限于自己对现实的理解。语言模型是在整个互联网上训练的,在留言板、社交媒体、教科书上——提炼现有的人类知识。但要超越这一点,我们需要利用更少偏见的数据。”

    成立于2018年的Runway以其视频生成模型(包括最新的Gen-4.5)和让人们将文本提示转换为可编辑的电影内容的AI工具建立了声誉。

    今天,Runway的技术为电影制作人和广告公司提供生产工作流程,并且该公司已与主要媒体公司如Lionsgate和AMC Networks签署了协议。它的工具甚至被用于像《Everything Everywhere All At Once》这样的电影中。


    商业表现与估值

    Runway现在的估值为53亿美元,并且根据其一位创始人的说法,在2026年第二季度增加了4000万美元的年度经常性收入(ARR)。

    如果Runway关于视频生成是通往世界模型的道路的赌注成功,其结果将从好莱坞影响到药物发现和机器人技术。如果不成功,Runway就有可能被资金远为雄厚的竞争对手——其中Google首当其冲——超越。

    世界模型:科学的数字基础设施

    在过去的六个月里,这家创业公司已经将其计划付诸行动,扩展到视频生成之外,在12月推出了它的第一个世界模型(AI系统可以足够好地模拟环境来预测它们将如何行为),并计划在今年推出另一个。

    Germanidis将世界模型视为科学基础设施。你在单个模型上训练的感觉数据和观察越多,你就越接近宇宙的工作数字孪生——一个你可以比任何实验室都快地运行实验的模型。

    “如果我们能建立一个比人类科学家更好的科学家,我们就能加速我们理解宇宙和解决问题的方式。” —— Anastasis Germanidis

    竞争加剧:不缺对手

    Runway在追求将物理感知的视频模型转化为世界模型方面并不孤单,近期应用案例包括交互式娱乐、游戏和机器人训练。初创公司Luma和World Labs也处于类似的轨迹上,Google也将其Genie世界模型指向同一方向。

    所有人都在追求某种版本的同一件事:解决人类最困难问题的AI。这与Runway的原始产品相去甚远,但这是技术中突现能力和创始人倾向于跟随它引导的结果。

    Runway能否将其视频主导地位带入世界模型还远未确定,竞争也不会等待。Runway是首批开发AI视频生成的公司之一,但世界模型是一场不同的竞赛,有资金雄厚且备受尊敬的竞争对手。Google、前Meta首席科学家Yann LeCun、AI的”教母”Fei-Fei Li,以及越来越多的初创公司都在追逐同一个目标。

    资源和挑战

    AI技能基准公司Workera的CEO兼斯坦福大学讲师Kian Katanforoosh指出,还没有人证明通过世界模型在视频智能和通用推理之间的跳跃,但这并不意味着不可能。他说,如果Runway想将其世界模型赌注变为现实,就需要继续收集资源——其中计算能力首当其冲。

    Runway与CoreWeave和Nvidia有协议,但不愿确认是否有专用的集群访问权限——这是训练前沿模型所需的有保障的大规模计算。

    “没有集群,你要如何建立基础模型?我不认为任何人能做到。” —— Kian Katanforoosh

    Runway迄今为止已筹集了8.6亿美元,包括2月份来自AMD Ventures和Nvidia等战略合作伙伴的3.15亿美元轮融资。根据PitchBook的数据,这与其最直接的竞争对手Luma AI和World Labs大致一致,后两者分别筹集了9亿美元和12.9亿美元。

    但Runway也要面对现任者如OpenAI(根据CEO Sam Altman的说法已筹集约1750亿美元)和科技巨头Google的竞争,其母公司的价值为4.86万亿美元。Google是Runway的最大威胁。该公司的Veo模型直接与Runway的视频生成业务竞争,而其Genie世界模型针对的是Runway正在冲刺的同一长期领域。


    Runway的优势:不按常理出牌

    Katanforoosh并没有把Runway排除在外。他指向AI音频初创公司ElevenLabs,该公司在自己的基准测试上超越了OpenAI和Google,尽管缺乏任一公司的资源和血统。他认为,Runway可以遵循类似的剧本。

    这种比较并没有失去Runway创始人的注意。Valenzuela说,创业公司缺乏湾区的”标准化”给了他们优势。他认为,他们不仅有思想的多样性,而且没有硅谷的关系,他们必须更加精明,缺乏许多同行可以获得的战争基金,这些基金本可以使他们不必在早期生成收入。

    根据Runway首席运营官Michelle Kwon的说法,尽管计算需求随着规模增加,公司并不急于筹集更多资金。

    早期投资者、Compound的管理合伙人Michael Dempsey告诉TechCrunch:”他们的背景让他们能够早早出发,比不更频繁地正确,并建立一种移动得非常快的文化。”

    对Valenzuela来说,这种文化始于他首先如何看待世界。他会把任何空闲时间——作为联席CEO和新父亲,时间不多——用来读书,包括智利诗人Nicanor Parra,他描述为Pablo Neruda的对立面:不那么正式,不那么学术,持有一种认为诗歌属于人民而不是规则的观点。

    “规则只是他们发明的规则。这是我们在Runway做事的一个驱动力。他们说硅谷在这里,初创公司就在这里。为什么?那些只是编造的规则。把它们都擦掉,重新开始。” —— Cristóbal Valenzuela

    📎 原文来源:Runway started by helping filmmakers — now it wants to beat Google at AI(TechCrunch, Rebecca Bellan, 2026-05-15)
  • Google I/O 2026本周开幕,但真正值钱的不是Gemini 4.0

    模型版本只是开胃菜

    按约3到4个月一轮的节奏算,2月刚发布Gemini 3.1 Pro,这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能,只是概率没那么高。对投资者来说,模型叫什么名字不重要,重要的是Gemini能不能进更多核心服务,比如Gmail、Maps,还有Genie 3、Gemma 4这些周边生态能不能跟上。

    Google还可能更新Gemini Health、Android XR智能眼镜,把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口,Gemini就不再是聊天或者生成工具,而是变成操作层——这个定位比模型版本号值钱多了。

    过去两年,Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末,Google产品套件订阅用户达到3.5亿。

    AI搜索的算盘

    搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合,还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到,来自这些新入口的更长、更复杂查询,提供了更多基于意图的数据——这句话直接关系广告价值。

    传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板就会往上走。对广告主来说,问题不在于AI功能是否先进,而在于同样CPA下能不能带来更多转化。

    一季度Google查询量创历史新高。2026年4月,Google全球搜索份额90.0%,环比增加10个基点。Chrome全球份额68.0%,环比增加130个基点。这些入口如果继续扩大,AI搜索的商业化基础会更稳。

    Gemini发布节奏相关配图
    Gemini模型迭代节奏(图源:网络)

    广告变现才是重头戏

    如果Google I/O回答”AI能力到哪里”,5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上,覆盖了AI Max、P-Max、Demand Generation等工具。

    AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试,计划在9月完全取代Dynamic Search Ads。早期结果显示,AI Max完整功能组合带来14%更多转化;通过更宽的搜索词匹配,在相近CPA下带来7%更多转化。

    • AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
    • Ads Advisor提供代理式辅助,Smart Bidding Exploration在搜索活动中带来约27%更多转化
    • Campaign Total Budgets减少约66%的手动预算调整

    代理式购物瞄准交易闭环

    Google的购物业务正在从商品发现入口,向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout,以及Google Shopping和Chrome中的代理式购物体验,将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮,而是减少从搜索、比较、选择到结账之间的摩擦。

    Google近期把合作伙伴扩展到若干大型电商公司,还有Meta、Microsoft、Stripe,之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来,Google Shopping的商业角色会更重。Chrome在全球68%的份额(美国50%)如果嵌入代理式购物和个性化推荐,Google将在搜索之外获得新的商业入口。

    云业务正在改写估值逻辑

    Alphabet过去的估值核心是搜索广告,但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元,同比增长63.4%;backlog达到4623亿美元,环比接近翻倍,同比增长400.3%。同期token消耗环比增长60%。

    Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元,再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%,升至2026年的19.5%,并在2028年达到30.6%。

    利润率同样在改善。Google Cloud 2025年经营利润率23.7%,2026年预计升至33.8%。这意味着云业务不再只是高增长板块,而是开始对Alphabet整体利润率形成支撑。I/O上,Gemini Code Assist、Google AI Studio中的”vibe coding”工具,以及TPU销售策略也值得关注。


  • Runway 这家公司不服:凭什么 AI 的未来只能属于做语言的?

    如果你最近关注 AI 视频生成,应该听过 Runway 这个名字。这家公司做 AI 视频工具起家,现在估值 53 亿美元。但最近他们创始人出来讲了句话,大意是:现在所有主流 AI 实验室都在押注语言模型,我们觉得他们全押错了。

    这话挺狂的,但也有意思。

    Runway 的三位创始人,两个智利人、一个希腊人,在纽约大学 Tisch 艺术学院认识的,2018 年在纽约把公司搞了起来。这跟典型的硅谷创业故事完全不一样——没有斯坦福背景,没有前谷歌员工,种子轮也没有几千万美元让他们先烧着玩。

    他们认为语言不是 AI 的终点

    现在 AI 圈子基本建立在一个前提上:智能藏在语言里。你看 OpenAI 的 ChatGPT、Anthropic 的 Claude,全都是大型语言模型。但 Runway 不这么看。他们的联合创始人兼联席 CEO Anastasis Germanidis 说,语言模型是在整个互联网上训练的——留言板、社交媒体、教科书——说白了就是提炼现有的人类知识。

    “但要超越这一点,我们需要利用偏见更少的数据。”Germanidis 说。Runway 认为,下一代 AI 智能不会建立在文本之上,而是来自视频和世界模型——这些模型学习世界如何运作,而不只是人类如何描述世界。

    这个区别听起来很学术,但影响一点不小。如果 Runway 赌对了,那么 AI 的下一个大突破就不是更会聊天,而是更懂物理世界。

    Runway 创始团队
    Runway 创始团队(来源:TechCrunch)

    从帮人做电影到挑战 Google

    Runway 最早是干嘛的?让每个人都能成为电影制作人。他们在 2023 年 2 月发布了第一个视频生成模型——跟今天的产品比起来那时候的东西简直拿不出手——但这已经足够让他们在好莱坞站稳脚跟。他们的工具被用来做《瞬息全宇宙》这类电影,跟 Lionsgate 和 AMC Networks 都签了协议。

    现在 Runway 估值 53 亿美元,融资总额 8.6 亿美元(今年 2 月刚拿了 3.15 亿美元,AMD Ventures 和 Nvidia 都投了),2026 年第二季度新增了 4000 万美元的年度经常性收入,员工 155 人,办公室分布在纽约、伦敦、旧金山、西雅图、特拉维夫和东京。

    但他们不想只做视频生成。去年 12 月,Runway 发布了第一个世界模型,今年还打算再推一个。世界模型是能够足够好地模拟环境的 AI 系统,可以预测环境将如何行为。短期应用包括互动娱乐、游戏和机器人训练,长期的话——Germanidis 把世界模型视为”科学基础设施”。

    “如果我们能建造一个比人类科学家更好的科学家,我们就能加速我们理解宇宙和解决问题的方式。”这是 Germanidis 的终极目标——用世界模型来加速科学发现,甚至抗衰老研究。

    Google 是最大的威胁

    Runway 的赌注能不能成还远未确定,竞争对手也不会坐着等。Google 是 Runway 最大的威胁——Google 的 Veo 模型直接跟 Runway 的视频生成业务竞争,而 Genie 世界模型则瞄准了 Runway 正在争取的同一长期领域。

    还有其他资金雄厚的对手:Luma AI 融资 9 亿美元,由 AI”教母”李飞飞创立的 World Labs 融资 12.9 亿美元。OpenAI 融资约 1750 亿美元,母公司谷歌市值 4.86 万亿美元。光看钱,Runway 没有任何优势。


    但 Runway 的创始人认为,他们缺乏硅谷”标准配方”这件事反而给了他们优势。联合 CEO Cristóbal Valenzuela 说,他们没有那种湾区的关系网,必须更灵活;没有同龄人获得的那种战争资金,这使他们免于过早产生收入的压力。

    Valenzuela 说:”规则只是他们发明的规则。这就是我们在 Runway 做事的驱动力。他们说硅谷在这里,那就是创业公司该待的地方。为什么?这些只是编造的规则。把它们全部擦掉,重新开始。”

    这话听起来很理想主义,但也不是完全没有道理。AI 音频创业公司 ElevenLabs 就是一个例子——尽管缺乏 OpenAI 和谷歌的资源和人脉,但他们在自己的基准测试上表现优于两者。Runway 也许能走出一条类似的路。

    归根结底,这场赌局还在进行中。Runway 押的是:AI 的下一个大跃迁不会来自更好的语言表达,而是来自对物理世界更深的理解。如果他们对了,Google 和 OpenAI 可能都在朝着错误的方向狂奔。

  • DeepMind英国员工投票组建工会:顶级AI实验室首次,抵制军事AI合同

    最近听到一个挺有意思的消息:Google DeepMind的伦敦员工投票组建工会了,98%的支持率,妥妥的压倒性多数。这可是顶级AI实验室第一次出现工会啊,感觉AI行业要变天了。

    导火索:Google悄悄改了道德准则

    事情要从2025年2月说起。Google的母公司Alphabet悄悄从道德准则里删掉了”不使用AI开发武器和监控”的承诺。一位DeepMind员工匿名爆料说,这个决定让很多人心里一紧——当初加入DeepMind就是冲着”负责任地构建AI造福人类”这个slogan去的,现在方向完全变了。

    “我们觉得这个’任何合法目的’条款太模糊了,基本上等于什么承诺都没做。”——DeepMind员工

    转折点:与五角大楼的机密协议

    今年4月,《纽约时报》曝光Google与美国国防部达成协议,允许其AI用于”任何合法政府目的”。紧接着5月2日,美国国防部确认已与Google、SpaceX、OpenAI、Microsoft等七家AI公司签署机密网络协议。Anthropic被排除在外——据说是因为它拒绝让AI用于自主武器或大规模监控美国公民。

    这下DeepMind的员工彻底坐不住了。他们联名致信Google英国区总经理,要求认可CWU和Unite工会作为员工代表。诉求很明确:终止以色列军方合同、提高AI使用透明度、建立AI自动化裁员保障机制。

    连锁反应:其他实验室也在观望

    CWU科技事务官员John Chadfield透露,已经有其他前沿AI实验室的员工来求助了。Anthropic和OpenAI今年都宣布了在伦敦的大规模扩张计划,如果DeepMind的工会化成功了,这些新员工很可能效仿。

    “其他前沿实验室的人看到DeepMind员工的做法,已经来找我们帮忙了。”——John Chadfield, CWU

    Google方面倒是态度温和,说会”重视与员工的积极对话”,但目前还没正式承认工会。如果双方谈不拢,员工们表示会请求仲裁委员会强制Google认可。


    说实话,这事儿挺有标志意义的。AI行业这几年发展太快,伦理边界一直在被试探。当科研人员开始集体发声、要求公司对AI用途负责,说明行业真的到了一个需要认真思考”AI向善”的临界点。后续怎么发展,咱们持续关注。

    DeepMind伦敦总部
    Google DeepMind伦敦总部 | 图片来源:Getty Images
  • Google I/O 2026 前瞻:Gemini 4.0 千万上下文、Android XR 眼镜来了

    下周的科技圈估计要炸锅了——Google I/O 2026 定在5月19日至20日举办,主 Keynote 太平洋时间5月19日上午10点。这次大会被业内视为 Google 二十年来最关键的一次亮相,核心主题只有一个:全面 AI 反攻

    Gemini 4.0 能不能打?

    毫无疑问,本届 I/O 最重磅的发布是 Gemini 4.0。根据目前泄露的信息,新版上下文窗口将达到惊人的 1000万 token,是上代产品的五倍。速度方面据说也有三倍提升——从每秒35个 token 拉到100个。

    Gemini 4.0 还有一个杀手锏:系统级 Agent 权限。它能直接读取屏幕内容、操控文件、跨 App 自动化,甚至调用硬件传感器。相比之下,GPT-5.5 和 Claude Opus 4.7 只能通过 API 调工具,Gemini 这次拿到的权限级别完全不同。如果这些都能落地,那基本上就是给 AI 配了一把”万能钥匙”。

    Google I/O 2026
    Google I/O 2026 大会将于5月19日开幕

    Android XR 眼镜终于要来了

    Google Glass 2013年那会儿被大家吐槽像”脸上挂了个电脑”,这次新一批 Android XR 智能眼镜外观终于低调多了——没有凸出的显示模块,重量控制在80克以内,走在街上不会有人盯着你看。

    这背后是 Meta 和 Ray-Ban 已经趟过的路,以及三星 Galaxy XR 头显的正式开售。Google 这次入场,时机刚刚好。首批产品预计定价499到799美元,走消费级路线,目标”人手一副”。

    Aluminum OS:Android + ChromeOS 合并

    这是另一个被低估的大动作。Google 正在秘密推进 Aluminum OS,本质上是把 Android 和 ChromeOS 合二为一,再嵌进 XR 生态。也就是说,同一个系统能跑 Android 应用、Chrome 网页应用和 XR 应用,一次开发全平台跑。

    对开发者来说,这省了大量适配工作;对 Google 来说,这是对抗苹果生态闭环的一张牌。AI Agent 需要系统级权限,而 Aluminum OS 正是为了让 Gemini 能扎根到系统最底层而设计的。预计今年Q4在 Pixel 设备上首发,2027年全面推送。


    Gemini 4.0 + Android XR + Aluminum OS,Google 这次押的全是重注。能不能正面硬刚 GPT-5.5,下周见分晓。

  • Google I/O 2026前瞻:这次不拼模型拼变现,Gemini Intelligence要接管你的手机了

    下周一就是Google I/O 2026了。这次的画风跟往年还真不太一样——大家不再一窝蜂猜测”Gemini 4.0到底发不发”,而是把目光盯在了一个更实在的问题上:Google的AI能力,到底能换成多少真金白银?

    Cloud业务成了全场最靓的仔

    先说财务数据,Google Cloud今年Q1交出了200.28亿美元的成绩单,同比暴涨63.4%。积压订单更是夸张,达到4623亿美元,环比接近翻倍,同比暴增400.3%。Token消耗量环比也涨了60%。这几个数字放在一起,给我的感觉就是:AI算力需求这列车,根本刹不住。

    Gemini版本发布时间线
    Gemini版本发布时间线|来源:华尔街见闻

    AI Max要重构广告投放逻辑

    除了模型和云业务,Google Marketing Live也是这次的重头戏。AI Max计划今年9月完全取代Dynamic Search Ads,这个动作对广告主影响巨大。现在AI驱动的广告活动已经占搜索广告支出的30%以上,Smart Bidding Exploration能带来约27%的额外转化,AI Max完整功能更是能提升14%的转化。

    传统上,约20%的查询具有商业属性。如果AI搜索让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板可能上移。

    Android要从”操作系统”变”智能系统”

    Google还提前剧透了Android的新AI功能。Gemini Intelligence是这次的核心品牌,主打三大能力:

    • 应用自动化:系统可以帮你跨应用完成任务,比如从Gmail找到课程大纲,自动跳到购物App加购书籍。目前和DoorDash、Uber合作测试
    • Auto Browse:6月底上线,Gemini会自动解析网页完成多步骤任务,支持实时观看或后台静默运行
    • Create My Widget:用描述性提示词创建自定义小组件,比如”根据天气推荐穿搭”

    说实话,桌面端Auto Browse的体验之前被吐槽挺多的,速度和准确性都不太行。但移动端页面结构更简单,实际体验可能会有所改善。

    搜索份额稳住了,Chrome也涨了

    值得注意的一个信号:Google全球搜索份额4月份是90%,环比还涨了10个基点。Chrome全球份额68%,美国份额50%,也都稳中有升。之前大家担心AI搜索会冲击Google广告基本盘,现在看这个担忧至少目前还不成立。


    5月19日Google I/O、5月21日Google Marketing Live——这两场活动连着来,算是Google今年最密集的”秀肌肉”时间。模型发布固然重要,但市场现在更想看的是:Google能不能把AI能力真正变成收入引擎,而不是停留在demo和PPT层面。

  • AI 把我的电话号码给了陌生人:聊天机器人的隐私噩梦才刚开始

    前阵子有个 Reddit 用户发帖说,他的手机连续一个月被陌生人打爆了——打电话的人都在找律师、产品经理、锁匠。原因很离谱:Google 的 AI 生成内容,把他的真实电话号码当成了这些服务的联系方式。

    说实话我看到这个新闻的时候,第一反应是:这也能搞错?但仔细一想,AI 训练数据里本来就有大量从网上扒下来的个人信息,电话号码泄露只是冰山一角。

    AI聊天机器人泄露用户电话号码
    插画:Sarah Rogers / MIT Technology Review | 图片来源:Getty Images

    不止一个人中招

    MIT Technology Review 这篇报道里提到了好几个案例。三月份,以色列一个软件工程师被陌生人通过 WhatsApp 联系,对方说是要找 PayBox(一款以色列支付应用)的客服。结果一查,是 Google 的 Gemini 给出了他的私人号码。

    更离谱的是,华盛顿大学的一个博士生逗 Gemini 玩,输入了同事的名字,结果 Gemini 直接把同事的手机号码给报出来了。她同事之前在某个技术工作坊的页面上留过号码,估计就这么被模型「记住」了。

    DeleteMe(一家帮用户删除网上个人信息的公司)说,过去七个月里,关于 AI 泄露个人信息的客户咨询量增加了 400%。其中 55% 跟 ChatGPT 有关,20% 跟 Gemini 有关,15% 跟 Claude 有关。

    问题到底出在哪

    老实讲,这事的根源其实不难理解。大语言模型的训练数据是从网上大规模爬取来的,里面难免包含各种个人信息——简历、驾照照片、信用卡信息,之前的研究早就证实过这一点。

    关键是,模型会「记住」训练数据里的东西,而且不一定是出现次数多的才会被记住。也就是说,哪怕你只在某个小众论坛留过一次电话号码,也有可能被模型捕获,然后在某个不知情的情况下被「输出」给完全陌生的人。

    我试着换位思考了一下:假设你某天突然接到一堆陌生电话,只因为某个 AI 把你的号码当成了某家公司的客服热线——这体验肯定糟透了。更麻烦的是,据 MIT TR 的报道,目前好像并没有什么好办法能让 AI 公司把你的个人信息从模型里删掉。

    防护机制也不完美

    AI 公司当然不是说完全没设防。各家都有自己的内容过滤和安全护栏,专门用来防止聊天机器人输出个人身份信息。但问题是,这些护栏并不总是管用。

    报道里有个让人哭笑不得的细节:华盛顿大学的学生测试 ChatGPT 时,ChatGPT 先是说信息不可用,然后话锋一转,建议用「调查式」方法继续——只要提供目标的大概居住区域或者房产共同所有人姓名,它就能「挖」出更多信息。结果学生们照做了,ChatGPT 真的给出了那位教授的家庭住址和购房价格。


    我觉得这件事真正让人担心的,不是某一个电话号码泄露,而是我们已经把这么多个人信息「喂」给了 AI,却基本没有撤回的余地。现有的隐私法规——无论是加州的 CCPA 还是欧盟的 GDPR——在处理「已公开但被爬虫抓取用于训练」这类数据时,其实都处于灰色地带。

    最务实的建议?在个人信息被下一次爬虫抓走之前,尽量把它从公开网站上撤下来。只是这样一来,那些已经进了训练数据集的信息,怕是再也回不来了。