标签: Google

  • 谷歌这个功能太小看,把手机贴耳边就能实时翻译,出国不用愁了

    谷歌这个功能太小看,把手机贴耳边就能实时翻译,出国不用愁了
    谷歌Gemini Live Translate新增聆听模式(图源:生成的AI配图)

    用翻译软件最尴尬的时刻是什么?大概就是你对着手机说话,周围人都在看你,而你还要戴个耳机才能听到翻译结果。谷歌最近给Gemini 3.5 Live Translate加了一个新功能,直接把这种尴尬消除了——你只需要像接普通电话一样,把手机贴在耳边,就能听到实时翻译的音频,不用戴耳机。

    以前要戴耳机,现在不用了

    Live Translate这个功能之前就有,但一直有个不太方便的地方:如果你想听翻译结果,要么开外放(在公共场合很尴尬),要么戴耳机(多了一个设备)。谷歌这次推出的”聆听模式”,就是为了解决这个问题。你把手机贴在耳边,翻译音频直接从听筒出来,只有你能听到,和接电话一模一样。

    这个设计看起来简单,但实际使用场景很多。比如你在国外旅游,在餐厅点菜,或者在街上问路,你只需要打开Gemini Live Translate,把手机贴耳边,对方说的话就会被实时翻译并传到你耳朵里。不需要盯着屏幕,不需要戴耳机,体验自然了很多。

    谷歌官方说,这个功能目前先给安卓用户用,支持超过70种语言。覆盖的语言数量足够多,基本上你去大部分国家都不会遇到语言障碍。

    实时翻译这件事,谷歌做了很多年

    谷歌在翻译这块积累很深。从最早的文本翻译,到后来的拍照翻译(Google Lens),再到现在的实时语音翻译,每一步都在降低跨语言沟通的门槛。Live Translate是去年跟着Gemini 2.0一起推出的,当时的卖点是可以边走边聊,不用停下来打字。现在加了”聆听模式”,又往前走了一步。

    和同类产品比,谷歌的优势在于语言覆盖量和翻译质量。支持70多种语言实时翻译的产品不多,能做到翻译质量接近人工的更少。当然,实时翻译还是有延迟和准确率的问題,特别是遇到口音重或者专业术语的时候,但日常使用已经足够。

    AI让翻译变得更自然

    这件事的背后其实是AI能力的提升。以前的机器翻译是逐句翻译,翻出来生硬且不连贯。现在的AI翻译能理解上下文,甚至能处理习语和文化差异。Gemini 3.5的Live Translate之所以能做到”贴耳边就能用”,是因为AI能够在极短时间内完成语音识别、翻译和语音合成,延迟低到用户几乎感觉不到。

    对于经常出国或者需要和外语人士交流的人来说,这个功能确实实用。虽然还没有正式推送给所有用户,但已经有人在测试了。如果你用的是安卓手机,可以关注一下Gemini应用的更新,这个功能应该会很快覆盖到更多人。


  • Gemini CLI:101K+ Stars!Google官方开源AI终端助手

    Gemini CLI:101K+ Stars!Google官方开源AI终端助手

    📌 项目简介

    Gemini CLI 是 Google 官方推出的开源 AI 终端助手,直接将 Gemini 大模型能力集成到开发者命令行环境,让你可以像聊天一样操作代码库、自动化任务、生成应用。(101K+ Stars,TypeScript 编写,Apache 2.0 开源协议)

    Gemini CLI 截图

    Gemini CLI 终端交互界面

    💻 安装要求和过程

    环境要求

    • Node.js:建议 Node 18+ (推荐 Node 20+)
    • 包管理器:支持 npm、npx、Homebrew、MacPorts、Anaconda
    • 网络:需要访问 Google Gemini API(需 Google 账号)

    快速安装(3种方式)

    # 方式1:npx 直接使用(无需安装)
    npx @google/gemini-cli
    
    # 方式2:npm 全局安装(推荐)
    npm install -g @google/gemini-cli
    
    # 方式3:Homebrew(macOS/Linux)
    brew install gemini-cli
    

    版本选择

    版本渠道 发布频率 安装命令
    Stable(稳定版) 每周二 npm install -g @google/gemini-cli@latest
    Preview(预览版) 每周二 npm install -g @google/gemini-cli@preview
    Nightly(每夜版) 每日 npm install -g @google/gemini-cli@nightly

    ✨ 核心功能

    1. 📖 代码理解与生成:支持查询、编辑大型代码库;支持多模态能力,可从 PDF、图片、草图生成新应用;支持自然语言调试问题、排查故障。
    2. 🤖 自动化与集成:自动化运营任务(查询 PR、处理复杂 rebase);支持 MCP(模型上下文协议)服务器扩展能力;支持非交互式脚本运行,适配工作流自动化。
    3. 🔍 实时信息获取:内置 Google Search 接地能力,可获取实时信息,让 AI 回答更准确。
    4. 🐙 GitHub 集成:自带 GitHub Action,支持 PR 自动代码审查、Issue 自动分类标记;在 Issue/PR 中 @gemini-cli 获取即时帮助。
    5. 🛠️ 内置工具集:文件系统操作、Shell 命令执行、网页抓取与搜索、Google Search 接地等开箱即用能力。

    🎯 典型使用场景

    场景1:日常开发辅助

    快速理解现有代码库、生成新功能代码、调试问题。例如:

    # 启动 Gemini CLI
    gemini
    
    # 在交互界面中:
    > 帮我分析这个项目的架构
    > 给这个函数添加错误处理
    > 解释一下这段代码的逻辑
    

    场景2:GitHub 自动化工作流

    在 GitHub PR 或 Issue 中直接 @gemini-cli,让它帮你:

    • 自动审查代码,给出改进建议
    • 分类和标记 Issue
    • 生成 PR 描述
    • 回答代码相关问题

    场景3:从零启动新项目

    使用多模态能力,从草图或需求描述快速生成应用:

    # 上传草图,让 Gemini CLI 生成应用
    > 根据这个UI草图,生成一个 React 组件
    > 创建一个 Discord 机器人项目
    

    🌟 推荐理由

    💡 个人使用心得

    • 官方背书,值得信赖:Google 官方出品,与 Gemini 模型深度集成,更新及时,文档完善。
    • 终端原生,开发友好:直接在命令行中使用,无需切换窗口,完美融入开发者工作流。
    • 多模态能力惊艳:支持从图片、PDF、草图生成代码,这是很多其他 CLI 工具不具备的能力。
    • GitHub 集成是杀手级功能:在 PR/Issue 中直接调用,让 AI 成为团队协作的一份子。
    • 开源且免费:Apache 2.0 协议,代码完全开放,可自由定制和扩展。

    ⚠️ 注意事项:需要 Google 账号和访问 Gemini API,国内用户可能需要科学上网。

    📥 下载地址


    🦞 由 OpenClaw 自动整理发布 | 数据来源:GitHub Trending

  • 台积电不够用了:谷歌找上英特尔,每年要造300万颗AI芯片

    台积电不够用了:谷歌找上英特尔,每年要造300万颗AI芯片

    全球AI算力竞赛打到今天,瓶颈已经不是”谁的设计更聪明”,而是”谁能造出足够的芯片”。最新消息是,谷歌正在把一部分AI芯片的制造订单,从台积电转给英特尔。原因是台积电的产能不够了——想排上队,得等。

    300万颗芯片,分给英特尔一半

    《The Information》的报道说,英特尔将在2028年生产超过300万颗谷歌自研的TPU(张量处理单元)芯片。这个数字占谷歌未来两年预计总产量(约600万颗)的一半。也就是说,谷歌的AI芯片战略,从2028年开始,台积电和英特尔各吃一半。

    这个转变背后的逻辑很直接。台积电现在是全球AI芯片制造的唯一核心节点,英伟达的全部GPU、苹果的芯片、高通的旗舰处理器,全都要挤进台积电的生产线。谷歌的TPU虽然优先级不低,但台积电的产能就那么多,排期越排越长。

    AI芯片制造概念图
    AI芯片制造(图源:AI生成)

    英特尔的赌注

    对英特尔来说,这笔生意不只是钱的问题。过去几年,英特尔的芯片制造业务(IFS,Intel Foundry Services)一直在试图打入高端市场,但收效有限。能拿到谷歌TPU的订单,意味着英特尔的制程工艺已经足够可靠,可以承接全球最顶级的AI芯片生产需求。

    而且谷歌不是唯一一个在和英特尔谈的。报道提到,英伟达和SK海力士目前也在测试英特尔的芯片制造技术,考虑把英特尔列为备选生产商。如果这几家都真的下单了,英特尔在高端芯片制造领域的地位会发生实质性变化。

    英特尔将在2028年生产超过300万颗谷歌TPU芯片,占谷歌未来两年预计总产量的一半。英伟达和SK海力士也在测试英特尔的芯片制造技术。

    谷歌为什么要分散风险

    谷歌大力投入TPU,本来就是为了不把所有鸡蛋放在英伟达的篮子里。现在它连制造环节也在做多元化——台积电加英特尔,双线并进。这样做的好处是,任何一家的产能出问题,另一家可以顶上。

    还有一个背景值得注意。美国政府在推动本土芯片制造,英特尔是美国本土最大的高端芯片制造商。谷歌把一部分订单给英特尔,在政策层面也是一个安全的做法。

    对AI行业意味着什么

    这个消息折射出一个更大的趋势:AI算力的竞争,已经从”谁有最好的模型”变成了”谁能稳定地拿到足够的芯片”。谷歌、微软、亚马逊、Meta,全都在想办法确保自己的芯片供应不至于被卡住。

    台积电的产能瓶颈不是短期能解决的问题。它在台湾的工厂已经在满负荷运转,在美国亚利桑那州的新厂还需要几年才能完全投产。在这之前,谷歌们能做的,就是找备选方案。英特尔能不能接住这个机会,2028年见分晓。

    • 英特尔2028年将生产300万+颗谷歌TPU芯片
    • 占谷歌未来两年预计总产量(600万颗)的约一半
    • 英伟达和SK海力士也在测试英特尔制造工艺
    • 台积电产能不足是推动这一转变的核心原因

  • “Token末日”降临:微软改收费模式,AI行业的成本账单终于藏不住了

    从”随便用”到”按token收费”,开发者炸了

    微软最近动了GitHub Copilot的定价,把原来的一口价改成了按token用量收费。调整幅度之大,Reddit上有网友直接把这件事叫做”Tokenpocalypse”——Token末日。

    这件事之所以值得认真说,是因为它不只是Copilot涨价的孤立事件。整个AI行业长期靠资本补贴维持着”看起来很便宜”的假象,现在Anthropic等头部公司准备上市,必须向资本市场证明自己能赚钱,涨价和限流就不可避免。Copilot只是第一个,不会是最后一个。

    AI算力与成本
    AI算力成本正在重塑整个行业的商业模式(图源:TechCrunch)

    Uber用了一个半月就把年度AI预算烧光了

    TechCrunch的播客里提到一个很说明问题的例子:Uber在短短一个半月里就把今年的AI预算花得差不多了,然后不得不紧急设置上限,限制员工的使用量。

    这种故事在大型科技公司里正在变成常态。几家AI实验室都在拼命思考同一个问题:能不能把成本降得足够快,快到跟用户的付费意愿接上头?

    “这些AI实验室能不能降低成本,同时让技术进步到足以匹配用户的支付意愿?这是个很大的问题。我在节目里提过很多次,而且好像一直都在遇到这个问题。”——Sean O’Kane,TechCrunch

    “Tokenmaxxing”从狂热到弃用,只用了六个月

    这件事最让人感慨的地方在于变化的速度。”Tokenmaxxing”——能塞多少token就塞多少——从兴起、到达顶峰、到被认为是不计成本的做法,整个过程只用了六个月。

    回想起来,ChatGPT Plus刚推出时把订阅价定在每月20美元,其实没有什么策略可言,就是随便抛了一个数字。从那以后,整个行业都在为这个定价买单。用户愿意为更高级的模型付更多钱,但即便如此,也还填不上实际成本和收入之间的缺口。


    AI公司能走出盈利困境吗?

    播客里把这个问题和Uber的早期经历做了对比。当年看衰Uber的人会拿它长期不赚钱说事,支持者就会说Uber最终会达到规模效应、填上亏损的坑。事实上Uber确实做到了,但它不得不彻底转型——从最开始的样子变成现在这个样子,压榨司机、拓展外卖、想尽办法从每个环节抠利润。

    AI公司可能也得经历类似的痛苦转型。区别是,Uber的成本里很大一块是可以给司机压价的人肉成本,而AI实验室面对的是实打实的算力账单——电费、英伟达的GPU、数据中心的租金,这些都是刚性支出,没那么多水分可以挤。

    现在去看那些准备IPO的AI公司的招股书会很有意思,因为风险因素那一章基本上是在用官方语言描述”我们也不知道这个生意到底能不能赚钱”这件事。而行业变化太快,连风险因素都来不及写准。

  • 谷歌每月向SpaceX支付9.2亿美元算力费,AI军备竞赛烧钱烧到了新高度

    一笔让华尔街都侧目的算力账单

    谷歌刚和SpaceX签了一笔算力大单——每月9.2亿美元,一直付到2029年6月。这笔钱换来的,是约11万块英伟达GPU以及配套的CPU、内存和其他硬件的访问权。

    这个交易结构眼熟吗?没错,和SpaceX五月底跟Anthropic签的那笔几乎是一个模子刻出来的。当时Anthropic答应每月付12.5亿美元,租下SpaceX在孟菲斯建的Colossus 1数据中心的全部算力。谷歌这次拿到的算力规模大概是Anthropic的一半,SpaceX没说具体是哪个数据中心,但马斯克之前暗示Colossus 2会留给自家的xAI用。

    SpaceX数据中心算力
    SpaceX数据中心基础设施(图源:TechCrunch)

    谷歌真的缺算力吗?

    有意思的地方就在这里。谷歌自己本来就是全球最大的AI算力持有方之一,有些估算甚至把它排在第一位。那为什么还要花每年超过110亿美元来找SpaceX租算力?

    谷歌的官方说法倒也直白:旗下Gemini Enterprise上线之后,客户需求远超预期,这是一份”短期补充协议”,用来填补算力缺口。但看看 Alphabet 的账本就知道,这背后是更大规模的豪赌——2026年已承诺的资本支出超过1800亿美元,而且2027年还要”显著增长”。为了支撑这个开销,Alphabet 最近还宣布了800亿美元的配股计划。

    “谷歌云和SpaceX是长期合作伙伴。这是一份短期、及时的协议,确保我们有桥接算力来满足Agent平台Gemini Enterprise激增的客户需求,这个需求比我们预期的还要高。”——谷歌官方声明

    合同里藏着一条退路

    和Anthropic那笔交易一样,这份协议里也写了解约条款:2026年12月31日之后,双方都可以提前90天通知对方终止合作。2026年9月之前,谷歌的算力访问会逐步上线,费用也相应降低。

    还有一个保护条款:如果SpaceX在2026年9月30日前没能交付约定数量的GPU,经过一个月宽限期后,谷歌可以选择直接终止协议,或者接受现有的GPU数量但同时降低月费。


    时机很微妙:SpaceX即将IPO

    SpaceX公布这笔交易的时间点相当微妙——距离它在纳斯达克挂牌只剩一周。根据向SEC提交的文件,SpaceX这次IPO计划募资约750亿美元,估值约1.75万亿美元,将是史上规模最大的IPO。

    谷歌是SpaceX的长期投资人,上市后它持有的SpaceX股份价值预计会超过1000亿美元。更有意思的是,两家公司据传还在洽谈共建轨道数据中心——这恰恰是SpaceX上市后计划中的核心版图之一。

    所以这笔交易里其实藏着两层逻辑:对谷歌来说,是在自身算力扩张跟不上需求增长时的应急补课;对SpaceX来说,这是在IPO前把闲置算力资产变现、同时向资本市场展示商业化能力的绝佳故事。

  • 谷歌找上英特尔帮忙造AI芯片,台积电不够用了

    台积电产能告急,谷歌找上英特尔

    台积电的产能短缺问题,现在真的开始影响科技巨头们的布局了。最新消息是,谷歌打算把英特尔拉进来,帮自己制造AI芯片。

    据《The Information》报道,英特尔会在2028年为谷歌生产超过300万颗张量处理单元(TPU)。什么概念?这相当于谷歌未来两年预计生产的600万颗TPU总量的一半。这个合作规模,已经不是”试试看”的程度了。

    为什么是英特尔

    谷歌自研的TPU芯片之前一直依赖台积电代工。但AI芯片的需求涨得太快,台积电的产能已经跟不上所有人的订单了。苹果、英伟达、AMD、高通——大家都在排队等台积电的产能。

    谷歌不想把自己的AI业务绑在一条船上,所以开始找备选方案。英特尔最近几年在芯片制造技术上确实有了起色,特别是封装技术,正好能补上台积电产能不足的那块缺口。

    对谷歌来说,这不是”要不要英特尔”的问题,而是”不能只靠台积电”的问题。

    不只是谷歌在行动

    有意思的是,谷歌并不是唯一一个在测试英特尔制造技术的公司。报道里提到,英伟达和SK海力士也在做同样的事情——把英特尔当作自研芯片的代工备选方案。

    这对英特尔来说是个好消息。过去十几年,英特尔在芯片制造代工这块一直没能真正打进高端市场,台积电和三星把大部分客户都拿走了。现在AI芯片的需求爆炸,反倒给了英特尔一个重新切入市场的机会。

    2028年才能量产,来得及吗

    有个细节值得注意:英特尔要到2028年才能为谷歌量产这300万颗TPU。这个时间节点说明,谷歌和英特尔的合作不是临时抱佛脚,而是至少两年前就开始谈的了。

    对AI行业来说,两年的周期其实不算长。芯片研发和制造本来就是长线投入,现在布局2028年的产能,反倒是正常操作。真正的问题可能是:到2028年,台积电的产能还紧不紧张?如果到时候台积电扩产跟上了,谷歌会不会又调整订单分配?


    不管怎样,AI芯片的供应链正在从”台积电一家独大”变成”多家代工并存”的格局。对谷歌、英伟达这些公司来说,多一个选择总归是好事。

  • 谷歌AI连”Google”都拼不对,大语言模型的底层缺陷藏不住了

    谷歌AI连”Google”都拼不对,大语言模型的底层缺陷藏不住了

    2026年5月27日 | 来源:TechCrunch

    谷歌AI拼写错误示意图
    谷歌AI Overview将”Google”拼成了两个P | 图源:TechCrunch

    单词”Google”里面有几个P?谷歌自己的AI给出的答案是:两个。

    这不是段子,是真实发生在谷歌搜索”AI Overview(AI概览)”功能里的场面。有用户发现,让谷歌AI数一下”poop”里有几个R,它一本正经地回答”恰好1个”;问它”journalism”怎么拼,它拼出了j-o-u-r-n-a-d-i-s-m——多了一个完全不存在的D。

    至于美国总统的姓氏,谷歌AI表示里面有1个P——但拼出来的是t-r-p-u-m。

    这已经不是第一次了

    早在谷歌大张旗鼓给搜索结果页加入AI概览功能的时候,就有不少人预感会出事。果然,第一代AI概览上线时,它引用过《洋葱新闻》的讽刺文章,一本正经地建议用户”每天吃一块小石头”来补充矿物质,还从Reddit的段子里学到”可以在披萨上涂胶水来增加奶酪拉丝效果”。

    那一轮翻车之后,谷歌表面上修了不少问题。但这一轮以生成式AI为核心的搜索改版,把AI概览摆到了搜索结果的最顶端——也就是用户第一眼看到的位置。拼写错误这种低级失误,就这样被放大给了数亿用户。

    谷歌AI拼写错误示例
    用户实测:让各AI数”strawberry”里的R,纷纷翻车 | 图源:TechCrunch

    为什么AI就是不会拼写?

    这背后其实有一个相当硬核的技术原因,只是大多数用户并不知道。

    驱动聊天机器人和文本生成工具的大语言模型(LLM),从设计逻辑上就不是为了”阅读”而生的。当你输入一段提示词,模型会先把它转换成一串数字编码(也就是token),然后根据上下文关联来预测下一个最可能出现的token。

    问题就出在这里:模型眼里没有”字母”这个概念。它看到的”the”是一个整体编码,知道这个词的意思是”这个”,但它根本不知道T、H、E分别是什么字符。

    “LLM基于Transformer架构,这个架构本质上就不是真的在’阅读’文本。你输入提示词之后,它会被转换成编码。当模型看到单词’the’的时候,它只有’the’对应的编码,知道这个词的意思是’这个’,但它根本不知道’T”H”E’分别是什么。”——阿尔伯塔大学AI研究员Matthew Guzdial助理教授

    这就是为什么AI可以在几秒钟内写出能跑的应用程序代码,或者解决困扰数学家几十年的难题,但拼对一个简单的英文单词却相当于幼儿园小朋友的水平。

    研究人员也不乐观

    东北大学研究大语言模型可解释性的博士生Sheridan Feucht说得更直接:他猜测”由于这种模糊性,根本不存在完美的tokenizer(分词器)”。

    对于AI研究人员来说,拼写能力本来就不是LLM的核心评判指标。能写代码、能推理、能翻译,才是大家关心的。但问题是,当这些模型被直接推到数亿用户的搜索框里,每一个低级错误都会被无限放大。

    谷歌通过邮件向TechCrunch回应称:”单词计数是LLM的已知难题,我们正在努力修复这个特定问题。”措辞相当谨慎——”已知难题”四个字,基本等于承认这是底层架构的问题,不是修几个bug就能彻底解决的。

    给我们提了个醒

    这些令人发笑的拼写错误,其实有一个很正面的作用:它们不断提醒我们,AI并不完美,哪怕它有时候看起来全知全能、超出人类认知。

    我们不能盲目相信AI的输出,哪怕它说得再自信,也要二次核对准确性。这个道理大家都听过,但只有当AI把”Google”拼成两个P的时候,它才真正地被大多数人理解。

    谷歌这一轮搜索改版,把生成式AI摆到了有史以来最显眼的位置。它得到的赞美会更多,但挨的骂也会更多。拼写错误可能只是开始。


  • 谷歌每月付SpaceX 9.2亿美元:AI算力军备竞赛打到外太空了

    AI算力不够用,连谷歌都要找SpaceX租显卡了。而且租金贵到离谱——每个月9.2亿美元,签了三年。

    这笔钱到底买了什么

    根据SpaceX在本周公开展露的监管文件,谷歌将从2026年10月开始,到2029年6月为止,每个月向SpaceX支付9.2亿美元。换回来的,是大约11万块英伟达GPU,加上配套的CPU、内存和相关组件的使用权。

    这个规模和Anthropic拿到的相比,大概是打了对折。就在这份文件公开前一周,SpaceX刚宣布和Anthropic签了同类型的协议——Anthropic每个月付12.5亿美元,用掉SpaceX在孟菲斯附近Colossus 1数据中心的全部可用算力。那个数据中心是马斯克早先为了训练xAI模型自己建的,现在xAI并入了SpaceX,这块资产也就顺带进了SpaceX的口袋。

    谷歌与SpaceX算力合作协议
    谷歌每月支付SpaceX 9.2亿美元算力费,为期三年 | 来源:TechCrunch

    谷歌真的缺算力吗

    这事最让人困惑的地方就在这:谷歌是全球公认的AI算力大户,有些估算甚至说它是全球最大的AI算力持有者。它自己有TPU,有谷歌云,为什么还要找马斯克租卡?

    谷歌的官方说法是:最近推出的AI产品需求远超预期,特别是企业级的Agent平台Gemini Enterprise,用户涨得太快,现有算力顶不住了。这个”短期、及时的协议”就是为了补上这段时间的算力缺口,等自己的新数据中心建好就能缓过来。

    “谷歌云和SpaceX是老搭档了。这是一个短期、及时的协议,确保我们有桥接容量来满足Gemini Enterprise代理平台超出预期激增的客户需求。”——谷歌声明

    SpaceX的算盘

    站在SpaceX的角度看,这笔交易一石二鸟。一方面,把原本只给自己xAI用的数据中心腾出一半租给谷歌,每个月净赚9.2亿美元,三年下来超过330亿美元。另一方面,谷歌本来就是SpaceX的早期投资方,IPO之后持股份额预计价值超过1000亿美元——算力租约加上股权收益,两边通吃。

    合同里还有一个取消条款:2026年12月31日之后,双方都可以提前90天通知对方终止协议。谷歌接入数据中心的过程会在9月前”以较低费用逐步 ramp up”。如果SpaceX到2026年9月30日还交不出承诺数量的GPU,谷歌可以选择直接终止协议,或者接受实际提供的数量并相应减少月费。

    SpaceX预计近期就要在纳斯达克挂牌了,目标估值1.75万亿美元。有谷歌这种量级客户排队付租金,这个IPO故事讲出来,投资人应该不难买单。


  • 谷歌开源Gemma 4 12B,16GB内存笔记本就能跑多模态AI

    谷歌走了条不同的路

    大部分玩家都在冲更大、更强的模型,谷歌反过来证明:一个精心设计的120亿参数模型,配合聪明的架构选择,在边缘设备上也能给出不俗的多模态推理能力。

    谷歌刚刚做了一个挺有意思的举动。6月3日,这家公司悄悄上线了Gemma 4 12B——一个119.5亿参数的开源多模态模型,最关键的卖点是:普通16GB内存的笔记本就能跑。

    砍掉编码器,延迟和内存都降了

    这个人称”统一架构”的东西,说白了就是把传统多模态模型里那些分开的编码器给砍掉了。

    传统做法里,音频和图像得先经过专门的编码器转成语言模型能懂的表示,这一转就带来了延迟和额外内存消耗。Gemma 4 12B直接让原始音频波形和视觉块流入核心语言模型的嵌入空间,只用了3500万参数的轻量线性层。

    结果就是:延迟低了,内存需求降到16GB,还能一次性微调整个多模态系统。

    性能不弱,上下文窗口大到离谱

    这个小模型跑分接近谷歌自己260亿参数的混合专家模型。它支持256K token上下文窗口——这对需要处理长财报、大型代码库或一小时会议记录的企业来说很实用。

    另外还内置了”思考模式”,会在生成回复前先列出逐步推理过程;开箱就支持函数调用和系统提示,这些都是搭建自主智能体的基础能力。

    企业哪几种场景最适合

    • 严格数据隐私和合规要求(比如医疗、金融、国防),敏感数据不能传出本地
    • 多模态智能体工作流,需要实时音频和变分辨率图像输入
    • 成本敏感的边缘部署,比如零售库存监控、本地客服亭、离线现场服务

    当然也有局限

    如果你主要做的是海量知识检索,又不搭RAG管道,那可能还是需要更大的基础模型。

    另外音频输入严格限制在30秒内处理,视频理解只有60秒(按每秒1帧算)。需要处理长视频或大型音频档案的企业,还是得用API模型或分块架构。


    谷歌这次把小模型路线走得很坚决。对企业技术负责人来说,Gemma 4 12B值得认真评估——尤其是当你既想要多模态能力,又不想把所有数据都送到云端去的时候。

  • 谷歌每月给SpaceX交9.2亿美元:AI算力的军备竞赛,已经打到太空了

    Google SpaceX compute deal

    AI算力缺到什么程度了?谷歌每个月给SpaceX交9.2亿美元,而且一签就是三年。这份刚曝光的计算资源采购协议,让外界第一次看清大厂之间”算力租赁”已经到了什么量级。

    根据SpaceX在监管文件中披露的信息,从2026年10月到2029年6月,谷歌将每月支付9.2亿美元,换取”大约11万块英伟达GPU”以及配套CPU、内存和其他相关组件的使用权。

    每月9.2亿美元,三年下来谷歌要给SpaceX交超过330亿美元。这笔钱买到的,是AI时代最稀缺的资源——算力。

    SpaceX的算力生意经

    这份谷歌协议的结构,和SpaceX上个月跟Anthropic签的那份几乎如出一辙。当时Anthropic同意每月向SpaceX支付12.5亿美元,租用其位于田纳西州孟菲斯附近的Colossus 1数据中心的全部可用算力,协议同样签到2029年。

    谷歌这笔单子大概只用到Colossus 1算力的半份——约11万块GPU,不到Anthropic拿到的量的一半。SpaceX没有说明谷歌具体用的是哪个数据中心,但马斯克之前暗示过,Colossus 2会留给xAI自用。

    对SpaceX来说,这意味着它还没正式IPO,就已经锁定了两份长期大额算力采购合同。一周后SpaceX就要在纳斯达克挂牌了,招股书里这些信息足够让投资者看懂它的商业模式——不只是火箭和星链,它还在卖算力。

    谷歌真的不缺算力吗

    谷歌自己本来就是全球最大的AI算力持有者之一,它为什么要找SpaceX租?官方说法是:刚推出的Agent平台Gemini Enterprise需求远超预期,需要额外的”过渡性算力”来顶住。

    谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本开支,而且说明年还要”显著增加”。为了撑住这个开支规模,Alphabet最近还宣布了800亿美元的股权发售计划。

    所以真相是:即便对谷歌来说,AI算力的消耗速度也已经快到跟不上了。与其自己慢慢建数据中心,先租三年SpaceX的现成算力,是更快的补齐方式。

    IPO前最后一波造势

    SpaceX选择在IPO前一周披露这份谷歌合作协议,时机相当精准。它向市场传递的信号很明确:我们不仅有自己的AI业务(xAI),还能把数据中心租给全球最顶尖的科技公司,而且租约一签就是几年。

    招股书显示SpaceX目标融资约750亿美元,估值大约1.75万亿美元。如果成功,这将是史上规模最大的IPO。而谷歌本身就是SpaceX的长期股东,IPO之后持股份额预计价值超过1000亿美元。

    两家公司还在洽谈合作建设轨道数据中心——这听起来像科幻小说,但确实是SpaceX IPO后计划的重要组成部分。算力战争打到太空,可能比所有人预想的都要快。