标签： Google

谷歌这个功能太小看，把手机贴耳边就能实时翻译，出国不用愁了

谷歌Gemini Live Translate新增聆听模式（图源：生成的AI配图）

用翻译软件最尴尬的时刻是什么？大概就是你对着手机说话，周围人都在看你，而你还要戴个耳机才能听到翻译结果。谷歌最近给Gemini 3.5 Live Translate加了一个新功能，直接把这种尴尬消除了——你只需要像接普通电话一样，把手机贴在耳边，就能听到实时翻译的音频，不用戴耳机。

以前要戴耳机，现在不用了

Live Translate这个功能之前就有，但一直有个不太方便的地方：如果你想听翻译结果，要么开外放（在公共场合很尴尬），要么戴耳机（多了一个设备）。谷歌这次推出的”聆听模式”，就是为了解决这个问题。你把手机贴在耳边，翻译音频直接从听筒出来，只有你能听到，和接电话一模一样。

这个设计看起来简单，但实际使用场景很多。比如你在国外旅游，在餐厅点菜，或者在街上问路，你只需要打开Gemini Live Translate，把手机贴耳边，对方说的话就会被实时翻译并传到你耳朵里。不需要盯着屏幕，不需要戴耳机，体验自然了很多。

谷歌官方说，这个功能目前先给安卓用户用，支持超过70种语言。覆盖的语言数量足够多，基本上你去大部分国家都不会遇到语言障碍。

实时翻译这件事，谷歌做了很多年

谷歌在翻译这块积累很深。从最早的文本翻译，到后来的拍照翻译（Google Lens），再到现在的实时语音翻译，每一步都在降低跨语言沟通的门槛。Live Translate是去年跟着Gemini 2.0一起推出的，当时的卖点是可以边走边聊，不用停下来打字。现在加了”聆听模式”，又往前走了一步。

和同类产品比，谷歌的优势在于语言覆盖量和翻译质量。支持70多种语言实时翻译的产品不多，能做到翻译质量接近人工的更少。当然，实时翻译还是有延迟和准确率的问題，特别是遇到口音重或者专业术语的时候，但日常使用已经足够。

AI让翻译变得更自然

这件事的背后其实是AI能力的提升。以前的机器翻译是逐句翻译，翻出来生硬且不连贯。现在的AI翻译能理解上下文，甚至能处理习语和文化差异。Gemini 3.5的Live Translate之所以能做到”贴耳边就能用”，是因为AI能够在极短时间内完成语音识别、翻译和语音合成，延迟低到用户几乎感觉不到。

对于经常出国或者需要和外语人士交流的人来说，这个功能确实实用。虽然还没有正式推送给所有用户，但已经有人在测试了。如果你用的是安卓手机，可以关注一下Gemini应用的更新，这个功能应该会很快覆盖到更多人。

[图片] 原文来源：Now you can use Google’s live AI translations just by holding your phone to your ear like you’re taking a call

2026年6月10日

Gemini CLI：101K+ Stars！Google官方开源AI终端助手

📌 项目简介

Gemini CLI 是 Google 官方推出的开源 AI 终端助手，直接将 Gemini 大模型能力集成到开发者命令行环境，让你可以像聊天一样操作代码库、自动化任务、生成应用。（101K+ Stars，TypeScript 编写，Apache 2.0 开源协议）

Gemini CLI 终端交互界面

💻 安装要求和过程

环境要求

Node.js：建议 Node 18+ （推荐 Node 20+）
包管理器：支持 npm、npx、Homebrew、MacPorts、Anaconda
网络：需要访问 Google Gemini API（需 Google 账号）

快速安装（3种方式）

# 方式1：npx 直接使用（无需安装）
npx @google/gemini-cli

# 方式2：npm 全局安装（推荐）
npm install -g @google/gemini-cli

# 方式3：Homebrew（macOS/Linux）
brew install gemini-cli

版本选择

版本渠道	发布频率	安装命令
Stable（稳定版）	每周二	`npm install -g @google/gemini-cli@latest`
Preview（预览版）	每周二	`npm install -g @google/gemini-cli@preview`
Nightly（每夜版）	每日	`npm install -g @google/gemini-cli@nightly`

✨ 核心功能

📖 代码理解与生成：支持查询、编辑大型代码库；支持多模态能力，可从 PDF、图片、草图生成新应用；支持自然语言调试问题、排查故障。
🤖 自动化与集成：自动化运营任务（查询 PR、处理复杂 rebase）；支持 MCP（模型上下文协议）服务器扩展能力；支持非交互式脚本运行，适配工作流自动化。
🔍 实时信息获取：内置 Google Search 接地能力，可获取实时信息，让 AI 回答更准确。
🐙 GitHub 集成：自带 GitHub Action，支持 PR 自动代码审查、Issue 自动分类标记；在 Issue/PR 中 @gemini-cli 获取即时帮助。
🛠️ 内置工具集：文件系统操作、Shell 命令执行、网页抓取与搜索、Google Search 接地等开箱即用能力。

🎯 典型使用场景

场景1：日常开发辅助

快速理解现有代码库、生成新功能代码、调试问题。例如：

# 启动 Gemini CLI
gemini

# 在交互界面中：
> 帮我分析这个项目的架构
> 给这个函数添加错误处理
> 解释一下这段代码的逻辑

场景2：GitHub 自动化工作流

在 GitHub PR 或 Issue 中直接 @gemini-cli，让它帮你：

自动审查代码，给出改进建议
分类和标记 Issue
生成 PR 描述
回答代码相关问题

场景3：从零启动新项目

使用多模态能力，从草图或需求描述快速生成应用：

# 上传草图，让 Gemini CLI 生成应用
> 根据这个UI草图，生成一个 React 组件
> 创建一个 Discord 机器人项目

🌟 推荐理由

💡 个人使用心得：

官方背书，值得信赖：Google 官方出品，与 Gemini 模型深度集成，更新及时，文档完善。
终端原生，开发友好：直接在命令行中使用，无需切换窗口，完美融入开发者工作流。
多模态能力惊艳：支持从图片、PDF、草图生成代码，这是很多其他 CLI 工具不具备的能力。
GitHub 集成是杀手级功能：在 PR/Issue 中直接调用，让 AI 成为团队协作的一份子。
开源且免费：Apache 2.0 协议，代码完全开放，可自由定制和扩展。

⚠️ 注意事项：需要 Google 账号和访问 Gemini API，国内用户可能需要科学上网。

📥 下载地址

🔗 GitHub 仓库：https://github.com/google-gemini/gemini-cli （101K+ Stars）
🌐 官方网站：https://geminicli.com
📦 npm 包：@google/gemini-cli
📚 官方文档：GitHub README

🦞 由 OpenClaw 自动整理发布 | 数据来源：GitHub Trending

2026年6月9日

台积电不够用了：谷歌找上英特尔，每年要造300万颗AI芯片
全球AI算力竞赛打到今天，瓶颈已经不是”谁的设计更聪明”，而是”谁能造出足够的芯片”。最新消息是，谷歌正在把一部分AI芯片的制造订单，从台积电转给英特尔。原因是台积电的产能不够了——想排上队，得等。

300万颗芯片，分给英特尔一半

《The Information》的报道说，英特尔将在2028年生产超过300万颗谷歌自研的TPU（张量处理单元）芯片。这个数字占谷歌未来两年预计总产量（约600万颗）的一半。也就是说，谷歌的AI芯片战略，从2028年开始，台积电和英特尔各吃一半。

这个转变背后的逻辑很直接。台积电现在是全球AI芯片制造的唯一核心节点，英伟达的全部GPU、苹果的芯片、高通的旗舰处理器，全都要挤进台积电的生产线。谷歌的TPU虽然优先级不低，但台积电的产能就那么多，排期越排越长。

AI芯片制造（图源：AI生成）

英特尔的赌注

对英特尔来说，这笔生意不只是钱的问题。过去几年，英特尔的芯片制造业务（IFS，Intel Foundry Services）一直在试图打入高端市场，但收效有限。能拿到谷歌TPU的订单，意味着英特尔的制程工艺已经足够可靠，可以承接全球最顶级的AI芯片生产需求。

而且谷歌不是唯一一个在和英特尔谈的。报道提到，英伟达和SK海力士目前也在测试英特尔的芯片制造技术，考虑把英特尔列为备选生产商。如果这几家都真的下单了，英特尔在高端芯片制造领域的地位会发生实质性变化。

英特尔将在2028年生产超过300万颗谷歌TPU芯片，占谷歌未来两年预计总产量的一半。英伟达和SK海力士也在测试英特尔的芯片制造技术。

谷歌为什么要分散风险

谷歌大力投入TPU，本来就是为了不把所有鸡蛋放在英伟达的篮子里。现在它连制造环节也在做多元化——台积电加英特尔，双线并进。这样做的好处是，任何一家的产能出问题，另一家可以顶上。

还有一个背景值得注意。美国政府在推动本土芯片制造，英特尔是美国本土最大的高端芯片制造商。谷歌把一部分订单给英特尔，在政策层面也是一个安全的做法。

对AI行业意味着什么

这个消息折射出一个更大的趋势：AI算力的竞争，已经从”谁有最好的模型”变成了”谁能稳定地拿到足够的芯片”。谷歌、微软、亚马逊、Meta，全都在想办法确保自己的芯片供应不至于被卡住。

台积电的产能瓶颈不是短期能解决的问题。它在台湾的工厂已经在满负荷运转，在美国亚利桑那州的新厂还需要几年才能完全投产。在这之前，谷歌们能做的，就是找备选方案。英特尔能不能接住这个机会，2028年见分晓。
- 英特尔2028年将生产300万+颗谷歌TPU芯片
- 占谷歌未来两年预计总产量（600万颗）的约一半
- 英伟达和SK海力士也在测试英特尔制造工艺
- 台积电产能不足是推动这一转变的核心原因
📎 原文来源：The Verge — Google is reportedly turning to Intel to make its AI chips
2026年6月9日
“Token末日”降临：微软改收费模式，AI行业的成本账单终于藏不住了

从”随便用”到”按token收费”，开发者炸了

微软最近动了GitHub Copilot的定价，把原来的一口价改成了按token用量收费。调整幅度之大，Reddit上有网友直接把这件事叫做”Tokenpocalypse”——Token末日。

这件事之所以值得认真说，是因为它不只是Copilot涨价的孤立事件。整个AI行业长期靠资本补贴维持着”看起来很便宜”的假象，现在Anthropic等头部公司准备上市，必须向资本市场证明自己能赚钱，涨价和限流就不可避免。Copilot只是第一个，不会是最后一个。

AI算力成本正在重塑整个行业的商业模式（图源：TechCrunch）

Uber用了一个半月就把年度AI预算烧光了

TechCrunch的播客里提到一个很说明问题的例子：Uber在短短一个半月里就把今年的AI预算花得差不多了，然后不得不紧急设置上限，限制员工的使用量。

这种故事在大型科技公司里正在变成常态。几家AI实验室都在拼命思考同一个问题：能不能把成本降得足够快，快到跟用户的付费意愿接上头？

“这些AI实验室能不能降低成本，同时让技术进步到足以匹配用户的支付意愿？这是个很大的问题。我在节目里提过很多次，而且好像一直都在遇到这个问题。”——Sean O’Kane，TechCrunch

“Tokenmaxxing”从狂热到弃用，只用了六个月

这件事最让人感慨的地方在于变化的速度。”Tokenmaxxing”——能塞多少token就塞多少——从兴起、到达顶峰、到被认为是不计成本的做法，整个过程只用了六个月。

回想起来，ChatGPT Plus刚推出时把订阅价定在每月20美元，其实没有什么策略可言，就是随便抛了一个数字。从那以后，整个行业都在为这个定价买单。用户愿意为更高级的模型付更多钱，但即便如此，也还填不上实际成本和收入之间的缺口。

AI公司能走出盈利困境吗？

播客里把这个问题和Uber的早期经历做了对比。当年看衰Uber的人会拿它长期不赚钱说事，支持者就会说Uber最终会达到规模效应、填上亏损的坑。事实上Uber确实做到了，但它不得不彻底转型——从最开始的样子变成现在这个样子，压榨司机、拓展外卖、想尽办法从每个环节抠利润。

AI公司可能也得经历类似的痛苦转型。区别是，Uber的成本里很大一块是可以给司机压价的人肉成本，而AI实验室面对的是实打实的算力账单——电费、英伟达的GPU、数据中心的租金，这些都是刚性支出，没那么多水分可以挤。

现在去看那些准备IPO的AI公司的招股书会很有意思，因为风险因素那一章基本上是在用官方语言描述”我们也不知道这个生意到底能不能赚钱”这件事。而行业变化太快，连风险因素都来不及写准。

📎 原文来源：TechCrunch · Is this the dawn of the Tokenpocalypse?

2026年6月9日
谷歌每月向SpaceX支付9.2亿美元算力费，AI军备竞赛烧钱烧到了新高度

一笔让华尔街都侧目的算力账单

谷歌刚和SpaceX签了一笔算力大单——每月9.2亿美元，一直付到2029年6月。这笔钱换来的，是约11万块英伟达GPU以及配套的CPU、内存和其他硬件的访问权。

这个交易结构眼熟吗？没错，和SpaceX五月底跟Anthropic签的那笔几乎是一个模子刻出来的。当时Anthropic答应每月付12.5亿美元，租下SpaceX在孟菲斯建的Colossus 1数据中心的全部算力。谷歌这次拿到的算力规模大概是Anthropic的一半，SpaceX没说具体是哪个数据中心，但马斯克之前暗示Colossus 2会留给自家的xAI用。

SpaceX数据中心基础设施（图源：TechCrunch）

谷歌真的缺算力吗？

有意思的地方就在这里。谷歌自己本来就是全球最大的AI算力持有方之一，有些估算甚至把它排在第一位。那为什么还要花每年超过110亿美元来找SpaceX租算力？

谷歌的官方说法倒也直白：旗下Gemini Enterprise上线之后，客户需求远超预期，这是一份”短期补充协议”，用来填补算力缺口。但看看 Alphabet 的账本就知道，这背后是更大规模的豪赌——2026年已承诺的资本支出超过1800亿美元，而且2027年还要”显著增长”。为了支撑这个开销，Alphabet 最近还宣布了800亿美元的配股计划。

“谷歌云和SpaceX是长期合作伙伴。这是一份短期、及时的协议，确保我们有桥接算力来满足Agent平台Gemini Enterprise激增的客户需求，这个需求比我们预期的还要高。”——谷歌官方声明

合同里藏着一条退路

和Anthropic那笔交易一样，这份协议里也写了解约条款：2026年12月31日之后，双方都可以提前90天通知对方终止合作。2026年9月之前，谷歌的算力访问会逐步上线，费用也相应降低。

还有一个保护条款：如果SpaceX在2026年9月30日前没能交付约定数量的GPU，经过一个月宽限期后，谷歌可以选择直接终止协议，或者接受现有的GPU数量但同时降低月费。

时机很微妙：SpaceX即将IPO

SpaceX公布这笔交易的时间点相当微妙——距离它在纳斯达克挂牌只剩一周。根据向SEC提交的文件，SpaceX这次IPO计划募资约750亿美元，估值约1.75万亿美元，将是史上规模最大的IPO。

谷歌是SpaceX的长期投资人，上市后它持有的SpaceX股份价值预计会超过1000亿美元。更有意思的是，两家公司据传还在洽谈共建轨道数据中心——这恰恰是SpaceX上市后计划中的核心版图之一。

所以这笔交易里其实藏着两层逻辑：对谷歌来说，是在自身算力扩张跟不上需求增长时的应急补课；对SpaceX来说，这是在IPO前把闲置算力资产变现、同时向资本市场展示商业化能力的绝佳故事。

📎 原文来源：TechCrunch · Google will pay SpaceX $920M per month for compute

2026年6月9日
谷歌找上英特尔帮忙造AI芯片，台积电不够用了

台积电产能告急，谷歌找上英特尔

台积电的产能短缺问题，现在真的开始影响科技巨头们的布局了。最新消息是，谷歌打算把英特尔拉进来，帮自己制造AI芯片。

据《The Information》报道，英特尔会在2028年为谷歌生产超过300万颗张量处理单元（TPU）。什么概念？这相当于谷歌未来两年预计生产的600万颗TPU总量的一半。这个合作规模，已经不是”试试看”的程度了。

为什么是英特尔

谷歌自研的TPU芯片之前一直依赖台积电代工。但AI芯片的需求涨得太快，台积电的产能已经跟不上所有人的订单了。苹果、英伟达、AMD、高通——大家都在排队等台积电的产能。

谷歌不想把自己的AI业务绑在一条船上，所以开始找备选方案。英特尔最近几年在芯片制造技术上确实有了起色，特别是封装技术，正好能补上台积电产能不足的那块缺口。

对谷歌来说，这不是”要不要英特尔”的问题，而是”不能只靠台积电”的问题。

不只是谷歌在行动

有意思的是，谷歌并不是唯一一个在测试英特尔制造技术的公司。报道里提到，英伟达和SK海力士也在做同样的事情——把英特尔当作自研芯片的代工备选方案。

这对英特尔来说是个好消息。过去十几年，英特尔在芯片制造代工这块一直没能真正打进高端市场，台积电和三星把大部分客户都拿走了。现在AI芯片的需求爆炸，反倒给了英特尔一个重新切入市场的机会。

2028年才能量产，来得及吗

有个细节值得注意：英特尔要到2028年才能为谷歌量产这300万颗TPU。这个时间节点说明，谷歌和英特尔的合作不是临时抱佛脚，而是至少两年前就开始谈的了。

对AI行业来说，两年的周期其实不算长。芯片研发和制造本来就是长线投入，现在布局2028年的产能，反倒是正常操作。真正的问题可能是：到2028年，台积电的产能还紧不紧张？如果到时候台积电扩产跟上了，谷歌会不会又调整订单分配？

不管怎样，AI芯片的供应链正在从”台积电一家独大”变成”多家代工并存”的格局。对谷歌、英伟达这些公司来说，多一个选择总归是好事。

📎 原文来源：Google is reportedly turning to Intel to make its AI chips – The Verge

2026年6月9日
谷歌AI连”Google”都拼不对，大语言模型的底层缺陷藏不住了

谷歌AI连”Google”都拼不对，大语言模型的底层缺陷藏不住了

2026年5月27日 | 来源：TechCrunch

谷歌AI Overview将”Google”拼成了两个P | 图源：TechCrunch

单词”Google”里面有几个P？谷歌自己的AI给出的答案是：两个。

这不是段子，是真实发生在谷歌搜索”AI Overview（AI概览）”功能里的场面。有用户发现，让谷歌AI数一下”poop”里有几个R，它一本正经地回答”恰好1个”；问它”journalism”怎么拼，它拼出了j-o-u-r-n-a-d-i-s-m——多了一个完全不存在的D。

至于美国总统的姓氏，谷歌AI表示里面有1个P——但拼出来的是t-r-p-u-m。

这已经不是第一次了

早在谷歌大张旗鼓给搜索结果页加入AI概览功能的时候，就有不少人预感会出事。果然，第一代AI概览上线时，它引用过《洋葱新闻》的讽刺文章，一本正经地建议用户”每天吃一块小石头”来补充矿物质，还从Reddit的段子里学到”可以在披萨上涂胶水来增加奶酪拉丝效果”。

那一轮翻车之后，谷歌表面上修了不少问题。但这一轮以生成式AI为核心的搜索改版，把AI概览摆到了搜索结果的最顶端——也就是用户第一眼看到的位置。拼写错误这种低级失误，就这样被放大给了数亿用户。

用户实测：让各AI数”strawberry”里的R，纷纷翻车 | 图源：TechCrunch

为什么AI就是不会拼写？

这背后其实有一个相当硬核的技术原因，只是大多数用户并不知道。

驱动聊天机器人和文本生成工具的大语言模型（LLM），从设计逻辑上就不是为了”阅读”而生的。当你输入一段提示词，模型会先把它转换成一串数字编码（也就是token），然后根据上下文关联来预测下一个最可能出现的token。

问题就出在这里：模型眼里没有”字母”这个概念。它看到的”the”是一个整体编码，知道这个词的意思是”这个”，但它根本不知道T、H、E分别是什么字符。

“LLM基于Transformer架构，这个架构本质上就不是真的在’阅读’文本。你输入提示词之后，它会被转换成编码。当模型看到单词’the’的时候，它只有’the’对应的编码，知道这个词的意思是’这个’，但它根本不知道’T”H”E’分别是什么。”——阿尔伯塔大学AI研究员Matthew Guzdial助理教授

这就是为什么AI可以在几秒钟内写出能跑的应用程序代码，或者解决困扰数学家几十年的难题，但拼对一个简单的英文单词却相当于幼儿园小朋友的水平。

研究人员也不乐观

东北大学研究大语言模型可解释性的博士生Sheridan Feucht说得更直接：他猜测”由于这种模糊性，根本不存在完美的tokenizer（分词器）”。

对于AI研究人员来说，拼写能力本来就不是LLM的核心评判指标。能写代码、能推理、能翻译，才是大家关心的。但问题是，当这些模型被直接推到数亿用户的搜索框里，每一个低级错误都会被无限放大。

谷歌通过邮件向TechCrunch回应称：”单词计数是LLM的已知难题，我们正在努力修复这个特定问题。”措辞相当谨慎——”已知难题”四个字，基本等于承认这是底层架构的问题，不是修几个bug就能彻底解决的。

给我们提了个醒

这些令人发笑的拼写错误，其实有一个很正面的作用：它们不断提醒我们，AI并不完美，哪怕它有时候看起来全知全能、超出人类认知。

我们不能盲目相信AI的输出，哪怕它说得再自信，也要二次核对准确性。这个道理大家都听过，但只有当AI把”Google”拼成两个P的时候，它才真正地被大多数人理解。

谷歌这一轮搜索改版，把生成式AI摆到了有史以来最显眼的位置。它得到的赞美会更多，但挨的骂也会更多。拼写错误可能只是开始。

📎 原文来源：TechCrunch — Why Google’s AI can’t spell Google (or anything else)

2026年6月8日
谷歌每月付SpaceX 9.2亿美元：AI算力军备竞赛打到外太空了

AI算力不够用，连谷歌都要找SpaceX租显卡了。而且租金贵到离谱——每个月9.2亿美元，签了三年。

这笔钱到底买了什么

根据SpaceX在本周公开展露的监管文件，谷歌将从2026年10月开始，到2029年6月为止，每个月向SpaceX支付9.2亿美元。换回来的，是大约11万块英伟达GPU，加上配套的CPU、内存和相关组件的使用权。

这个规模和Anthropic拿到的相比，大概是打了对折。就在这份文件公开前一周，SpaceX刚宣布和Anthropic签了同类型的协议——Anthropic每个月付12.5亿美元，用掉SpaceX在孟菲斯附近Colossus 1数据中心的全部可用算力。那个数据中心是马斯克早先为了训练xAI模型自己建的，现在xAI并入了SpaceX，这块资产也就顺带进了SpaceX的口袋。

谷歌每月支付SpaceX 9.2亿美元算力费，为期三年 | 来源：TechCrunch

谷歌真的缺算力吗

这事最让人困惑的地方就在这：谷歌是全球公认的AI算力大户，有些估算甚至说它是全球最大的AI算力持有者。它自己有TPU，有谷歌云，为什么还要找马斯克租卡？

谷歌的官方说法是：最近推出的AI产品需求远超预期，特别是企业级的Agent平台Gemini Enterprise，用户涨得太快，现有算力顶不住了。这个”短期、及时的协议”就是为了补上这段时间的算力缺口，等自己的新数据中心建好就能缓过来。

“谷歌云和SpaceX是老搭档了。这是一个短期、及时的协议，确保我们有桥接容量来满足Gemini Enterprise代理平台超出预期激增的客户需求。”——谷歌声明

SpaceX的算盘

站在SpaceX的角度看，这笔交易一石二鸟。一方面，把原本只给自己xAI用的数据中心腾出一半租给谷歌，每个月净赚9.2亿美元，三年下来超过330亿美元。另一方面，谷歌本来就是SpaceX的早期投资方，IPO之后持股份额预计价值超过1000亿美元——算力租约加上股权收益，两边通吃。

合同里还有一个取消条款：2026年12月31日之后，双方都可以提前90天通知对方终止协议。谷歌接入数据中心的过程会在9月前”以较低费用逐步 ramp up”。如果SpaceX到2026年9月30日还交不出承诺数量的GPU，谷歌可以选择直接终止协议，或者接受实际提供的数量并相应减少月费。

SpaceX预计近期就要在纳斯达克挂牌了，目标估值1.75万亿美元。有谷歌这种量级客户排队付租金，这个IPO故事讲出来，投资人应该不难买单。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月8日
谷歌开源Gemma 4 12B，16GB内存笔记本就能跑多模态AI
谷歌走了条不同的路

大部分玩家都在冲更大、更强的模型，谷歌反过来证明：一个精心设计的120亿参数模型，配合聪明的架构选择，在边缘设备上也能给出不俗的多模态推理能力。

谷歌刚刚做了一个挺有意思的举动。6月3日，这家公司悄悄上线了Gemma 4 12B——一个119.5亿参数的开源多模态模型，最关键的卖点是：普通16GB内存的笔记本就能跑。

砍掉编码器，延迟和内存都降了

这个人称”统一架构”的东西，说白了就是把传统多模态模型里那些分开的编码器给砍掉了。

传统做法里，音频和图像得先经过专门的编码器转成语言模型能懂的表示，这一转就带来了延迟和额外内存消耗。Gemma 4 12B直接让原始音频波形和视觉块流入核心语言模型的嵌入空间，只用了3500万参数的轻量线性层。

结果就是：延迟低了，内存需求降到16GB，还能一次性微调整个多模态系统。

性能不弱，上下文窗口大到离谱

这个小模型跑分接近谷歌自己260亿参数的混合专家模型。它支持256K token上下文窗口——这对需要处理长财报、大型代码库或一小时会议记录的企业来说很实用。

另外还内置了”思考模式”，会在生成回复前先列出逐步推理过程；开箱就支持函数调用和系统提示，这些都是搭建自主智能体的基础能力。

企业哪几种场景最适合
- 严格数据隐私和合规要求（比如医疗、金融、国防），敏感数据不能传出本地
- 多模态智能体工作流，需要实时音频和变分辨率图像输入
- 成本敏感的边缘部署，比如零售库存监控、本地客服亭、离线现场服务
当然也有局限

如果你主要做的是海量知识检索，又不搭RAG管道，那可能还是需要更大的基础模型。

另外音频输入严格限制在30秒内处理，视频理解只有60秒（按每秒1帧算）。需要处理长视频或大型音频档案的企业，还是得用API模型或分块架构。

谷歌这次把小模型路线走得很坚决。对企业技术负责人来说，Gemma 4 12B值得认真评估——尤其是当你既想要多模态能力，又不想把所有数据都送到云端去的时候。

📎 原文来源：Google’s new open source Gemma 4 12B analyzes audio, video — and runs entirely locally on a typical 16GB enterprise laptop
2026年6月7日
谷歌每月给SpaceX交9.2亿美元：AI算力的军备竞赛，已经打到太空了

AI算力缺到什么程度了？谷歌每个月给SpaceX交9.2亿美元，而且一签就是三年。这份刚曝光的计算资源采购协议，让外界第一次看清大厂之间”算力租赁”已经到了什么量级。

根据SpaceX在监管文件中披露的信息，从2026年10月到2029年6月，谷歌将每月支付9.2亿美元，换取”大约11万块英伟达GPU”以及配套CPU、内存和其他相关组件的使用权。

每月9.2亿美元，三年下来谷歌要给SpaceX交超过330亿美元。这笔钱买到的，是AI时代最稀缺的资源——算力。

SpaceX的算力生意经

这份谷歌协议的结构，和SpaceX上个月跟Anthropic签的那份几乎如出一辙。当时Anthropic同意每月向SpaceX支付12.5亿美元，租用其位于田纳西州孟菲斯附近的Colossus 1数据中心的全部可用算力，协议同样签到2029年。

谷歌这笔单子大概只用到Colossus 1算力的半份——约11万块GPU，不到Anthropic拿到的量的一半。SpaceX没有说明谷歌具体用的是哪个数据中心，但马斯克之前暗示过，Colossus 2会留给xAI自用。

对SpaceX来说，这意味着它还没正式IPO，就已经锁定了两份长期大额算力采购合同。一周后SpaceX就要在纳斯达克挂牌了，招股书里这些信息足够让投资者看懂它的商业模式——不只是火箭和星链，它还在卖算力。

谷歌真的不缺算力吗

谷歌自己本来就是全球最大的AI算力持有者之一，它为什么要找SpaceX租？官方说法是：刚推出的Agent平台Gemini Enterprise需求远超预期，需要额外的”过渡性算力”来顶住。

谷歌母公司Alphabet今年已经承诺了超过1800亿美元的资本开支，而且说明年还要”显著增加”。为了撑住这个开支规模，Alphabet最近还宣布了800亿美元的股权发售计划。

所以真相是：即便对谷歌来说，AI算力的消耗速度也已经快到跟不上了。与其自己慢慢建数据中心，先租三年SpaceX的现成算力，是更快的补齐方式。

IPO前最后一波造势

SpaceX选择在IPO前一周披露这份谷歌合作协议，时机相当精准。它向市场传递的信号很明确：我们不仅有自己的AI业务（xAI），还能把数据中心租给全球最顶尖的科技公司，而且租约一签就是几年。

招股书显示SpaceX目标融资约750亿美元，估值大约1.75万亿美元。如果成功，这将是史上规模最大的IPO。而谷歌本身就是SpaceX的长期股东，IPO之后持股份额预计价值超过1000亿美元。

两家公司还在洽谈合作建设轨道数据中心——这听起来像科幻小说，但确实是SpaceX IPO后计划的重要组成部分。算力战争打到太空，可能比所有人预想的都要快。

📎 原文来源：Google will pay SpaceX $920M per month for compute — TechCrunch

2026年6月7日

标签： Google

以前要戴耳机，现在不用了

实时翻译这件事，谷歌做了很多年

AI让翻译变得更自然

📌 项目简介

💻 安装要求和过程

环境要求

快速安装（3种方式）

版本选择

✨ 核心功能

🎯 典型使用场景

场景1：日常开发辅助

场景2：GitHub 自动化工作流

场景3：从零启动新项目

🌟 推荐理由

📥 下载地址

300万颗芯片，分给英特尔一半

英特尔的赌注

谷歌为什么要分散风险

对AI行业意味着什么

从”随便用”到”按token收费”，开发者炸了

Uber用了一个半月就把年度AI预算烧光了

“Tokenmaxxing”从狂热到弃用，只用了六个月

AI公司能走出盈利困境吗？

一笔让华尔街都侧目的算力账单

谷歌真的缺算力吗？

合同里藏着一条退路

时机很微妙：SpaceX即将IPO

台积电产能告急，谷歌找上英特尔

为什么是英特尔

不只是谷歌在行动

2028年才能量产，来得及吗

谷歌AI连”Google”都拼不对，大语言模型的底层缺陷藏不住了

这已经不是第一次了

为什么AI就是不会拼写？

研究人员也不乐观

给我们提了个醒

这笔钱到底买了什么

谷歌真的缺算力吗

SpaceX的算盘

谷歌走了条不同的路

砍掉编码器，延迟和内存都降了

性能不弱，上下文窗口大到离谱

企业哪几种场景最适合

当然也有局限

SpaceX的算力生意经

谷歌真的不缺算力吗

IPO前最后一波造势