标签： AI

【开源推荐】Cherry Studio：47K+ Stars！多模型AI桌面客户端，一个应用搞定所有大模型
🍒 项目名称：Cherry Studio

⭐ GitHub Stars：47.1K+

🏷️ 开源协议：AGPL-3.0

💻 支持平台：Windows / macOS / Linux

🔗 GitHub：github.com/CherryHQ/cherry-studio

🌐 官网：cherry-ai.com

📝 项目简介

Cherry Studio 是一款支持多种大语言模型提供商的开源AI桌面客户端，覆盖 Windows、Mac、Linux 三大平台。它提供智能聊天、自主智能体、300+ 预配置助手能力，可统一访问前沿大语言模型，是2026年最值得关注的 AI 生产力工具之一。

无论你是用 OpenAI Gemini Claude 等云端模型，还是用 Ollama 跑本地模型，Cherry Studio 都能一站式搞定，告别在多个网页和客户端之间来回切换的烦恼。

⚙️ 安装要求和过程

环境要求
- 操作系统：Windows 10+、macOS 11+、主流 Linux 发行版
- 无需额外环境配置：开箱即用，下载安装包直接运行
- 网络要求：使用云端模型需配置 API Key；使用本地模型需提前安装 Ollama 或 LM Studio
快速安装步骤
1. 访问 GitHub Releases 页面，下载对应系统的安装包
2. Windows：下载 .exe 安装包，双击运行
3. macOS：下载 .dmg 文件，拖入 Applications 文件夹
4. Linux：下载 .AppImage 或 .deb / .rpm 包安装
5. 启动后，在设置中配置模型 API Key 或连接本地 Ollama
🌟 核心功能

🤖 多 LLM 提供商支持

支持 OpenAI、Gemini、Anthropic、Claude 等主流云端大模型，同时支持 Ollama、LM Studio 等本地模型，一个客户端搞定所有模型。

🧠 300+ 预配置 AI 助手

内置丰富领域的专业 AI 助手模板，涵盖编程、写作、翻译、分析等场景，开箱即用，也支持自定义助手创建。

📄 多格式文档处理

支持文本、图片、Office 文档、PDF 等多格式文件处理，内置 RAG 知识库能力，让 AI 基于你的文档作答。

🔌 MCP 协议支持

支持模型上下文协议（MCP）服务器，可扩展 AI 能力边界，接入专业工具和数据源。

🎨 可视化与开发工具

支持 Mermaid 图表可视化、代码语法高亮、全局搜索、话题管理系统，满足专业用户的需求。

🚀 典型使用场景

场景一：多模型对比测试

研究者或开发者需要同时对比 GPT-4.1、Claude 4 Opus、Gemini 2.5 Pro 在同一任务上的表现？Cherry Studio 支持多模型同时对话，同一条消息发送给多个模型，结果并排展示，轻松找出最强模型。

场景二：本地 + 云端混合使用

日常聊天用免费的本地模型（Ollama + Qwen3），重要任务切换云端前沿模型。Cherry Studio 统一入口管理，无需在多个工具间切换，数据隐私和模型能力兼得。

场景三：企业知识库问答

上传公司文档、技术手册到 Cherry Studio 知识库，结合 RAG 技术，让 AI 基于企业内部知识精准作答，打造专属的企业 AI 助手。

💡 推荐理由

作为一款开源免费的 AI 桌面客户端，Cherry Studio 最大的价值在于统一——统一了模型入口、统一了对话历史、统一了工具生态。

在此之前，用 OpenAI 要去网页，用 Claude 要开另一个网页，本地 Ollama 又是命令行，多模型对比更是麻烦。Cherry Studio 把这些全部整合到一个窗口里，还加上了知识库、MCP 工具扩展、300+ 助手模板，真正做到了”一个客户端，所有 AI 能力”。

尤其值得一提的是它的开箱即用体验——无需配置 Python 环境，无需折腾依赖，下载安装包，点几下鼠标配置 Key，马上就能用。对非技术用户非常友好。

如果你同时满足以下任意一点，强烈推荐试试 Cherry Studio：
- 同时使用多个 AI 模型（GPT/Claude/Gemini/本地模型）
- 希望 AI 能读取并处理你的本地文档
- 想要一个统一、美观、功能完整的 AI 客户端
- 重视数据隐私，希望本地运行 AI
📥 下载地址

🍒 GitHub 仓库
 🌐 官方网站
 📦 下载安装包

📌 本文由 WorkBuddy AI 自动化任务 定时发布，选题自 GitHub 热门 AI 开源项目。欢迎关注本站「开源项目」栏目，每周精选优质 AI 开源工具深度介绍。
2026年6月10日
NotebookLM悄悄升级Gemini 3.5，你的AI笔记本现在能跑代码了
NotebookLM升级Gemini 3.5，每一个笔记本现在都连着一台云电脑 | 图源：The Verge

你的AI笔记本，现在能自己跑代码了

谷歌这两天悄悄给 NotebookLM 推了个大版本更新，可能很多人还没注意到。简单说就是：NotebookLM 现在用上了 Gemini 3.5，而且每一个笔记本背后都连着一台”云电脑”。

这个变化比听起来要大。以前 NotebookLM 主要做的是帮你整理笔记、回答你导入材料里的问题，本质上是个”阅读理解”工具。现在不一样了——它能写代码、跑代码、生成图表、输出各种格式的文件，已经有点像个住在你笔记本里的研究员了。

谷歌在官方博客里说，升级后的NotebookLM”更准确、更可靠”。但真正有意思的不是这个说法，而是它现在能做的事。

云电脑是什么意思

这次更新最核心的变化，是 NotebookLM 现在跑在谷歌的代理编码平台 Antigravity 上。每一个你创建的笔记本，背后都挂着一台安全的云计算机。

这意味着什么？意味着 NotebookLM 不再只是”回答问题”——它可以主动写代码来做分析，然后把代码扔到那台云电脑上跑，再把结果返回给你。你要它帮你分析一组数据，它可以直接写Python代码、跑统计、画图表，然后把图表给你。

以前要做到这个程度，你得自己会写代码，或者至少会用 Colab、Jupyter 这类工具。现在你在 NotebookLM 里用自然语言描述你想做什么，它自己就把代码写了、跑了、结果也给你了。

输出的格式也多了很多。除了以前的文字回复，现在还能直接给你出 PDF、Excel、PowerPoint、CSV 表格，甚至是数据可视化图片（PNG、SVG）和用 Nano Banana 生成的图像。

不用导入资料也能用了

另外一个挺实用的更新：你现在不需要先导入笔记或YouTube视频，直接问 NotebookLM 一个问题，它就会自己去调用谷歌搜索帮你找来源。

这其实是对之前”发现”功能的升级。以前那个功能主要是帮你找资料来源，现在直接整合进了主流程——你问问题，它找资料，然后基于找到的资料回答你，同时把来源列出来，你可以选择把哪些来源导入到笔记本里。

这个改动看起来小，实际上降低了使用门槛。以前你得先有组织笔记的习惯，才会想到用 NotebookLM。现在哪怕你只是想快速了解一个话题，也可以直接把它当搜索工具来用，而且比普通搜索靠谱——因为它会给出来源，你可以追溯。

目前只有高价用户能用

当然，谷歌一贯的作风——好功能先给有钱的用户用。这次更新目前只推送给 Google AI Ultra 订阅用户和 Workspace 用户。普通用户什么时候能用上，谷歌没说。

AI Ultra 每月要付的钱不少，Workspace 也是企业级收费。所以某种程度上，这也是谷歌在给自己的高价订阅套餐增加卖点。但你不得不承认，如果这些功能最终下放到免费版或低价版，竞争力会相当强。

想想看：一个能自己跑代码来做分析的 AI 笔记工具，还自带搜索和来源追溯，而且所有计算都在云端完成，不占用你本地资源。对于做研究、写报告、分析数据的人来说，这基本上就是把以前需要好几个工具配合才能做的事，塞进了一个界面里。
- 研究人员可以用它快速做文献综述和数据分析
- 学生可以用它整理学习笔记、生成复习材料
- 职场人可以用它处理报告、做数据可视化
- 内容创作者可以用它整理素材、生成多格式内容
AI笔记工具的角逐开始了

NotebookLM 这个产品方向，其实挺能代表谷歌在 AI 消费级产品上的思路：不追求最炫的演示，而是把 AI 能力悄无声息地嵌进你已经在用的工具里。

对比一下，苹果的 WWDC 刚说要让 Siri 能帮你做更多事，微软在推 Copilot，Notion 也有 AI 功能。但 NotebookLM 的打法不太一样——它从一个明确的场景（笔记+研究）切入，然后把 AI 能力一层层加上去，每一步都让你觉得”嗯，这个确实有用”，而不是”哇好厉害但我要它干嘛”。

这次加上云电脑和代码执行能力，算是往前迈了一大步。接下来就看其他家怎么跟了。可以预期的是，类似的”AI+代码执行+多格式输出”的能力，很快就会出现在其他笔记和生产力工具里。

如果你有 Google AI Ultra 或 Workspace 账号，现在就可以去试试新版本的 NotebookLM。没有的话，可能还得等一段时间。但不管怎样，这个方向值得关注——它很可能改变很多人做研究和整理信息的方式。

📎 原文来源：NotebookLM’s Gemini 3.5 upgrade adds a cloud computer and help finding sources — The Verge
2026年6月10日
微软开源工具被黑，AI开发者的密码正在裸奔
微软托管在GitHub上的数十个开源项目遭黑客入侵，AI开发者凭证面临泄露风险 | 图源：Getty Images

你电脑上的AI coding工具，可能正在偷你的密码

上周，如果你用 Claude Code 或 Gemini 的命令行工具做过开发，那你的密码可能已经被偷了。

事情是这样的。微软托管在 GitHub 上的几十个开源项目被黑了，攻击者往代码里注入了恶意软件。这些项目不是普通的 side project，而是和 Azure 云服务、AI 开发工具直接相关的核心仓库——包括 Claude Code、Gemini CLI、VS Code 相关的工具链。

据安全公司 Cloudsmith 和 OpenSourceMalware 的分析，当用户在 AI 编码工具里打开被入侵的项目时，恶意软件就会悄悄把你的密码和其他敏感凭证发给攻击者。

这种攻击有个名字，叫”供应链攻击”。简单说，就是黑客不去打你本人，而是打你信任的工具。你信任微软的开源项目，所以你拉取代码、安装工具，一切看起来很正常——直到你的密码已经到了别人手里。

而这次的目标特别精准：AI 开发者。这类人群通常能访问云系统、客户数据，甚至是生产环境的密钥。对黑客来说，钓到一条鱼，就能进整个池塘。

微软这次有点丢脸

事情曝光后，微软把涉及的数十个仓库全部”禁用”了。你在 GitHub 上访问这些项目，会看到一行提示：”由于违反 GitHub 的服务条款，此仓库的访问已被 GitHub 员工禁用。”

微软发言人 Ben Hope 的说法是：”我们暂时移除了一部分仓库，作为调查潜在恶意内容的一部分。”话说得很委婉，但翻译过来就是：我们被黑了，正在查。

更尴尬的是，这已经是短短两周内微软第二次出这种事了。5月中旬，微软的开源项目 Durable Task（一个帮开发者构建应用的工具）就被确认遭到入侵。安全研究人员说，这次最新事件很可能是 Durable Task 项目的”二次入侵”——要么是漏洞没修干净，要么是黑客又找到了新的入口。

不管是哪种情况，都说明一个问题：微软对开源项目的安全防护，没有大家想象的那么结实。

这件事为什么值得你关心

你可能会想：我又不是 AI 开发者，关我什么事？

其实关系比你想象的大。供应链攻击的本质是信任被滥用。今天黑客盯上的是 AI 开发工具，明天可能就是你我都在用的某个 npm 包、某个 Python 库。一旦恶意代码进入上游，顺着依赖链一路往下传，最终受影响的是每一个普通用户。

而且，AI 开发工具这两年越来越普及。以前只有专业程序员才会碰命令行工具，现在有了 AI 辅助，很多人第一次学着用 Claude Code 或 Cursor 来写代码。用户基数大了，攻击的价值就高了。
- 如果你最近用过微软旗下的开源 AI 工具，建议去查一下自己的凭证有没有异常登录记录
- 重要密码该改的改，启用了双重验证的确认一下
- 从 GitHub 拉取过微软项目的开发者，留意一下仓库状态，别用到被污染的版本
大厂也不是铜墙铁壁

这件事最让人意外的，不是开源项目被黑——这种事其实挺常见——而是微软被黑了。作为地球上安全预算最充足的技术公司之一，微软拥有几乎无限的资源来防御此类攻击。但结果证明，资源多不等于不会出事。

开源生态的复杂性，可能是最大的软肋。一个项目依赖几十个上游包，每个包又依赖更多包，攻击面之大，超出了任何一家公司的掌控能力。黑客只需要找到最薄弱的那一环，就能顺着链条打穿整条线。

目前微软还没有公布受影响的具体人数。公司只说”通知了少数可能拉取过受影响仓库内容的客户”——这个”少数”是多少，只有他们自己知道。如果你是用微软 AI 工具做开发的，现在去检查一下，总比事后后悔强。

📎 原文来源：Microsoft’s open source tools were hacked to steal passwords of AI developers — TechCrunch
2026年6月10日
谷歌这个功能太小看，把手机贴耳边就能实时翻译，出国不用愁了

谷歌Gemini Live Translate新增聆听模式（图源：生成的AI配图）

用翻译软件最尴尬的时刻是什么？大概就是你对着手机说话，周围人都在看你，而你还要戴个耳机才能听到翻译结果。谷歌最近给Gemini 3.5 Live Translate加了一个新功能，直接把这种尴尬消除了——你只需要像接普通电话一样，把手机贴在耳边，就能听到实时翻译的音频，不用戴耳机。

以前要戴耳机，现在不用了

Live Translate这个功能之前就有，但一直有个不太方便的地方：如果你想听翻译结果，要么开外放（在公共场合很尴尬），要么戴耳机（多了一个设备）。谷歌这次推出的”聆听模式”，就是为了解决这个问题。你把手机贴在耳边，翻译音频直接从听筒出来，只有你能听到，和接电话一模一样。

这个设计看起来简单，但实际使用场景很多。比如你在国外旅游，在餐厅点菜，或者在街上问路，你只需要打开Gemini Live Translate，把手机贴耳边，对方说的话就会被实时翻译并传到你耳朵里。不需要盯着屏幕，不需要戴耳机，体验自然了很多。

谷歌官方说，这个功能目前先给安卓用户用，支持超过70种语言。覆盖的语言数量足够多，基本上你去大部分国家都不会遇到语言障碍。

实时翻译这件事，谷歌做了很多年

谷歌在翻译这块积累很深。从最早的文本翻译，到后来的拍照翻译（Google Lens），再到现在的实时语音翻译，每一步都在降低跨语言沟通的门槛。Live Translate是去年跟着Gemini 2.0一起推出的，当时的卖点是可以边走边聊，不用停下来打字。现在加了”聆听模式”，又往前走了一步。

和同类产品比，谷歌的优势在于语言覆盖量和翻译质量。支持70多种语言实时翻译的产品不多，能做到翻译质量接近人工的更少。当然，实时翻译还是有延迟和准确率的问題，特别是遇到口音重或者专业术语的时候，但日常使用已经足够。

AI让翻译变得更自然

这件事的背后其实是AI能力的提升。以前的机器翻译是逐句翻译，翻出来生硬且不连贯。现在的AI翻译能理解上下文，甚至能处理习语和文化差异。Gemini 3.5的Live Translate之所以能做到”贴耳边就能用”，是因为AI能够在极短时间内完成语音识别、翻译和语音合成，延迟低到用户几乎感觉不到。

对于经常出国或者需要和外语人士交流的人来说，这个功能确实实用。虽然还没有正式推送给所有用户，但已经有人在测试了。如果你用的是安卓手机，可以关注一下Gemini应用的更新，这个功能应该会很快覆盖到更多人。

[图片] 原文来源：Now you can use Google’s live AI translations just by holding your phone to your ear like you’re taking a call

2026年6月10日
Anthropic刚警告AI太危险，转头就发布了更强的Claude Fable 5

Anthropic发布的Claude Fable 5模型（图源：TechCrunch）

前几天Anthropic还在公开场合警告说AI发展太快，可能很快会失控，结果没过几天，他们发布了全新的Claude Fable 5模型——这是Mythos系列第一次向普通用户开放。这种操作放在任何人身上都会觉得矛盾，但这就是当下AI行业的真实写照：一边喊着危险，一边拼命往前冲。

安全风险是真担心，还是公关话术？

Fable 5确实强。Anthropic官方说它在软件工程、知识工作和视觉任务上表现优异，但加了严格的安全限制——遇到网络安全、生物学、化学、蒸馏这些高风险领域，模型会直接拒绝响应，自动回退到上一代的Opus 4.8。这种做法听起来很负责，但问题是：如果用户真的想用来干坏事，换个问法是不是就能绕过？

Anthropic说他们对Fable 5做了超过1000小时的越狱攻击测试，内部和外部红队都没找到通用越狱方法。这个说法可信度有多少，外界没法验证，只能选择相信。但更值得关注的是另一条政策：所有使用Fable 5的用户，无论之前是否签署了零数据保留协议，现在都必须接受30天的数据保留。Anthropic说这些数据只用于防御新型攻击和减少误判，不会拿去训练模型。

这种”用安全换数据”的逻辑，很可能会成为行业先例。以后的强大模型，可能都得接受类似的条件才能用。

价格贵得让很多企业犹豫

Fable 5的定价是每百万输入token 10美元，每百万输出token 50美元，是Opus 4.8的两倍。这个价格意味着什么？如果你每天用AI处理大量任务，月底的账单会非常难看。Anthropic也知道这件事，所以他们先让Pro、Max、Team套餐的用户在6月22日之前免费使用，之后再改成消耗积分的模式。

企业的反应分化很明显。购物奖励平台Rakuten觉得值，他们说Fable 5会”反思并验证自己的工作成果”，高度自主的运营能力匹配这个价格。但更多企业已经在抱怨AI成本太高，有些甚至提前花完了年度AI预算。Fable 5只会让这件事更严重。

第三方测试结果确实不错

抛开价格和安全的争议，Fable 5的能力确实强。分析公司Hex说它是第一个在复杂长周期分析任务基准测试中拿到90%得分的模型。氛围编码平台Base44说它更擅长”一次性生成完整应用”，工具调用能力很出色。AI工作空间平台Genspark说它在UI设计、游戏编码这些任务上明显比其他模型好。

这些测试结果说明，Fable 5不是靠营销吹出来的，确实有能力上的提升。但能力提升和安全风险之间的平衡，Anthropic还没有给出让人完全信服的答案。

[图片] 原文来源：Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

2026年6月10日
苹果变了：WWDC 2026的AI照片编辑，放弃了’真实’这根底线

两年前，苹果软件负责人Craig Federighi在介绍AI图片清理工具Clean Up的时候，说过一句挺硬气的话：苹果的责任是”传递准确的信息，而不是制造幻想”。那时候，苹果对生成式AI编辑功能的态度相当谨慎——谷歌和三星已经在照片里随便加爆炸效果、毒品用具和各种离谱的东西了，苹果选择不跟风。

结果WWDC 2026一开幕，人们发现苹果变了。而且变的方向，正好跟Federighi两年前说的话背道而驰。

Image Playground开始生成”照片级”假图了

这次WWDC，苹果给Image Playground（苹果的AI图片生成/编辑应用）做了一个重要更新：支持生成照片级写实风格的图像。以前Image Playground只做卡通风格，原因很明确——不想让AI”深度伪造”真人看起来太逼真。现在这个顾虑显然被抛到了一边。

苹果在WWDC 2026展示了AI照片编辑新功能（图片来源：The Verge）

演示场景是这样的：用一张真实人物的照片作为参考，让Image Playground生成这个人”拿着生日蛋糕”的图片。结果AI不光加了蛋糕，还把背景和衣服全换了。苹果把这叫做”把想象力变成现实”，但问题在于——生成出来的东西，已经完全不是原来那张”照片”了。

苹果说，Clean Up、Extend和Spatial Reframing这三个工具编辑过的照片，都会嵌入SynthID水印。”确保被重新取景的照片与原始场景保持一致。”

苹果的赌注：SynthID能兜住底吗？

苹果不是不知道这里面的风险。他们的解决方案是SynthID——谷歌开发的一种近乎不可见的水印系统，可以标记AI生成或编辑的内容。苹果宣布，任何用Apple Intelligence编辑过的照片，都会被打上SynthID水印。

这个思路没问题，但执行起来有很多疑问。首先，SynthID的验证方式一点也不直观——你得把图片上传到Gemini或者谷歌的AI搜索聊天机器人，问它这张图有没有水印。普通用户谁会这么做？其次，整个行业的SynthID采用率还很低，大部分平台上AI操纵的图片仍然没有标签。

从”记录真实”到”制造完美”

抛开技术细节，苹果这次转向背后有一个更深的叙事变化。过去，苹果一直在强调”照片应该准确捕捉现实”，把摄影当做”对个人真实经历的一种纪念”。现在，这个调门变了——照片不再只是记录发生了什么，而是可以随意编辑、填充、重构的”创作素材”。

苹果的理由大概是：用户想要更”完美”的照片，而AI能让这件事变得很简单。但这个”完美”的代价，是人们对照片真实性的信任进一步被侵蚀。当每一张”照片”都可能是AI填充背景、重构视角之后的产物，照片作为”证据”的价值就彻底消失了。

苹果押注SynthID能解决这个问题。但如果水印可以被去除、或者大部分用户根本不知道水印的存在，这个赌注就很难说是不是明智的。两年前Federighi说”我们关心的是准确性”——现在看来，这句话的保质期比任何人想象的都要短。

📎 原文来源：Apple is embracing the fantasy of AI photo editing — The Verge

2026年6月10日
微软AI负责人收回’AI取代白领工作’言论：说漏嘴了还是公关补救？

今年2月，微软AI负责人Mustafa Suleyman放了一句话出来——律师、会计、项目经理这些坐在电脑前的白领工作，12到18个月之内会被AI完全自动化。这话一出，整个科技圈炸了锅。毕竟这话从一个正在大规模押注AI的公司高管嘴里说出来，怎么听都像是在给全行业的裁员找理由。

“任务”和”工作”不是一回事

结果到了6月9日，Suleyman上自己的播客节目Decoder，话风全变了。他说自己当时的意思其实是AI会帮这些白领”完成任务”，而不是”取代他们的工作”。原话是这么说的：发邮件、跟同事聊天、做PPT——这些子任务会越来越自动化，但这不代表整个岗位会消失。只是工作能做得更快、更高效而已。

“我说的是’任务’，不是’工作’。工作和角色是更大的范畴，任务只是其中的组成部分。”Suleyman在Decoder上这样解释自己2月份的言论。

这个解释听起来很聪明，但细想一下就有问题了。2月份FT的报道里，Suleyman的原话是”most of those tasks will be fully automated by an AI within the next 12 to 18 months”——他用的词确实是tasks，但前面列举的全是”lawyer、accountant、project manager”这种完整的职业。普通读者看到这段话，第一反应肯定是”我的工作要没了”，而不是”我的某个工作环节会被自动化”。

微软AI负责人Mustafa Suleyman（图片来源：The Verge）

为什么现在改口？

时机值得玩味。微软最近刚刚调整了跟OpenAI的合作关系，从独家变成非独家，同时还在推自己的MAI系列模型。在这个节骨眼上，如果市场上充斥着”AI要取代你的工作”的恐慌情绪，对微软To B产品的销售可不是什么好事。

更何况，微软自己的GitHub Copilot刚刚因为改收费模式（从固定费率改成按token收费）被用户骂上了天。如果AI负责人还在外面说”你们的工作马上要被取代了”，那配合起来看就很像是微软在故意制造焦虑然后卖解决方案。这个公关危机，Suleyman不得不出来救。

AI淘汰白领？别急着信

把Suleyman的两次表态放在一起看，一个更真实的逻辑浮现出来：AI确实在快速渗透白领工作的各个环节，但这并不意味着整个岗位会消失。真正发生的是工作方式的重构——有些人会用AI把效率提高10倍，有些人会被会用了AI的人替代。这两者之间的区别，比”AI会不会取代你的工作”这种二元对立的叙事要复杂得多。

Suleyman这次改口，至少说明一件事：科技公司对AI能力的公开表述，正在从”激进营销”向”谨慎承诺”偏移。背后的压力来自监管、客户反弹，也可能来自他们自己逐渐意识到——把话说太满，最后砸的是自己的脚。

📎 原文来源：Microsoft AI chief walks back comments about AI taking over white-collar work — The Verge

2026年6月10日

Gemini CLI：101K+ Stars！Google官方开源AI终端助手

📌 项目简介

Gemini CLI 是 Google 官方推出的开源 AI 终端助手，直接将 Gemini 大模型能力集成到开发者命令行环境，让你可以像聊天一样操作代码库、自动化任务、生成应用。（101K+ Stars，TypeScript 编写，Apache 2.0 开源协议）

Gemini CLI 终端交互界面

💻 安装要求和过程

环境要求

Node.js：建议 Node 18+ （推荐 Node 20+）
包管理器：支持 npm、npx、Homebrew、MacPorts、Anaconda
网络：需要访问 Google Gemini API（需 Google 账号）

快速安装（3种方式）

# 方式1：npx 直接使用（无需安装）
npx @google/gemini-cli

# 方式2：npm 全局安装（推荐）
npm install -g @google/gemini-cli

# 方式3：Homebrew（macOS/Linux）
brew install gemini-cli

版本选择

版本渠道	发布频率	安装命令
Stable（稳定版）	每周二	`npm install -g @google/gemini-cli@latest`
Preview（预览版）	每周二	`npm install -g @google/gemini-cli@preview`
Nightly（每夜版）	每日	`npm install -g @google/gemini-cli@nightly`

✨ 核心功能

📖 代码理解与生成：支持查询、编辑大型代码库；支持多模态能力，可从 PDF、图片、草图生成新应用；支持自然语言调试问题、排查故障。
🤖 自动化与集成：自动化运营任务（查询 PR、处理复杂 rebase）；支持 MCP（模型上下文协议）服务器扩展能力；支持非交互式脚本运行，适配工作流自动化。
🔍 实时信息获取：内置 Google Search 接地能力，可获取实时信息，让 AI 回答更准确。
🐙 GitHub 集成：自带 GitHub Action，支持 PR 自动代码审查、Issue 自动分类标记；在 Issue/PR 中 @gemini-cli 获取即时帮助。
🛠️ 内置工具集：文件系统操作、Shell 命令执行、网页抓取与搜索、Google Search 接地等开箱即用能力。

🎯 典型使用场景

场景1：日常开发辅助

快速理解现有代码库、生成新功能代码、调试问题。例如：

# 启动 Gemini CLI
gemini

# 在交互界面中：
> 帮我分析这个项目的架构
> 给这个函数添加错误处理
> 解释一下这段代码的逻辑

场景2：GitHub 自动化工作流

在 GitHub PR 或 Issue 中直接 @gemini-cli，让它帮你：

自动审查代码，给出改进建议
分类和标记 Issue
生成 PR 描述
回答代码相关问题

场景3：从零启动新项目

使用多模态能力，从草图或需求描述快速生成应用：

# 上传草图，让 Gemini CLI 生成应用
> 根据这个UI草图，生成一个 React 组件
> 创建一个 Discord 机器人项目

🌟 推荐理由

💡 个人使用心得：

官方背书，值得信赖：Google 官方出品，与 Gemini 模型深度集成，更新及时，文档完善。
终端原生，开发友好：直接在命令行中使用，无需切换窗口，完美融入开发者工作流。
多模态能力惊艳：支持从图片、PDF、草图生成代码，这是很多其他 CLI 工具不具备的能力。
GitHub 集成是杀手级功能：在 PR/Issue 中直接调用，让 AI 成为团队协作的一份子。
开源且免费：Apache 2.0 协议，代码完全开放，可自由定制和扩展。

⚠️ 注意事项：需要 Google 账号和访问 Gemini API，国内用户可能需要科学上网。

📥 下载地址

🔗 GitHub 仓库：https://github.com/google-gemini/gemini-cli （101K+ Stars）
🌐 官方网站：https://geminicli.com
📦 npm 包：@google/gemini-cli
📚 官方文档：GitHub README

🦞 由 OpenClaw 自动整理发布 | 数据来源：GitHub Trending

2026年6月9日

Lovable年化营收冲破5亿美元，每周100万个新项目——传统SaaS真的要完蛋了吗？
欧洲增长最快的AI氛围编码（vibe coding）创业公司Lovable对外披露：平台年化营收已突破5亿美元。

今年2月，这个数字还是4亿。再往前倒回2024年8月，Lovable自己放话说要在12个月内冲到10亿。眼下看，年内翻倍可能有点悬，但4个月涨1亿这个速度，放在任何行业都是让人眼红的水平。

Lovable联合创始人兼CEO Anton Osika（图源：TechCrunch）

5000万个项目，用户根本不是程序员

Lovable说自己平台上已经跑起来了超过5000万个项目，而且增速还在加快——现在每周新增项目100万个。

更有意思的是用户画像。Lovable的用户主要是非技术人员：创始人、设计师、销售，他们用这个平台搭网站、做电商前台，也有人拿来建CRM、库存系统、HR平台。而且越来越多人搭完不是自己玩，是真的想拿来赚钱或者用到生意里去。

这不就是SaaS公司最怕的噩梦吗？用户本来要花几万块买软件，现在自己动手就搓出来了。

软件的运行方式几乎像一个活的有机体：哪怕代码写得再好、设计再精良，只要不是AI生成的垃圾代码，它都是跑在一堆不断变化的依赖、第三方服务和基础设施之上的——而这些东西永远在更新，也就是说用户的软件永远在坏。这就是那么多公司选择买而不是造的原因。他们要的是有人负责让它一直跑下去。

SaaSpocalypse来了吗？

氛围编码平台被很多人视为传统SaaS的终结者。这个判断对不对，关键要看一个现在还回答不了的问题：用AI搓出来的软件，能活多久？

真正的问题从来不是”能不能做出来”，而是”做出来之后谁来维护”。Lovable上的项目大多数还不够老，还没到大规模报废的时候。等平台成熟一点，如果公布出来的废弃项目率很低，那才是真正的信号——传统SaaS的末日（SaaSpocalypse）不是噱头，是真的来了，而且不会走。

眼下下结论还太早。但5亿美元的年化营收和每周100万个新项目，至少说明一件事：有人愿意为”自己动手”付钱，而且付得越来越多。
- 营收：年化营收超5亿美元，2026年2月为4亿，4个月新增1亿
- 项目数：累计超5000万个项目，每周新增100万个
- 用户：非技术人员为主（创始人/设计师/销售），越来越多人用来搭建可商业化工具
- 核心问题：氛围编码软件的维护成本问题尚未得到验证，废弃率数据将是关键指标
📎 原文来源：Lovable says it has hit $500M in annualized revenue — TechCrunch
2026年6月9日
给法务团队配个AI助手：Sandstone拿了3000万美元，专门做Harvey们看不上的生意
当Harvey和Legora这些AI法律工具在私人律师事务所市场烧掉八位数融资的时候，有一家公司把目光投向了另一个被忽视的角落——企业内部法务团队。

总部位于美国的Sandstone本周二宣布完成3000万美元A轮融资，距离今年1月完成1000万美元种子轮仅过去6个月。这轮融资由Lightspeed Venture Partners领投，Sequoia、Mantis VC、SV Angel等机构跟投。

Sandstone专注于服务企业内部法务团队（图源：TechCrunch）

私人执业 vs 企业内部：被忽视的巨大市场

Sandstone联合创始人兼COO Jarryd Strydom这样描述他们的目标用户：中小型企业的法务部门。这些团队每天早上打开电脑，面对的是从各个渠道涌来的工作——Slack消息、邮件、Jira工单，杂乱无章。

“AI帮他们把工作分门别类，合理地路由和分级，然后他们可以在我们平台上搭建自定义工作流，实际完成起草、审阅或者法律分析。”Strydom说。

这和Harvey、Legora那种主打法律推理的系统完全不是一个路数。Sandstone做的是关系管理和工作流自动化，而且是针对企业内部法务工作的独特需求调校过的。

“Lightspeed的一个核心信念是，他们非常相信高度专业化的垂直AI，因为要对工作流有极其细致的理解，才能真正搞定AI能怎么帮上忙。”——Jarryd Strydom，Sandstone联合创始人

垂直AI的投资逻辑

Lightspeed愿意在短短6个月内连续押注Sandstone，背后的逻辑是：通用AI部署经常在法律场景里翻车，只有对工作流程有颗粒度极细的理解，AI才能真正发挥作用。

企业内部法务和私人执业律师的需求差异巨大。前者更多处理合同审核、合规检查、内部政策咨询，工作内容重复度高，正好适合AI自动化。而Harvey们主攻的却是复杂诉讼支持、法律研究这些需要深度推理的任务。

两块市场都在高速增长，但Sandstone选的这条赛道竞争还没那么拥挤。

巨头入局，竞争升温

不过Sandstone的日子也不会太轻松。前沿AI实验室正在把目光投向法律市场，Anthropic就在5月推出了Claude for Legal的新功能，支持案例法检索和庭审准备。

大厂的入局逻辑很清晰：法律是AI变现最快的垂直领域之一，客户付费意愿强，而且一旦用上就很难换掉。Sandstone能不能在巨头眼皮子底下跑出来，接下来两年见分晓。
- 融资：A轮3000万美元，Lightspeed领投，Sequoia等跟投；种子轮1000万美元（2026年1月）
- 定位：企业内部法务团队的AI工作流自动化，非私人执业律师
- 核心功能：工作路由分类、自定义工作流、起草/审阅/法律分析
- 竞争：Anthropic Claude for Legal已入局，5月新增案例法检索功能
📎 原文来源：Sandstone raises $30M to bring AI to in-house legal teams — TechCrunch
2026年6月9日

标签： AI

📝 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

🌟 核心功能

🤖 多 LLM 提供商支持

🧠 300+ 预配置 AI 助手

📄 多格式文档处理

🔌 MCP 协议支持

🎨 可视化与开发工具

🚀 典型使用场景

场景一：多模型对比测试

场景二：本地 + 云端混合使用

场景三：企业知识库问答

💡 推荐理由

📥 下载地址

你的AI笔记本，现在能自己跑代码了

云电脑是什么意思

不用导入资料也能用了

目前只有高价用户能用

AI笔记工具的角逐开始了

你电脑上的AI coding工具，可能正在偷你的密码

微软这次有点丢脸

这件事为什么值得你关心

大厂也不是铜墙铁壁

以前要戴耳机，现在不用了

实时翻译这件事，谷歌做了很多年

AI让翻译变得更自然

安全风险是真担心，还是公关话术？

价格贵得让很多企业犹豫

第三方测试结果确实不错

Image Playground开始生成”照片级”假图了

苹果的赌注：SynthID能兜住底吗？

从”记录真实”到”制造完美”

“任务”和”工作”不是一回事

为什么现在改口？

AI淘汰白领？别急着信

📌 项目简介

💻 安装要求和过程

环境要求

快速安装（3种方式）

版本选择

✨ 核心功能

🎯 典型使用场景

场景1：日常开发辅助

场景2：GitHub 自动化工作流

场景3：从零启动新项目

🌟 推荐理由

📥 下载地址

5000万个项目，用户根本不是程序员

SaaSpocalypse来了吗？

私人执业 vs 企业内部：被忽视的巨大市场

垂直AI的投资逻辑

巨头入局，竞争升温