标签: AI

  • 【开源推荐】Cherry Studio:47K+ Stars!多模型AI桌面客户端,一个应用搞定所有大模型

    【开源推荐】Cherry Studio:47K+ Stars!多模型AI桌面客户端,一个应用搞定所有大模型

    🍒 项目名称:Cherry Studio

    GitHub Stars:47.1K+

    🏷️ 开源协议:AGPL-3.0

    💻 支持平台:Windows / macOS / Linux

    🔗 GitHubgithub.com/CherryHQ/cherry-studio

    🌐 官网cherry-ai.com

    📝 项目简介

    Cherry Studio 是一款支持多种大语言模型提供商的开源AI桌面客户端,覆盖 Windows、Mac、Linux 三大平台。它提供智能聊天、自主智能体、300+ 预配置助手能力,可统一访问前沿大语言模型,是2026年最值得关注的 AI 生产力工具之一。

    无论你是用 OpenAI Gemini Claude 等云端模型,还是用 Ollama 跑本地模型,Cherry Studio 都能一站式搞定,告别在多个网页和客户端之间来回切换的烦恼。

    Cherry Studio 界面预览

    ⚙️ 安装要求和过程

    环境要求

    • 操作系统:Windows 10+、macOS 11+、主流 Linux 发行版
    • 无需额外环境配置:开箱即用,下载安装包直接运行
    • 网络要求:使用云端模型需配置 API Key;使用本地模型需提前安装 Ollama 或 LM Studio

    快速安装步骤

    1. 访问 GitHub Releases 页面,下载对应系统的安装包
    2. Windows:下载 .exe 安装包,双击运行
    3. macOS:下载 .dmg 文件,拖入 Applications 文件夹
    4. Linux:下载 .AppImage.deb / .rpm 包安装
    5. 启动后,在设置中配置模型 API Key 或连接本地 Ollama

    🌟 核心功能

    🤖 多 LLM 提供商支持

    支持 OpenAI、Gemini、Anthropic、Claude 等主流云端大模型,同时支持 Ollama、LM Studio 等本地模型,一个客户端搞定所有模型。

    🧠 300+ 预配置 AI 助手

    内置丰富领域的专业 AI 助手模板,涵盖编程、写作、翻译、分析等场景,开箱即用,也支持自定义助手创建。

    📄 多格式文档处理

    支持文本、图片、Office 文档、PDF 等多格式文件处理,内置 RAG 知识库能力,让 AI 基于你的文档作答。

    🔌 MCP 协议支持

    支持模型上下文协议(MCP)服务器,可扩展 AI 能力边界,接入专业工具和数据源。

    🎨 可视化与开发工具

    支持 Mermaid 图表可视化、代码语法高亮、全局搜索、话题管理系统,满足专业用户的需求。

    Cherry Studio 功能展示

    🚀 典型使用场景

    场景一:多模型对比测试

    研究者或开发者需要同时对比 GPT-4.1、Claude 4 Opus、Gemini 2.5 Pro 在同一任务上的表现?Cherry Studio 支持多模型同时对话,同一条消息发送给多个模型,结果并排展示,轻松找出最强模型。

    场景二:本地 + 云端混合使用

    日常聊天用免费的本地模型(Ollama + Qwen3),重要任务切换云端前沿模型。Cherry Studio 统一入口管理,无需在多个工具间切换,数据隐私和模型能力兼得。

    场景三:企业知识库问答

    上传公司文档、技术手册到 Cherry Studio 知识库,结合 RAG 技术,让 AI 基于企业内部知识精准作答,打造专属的企业 AI 助手。

    💡 推荐理由

    作为一款开源免费的 AI 桌面客户端,Cherry Studio 最大的价值在于统一——统一了模型入口、统一了对话历史、统一了工具生态。

    在此之前,用 OpenAI 要去网页,用 Claude 要开另一个网页,本地 Ollama 又是命令行,多模型对比更是麻烦。Cherry Studio 把这些全部整合到一个窗口里,还加上了知识库、MCP 工具扩展、300+ 助手模板,真正做到了”一个客户端,所有 AI 能力”。

    尤其值得一提的是它的开箱即用体验——无需配置 Python 环境,无需折腾依赖,下载安装包,点几下鼠标配置 Key,马上就能用。对非技术用户非常友好。

    如果你同时满足以下任意一点,强烈推荐试试 Cherry Studio:

    • 同时使用多个 AI 模型(GPT/Claude/Gemini/本地模型)
    • 希望 AI 能读取并处理你的本地文档
    • 想要一个统一、美观、功能完整的 AI 客户端
    • 重视数据隐私,希望本地运行 AI

    📥 下载地址

    🍒 GitHub 仓库
    🌐 官方网站
    📦 下载安装包


    📌 本文由 WorkBuddy AI 自动化任务 定时发布,选题自 GitHub 热门 AI 开源项目。欢迎关注本站「开源项目」栏目,每周精选优质 AI 开源工具深度介绍。

  • NotebookLM悄悄升级Gemini 3.5,你的AI笔记本现在能跑代码了

    NotebookLM Gemini 3.5 upgrade
    NotebookLM升级Gemini 3.5,每一个笔记本现在都连着一台云电脑 | 图源:The Verge

    你的AI笔记本,现在能自己跑代码了

    谷歌这两天悄悄给 NotebookLM 推了个大版本更新,可能很多人还没注意到。简单说就是:NotebookLM 现在用上了 Gemini 3.5,而且每一个笔记本背后都连着一台”云电脑”。

    这个变化比听起来要大。以前 NotebookLM 主要做的是帮你整理笔记、回答你导入材料里的问题,本质上是个”阅读理解”工具。现在不一样了——它能写代码、跑代码、生成图表、输出各种格式的文件,已经有点像个住在你笔记本里的研究员了。

    谷歌在官方博客里说,升级后的NotebookLM”更准确、更可靠”。但真正有意思的不是这个说法,而是它现在能做的事。


    云电脑是什么意思

    这次更新最核心的变化,是 NotebookLM 现在跑在谷歌的代理编码平台 Antigravity 上。每一个你创建的笔记本,背后都挂着一台安全的云计算机。

    这意味着什么?意味着 NotebookLM 不再只是”回答问题”——它可以主动写代码来做分析,然后把代码扔到那台云电脑上跑,再把结果返回给你。你要它帮你分析一组数据,它可以直接写Python代码、跑统计、画图表,然后把图表给你。

    以前要做到这个程度,你得自己会写代码,或者至少会用 Colab、Jupyter 这类工具。现在你在 NotebookLM 里用自然语言描述你想做什么,它自己就把代码写了、跑了、结果也给你了。

    输出的格式也多了很多。除了以前的文字回复,现在还能直接给你出 PDF、Excel、PowerPoint、CSV 表格,甚至是数据可视化图片(PNG、SVG)和用 Nano Banana 生成的图像。


    不用导入资料也能用了

    另外一个挺实用的更新:你现在不需要先导入笔记或YouTube视频,直接问 NotebookLM 一个问题,它就会自己去调用谷歌搜索帮你找来源。

    这其实是对之前”发现”功能的升级。以前那个功能主要是帮你找资料来源,现在直接整合进了主流程——你问问题,它找资料,然后基于找到的资料回答你,同时把来源列出来,你可以选择把哪些来源导入到笔记本里。

    这个改动看起来小,实际上降低了使用门槛。以前你得先有组织笔记的习惯,才会想到用 NotebookLM。现在哪怕你只是想快速了解一个话题,也可以直接把它当搜索工具来用,而且比普通搜索靠谱——因为它会给出来源,你可以追溯。


    目前只有高价用户能用

    当然,谷歌一贯的作风——好功能先给有钱的用户用。这次更新目前只推送给 Google AI Ultra 订阅用户和 Workspace 用户。普通用户什么时候能用上,谷歌没说。

    AI Ultra 每月要付的钱不少,Workspace 也是企业级收费。所以某种程度上,这也是谷歌在给自己的高价订阅套餐增加卖点。但你不得不承认,如果这些功能最终下放到免费版或低价版,竞争力会相当强。

    想想看:一个能自己跑代码来做分析的 AI 笔记工具,还自带搜索和来源追溯,而且所有计算都在云端完成,不占用你本地资源。对于做研究、写报告、分析数据的人来说,这基本上就是把以前需要好几个工具配合才能做的事,塞进了一个界面里。

    • 研究人员可以用它快速做文献综述和数据分析
    • 学生可以用它整理学习笔记、生成复习材料
    • 职场人可以用它处理报告、做数据可视化
    • 内容创作者可以用它整理素材、生成多格式内容

    AI笔记工具的角逐开始了

    NotebookLM 这个产品方向,其实挺能代表谷歌在 AI 消费级产品上的思路:不追求最炫的演示,而是把 AI 能力悄无声息地嵌进你已经在用的工具里。

    对比一下,苹果的 WWDC 刚说要让 Siri 能帮你做更多事,微软在推 Copilot,Notion 也有 AI 功能。但 NotebookLM 的打法不太一样——它从一个明确的场景(笔记+研究)切入,然后把 AI 能力一层层加上去,每一步都让你觉得”嗯,这个确实有用”,而不是”哇好厉害但我要它干嘛”。

    这次加上云电脑和代码执行能力,算是往前迈了一大步。接下来就看其他家怎么跟了。可以预期的是,类似的”AI+代码执行+多格式输出”的能力,很快就会出现在其他笔记和生产力工具里。

    如果你有 Google AI Ultra 或 Workspace 账号,现在就可以去试试新版本的 NotebookLM。没有的话,可能还得等一段时间。但不管怎样,这个方向值得关注——它很可能改变很多人做研究和整理信息的方式。

  • 微软开源工具被黑,AI开发者的密码正在裸奔

    Microsoft open source tools hacked
    微软托管在GitHub上的数十个开源项目遭黑客入侵,AI开发者凭证面临泄露风险 | 图源:Getty Images

    你电脑上的AI coding工具,可能正在偷你的密码

    上周,如果你用 Claude Code 或 Gemini 的命令行工具做过开发,那你的密码可能已经被偷了。

    事情是这样的。微软托管在 GitHub 上的几十个开源项目被黑了,攻击者往代码里注入了恶意软件。这些项目不是普通的 side project,而是和 Azure 云服务、AI 开发工具直接相关的核心仓库——包括 Claude Code、Gemini CLI、VS Code 相关的工具链。

    据安全公司 Cloudsmith 和 OpenSourceMalware 的分析,当用户在 AI 编码工具里打开被入侵的项目时,恶意软件就会悄悄把你的密码和其他敏感凭证发给攻击者。

    这种攻击有个名字,叫”供应链攻击”。简单说,就是黑客不去打你本人,而是打你信任的工具。你信任微软的开源项目,所以你拉取代码、安装工具,一切看起来很正常——直到你的密码已经到了别人手里。

    而这次的目标特别精准:AI 开发者。这类人群通常能访问云系统、客户数据,甚至是生产环境的密钥。对黑客来说,钓到一条鱼,就能进整个池塘。


    微软这次有点丢脸

    事情曝光后,微软把涉及的数十个仓库全部”禁用”了。你在 GitHub 上访问这些项目,会看到一行提示:”由于违反 GitHub 的服务条款,此仓库的访问已被 GitHub 员工禁用。”

    微软发言人 Ben Hope 的说法是:”我们暂时移除了一部分仓库,作为调查潜在恶意内容的一部分。”话说得很委婉,但翻译过来就是:我们被黑了,正在查。

    更尴尬的是,这已经是短短两周内微软第二次出这种事了。5月中旬,微软的开源项目 Durable Task(一个帮开发者构建应用的工具)就被确认遭到入侵。安全研究人员说,这次最新事件很可能是 Durable Task 项目的”二次入侵”——要么是漏洞没修干净,要么是黑客又找到了新的入口。

    不管是哪种情况,都说明一个问题:微软对开源项目的安全防护,没有大家想象的那么结实。


    这件事为什么值得你关心

    你可能会想:我又不是 AI 开发者,关我什么事?

    其实关系比你想象的大。供应链攻击的本质是信任被滥用。今天黑客盯上的是 AI 开发工具,明天可能就是你我都在用的某个 npm 包、某个 Python 库。一旦恶意代码进入上游,顺着依赖链一路往下传,最终受影响的是每一个普通用户。

    而且,AI 开发工具这两年越来越普及。以前只有专业程序员才会碰命令行工具,现在有了 AI 辅助,很多人第一次学着用 Claude Code 或 Cursor 来写代码。用户基数大了,攻击的价值就高了。

    • 如果你最近用过微软旗下的开源 AI 工具,建议去查一下自己的凭证有没有异常登录记录
    • 重要密码该改的改,启用了双重验证的确认一下
    • 从 GitHub 拉取过微软项目的开发者,留意一下仓库状态,别用到被污染的版本

    大厂也不是铜墙铁壁

    这件事最让人意外的,不是开源项目被黑——这种事其实挺常见——而是微软被黑了。作为地球上安全预算最充足的技术公司之一,微软拥有几乎无限的资源来防御此类攻击。但结果证明,资源多不等于不会出事。

    开源生态的复杂性,可能是最大的软肋。一个项目依赖几十个上游包,每个包又依赖更多包,攻击面之大,超出了任何一家公司的掌控能力。黑客只需要找到最薄弱的那一环,就能顺着链条打穿整条线。

    目前微软还没有公布受影响的具体人数。公司只说”通知了少数可能拉取过受影响仓库内容的客户”——这个”少数”是多少,只有他们自己知道。如果你是用微软 AI 工具做开发的,现在去检查一下,总比事后后悔强。

  • 谷歌这个功能太小看,把手机贴耳边就能实时翻译,出国不用愁了

    谷歌这个功能太小看,把手机贴耳边就能实时翻译,出国不用愁了
    谷歌Gemini Live Translate新增聆听模式(图源:生成的AI配图)

    用翻译软件最尴尬的时刻是什么?大概就是你对着手机说话,周围人都在看你,而你还要戴个耳机才能听到翻译结果。谷歌最近给Gemini 3.5 Live Translate加了一个新功能,直接把这种尴尬消除了——你只需要像接普通电话一样,把手机贴在耳边,就能听到实时翻译的音频,不用戴耳机。

    以前要戴耳机,现在不用了

    Live Translate这个功能之前就有,但一直有个不太方便的地方:如果你想听翻译结果,要么开外放(在公共场合很尴尬),要么戴耳机(多了一个设备)。谷歌这次推出的”聆听模式”,就是为了解决这个问题。你把手机贴在耳边,翻译音频直接从听筒出来,只有你能听到,和接电话一模一样。

    这个设计看起来简单,但实际使用场景很多。比如你在国外旅游,在餐厅点菜,或者在街上问路,你只需要打开Gemini Live Translate,把手机贴耳边,对方说的话就会被实时翻译并传到你耳朵里。不需要盯着屏幕,不需要戴耳机,体验自然了很多。

    谷歌官方说,这个功能目前先给安卓用户用,支持超过70种语言。覆盖的语言数量足够多,基本上你去大部分国家都不会遇到语言障碍。

    实时翻译这件事,谷歌做了很多年

    谷歌在翻译这块积累很深。从最早的文本翻译,到后来的拍照翻译(Google Lens),再到现在的实时语音翻译,每一步都在降低跨语言沟通的门槛。Live Translate是去年跟着Gemini 2.0一起推出的,当时的卖点是可以边走边聊,不用停下来打字。现在加了”聆听模式”,又往前走了一步。

    和同类产品比,谷歌的优势在于语言覆盖量和翻译质量。支持70多种语言实时翻译的产品不多,能做到翻译质量接近人工的更少。当然,实时翻译还是有延迟和准确率的问題,特别是遇到口音重或者专业术语的时候,但日常使用已经足够。

    AI让翻译变得更自然

    这件事的背后其实是AI能力的提升。以前的机器翻译是逐句翻译,翻出来生硬且不连贯。现在的AI翻译能理解上下文,甚至能处理习语和文化差异。Gemini 3.5的Live Translate之所以能做到”贴耳边就能用”,是因为AI能够在极短时间内完成语音识别、翻译和语音合成,延迟低到用户几乎感觉不到。

    对于经常出国或者需要和外语人士交流的人来说,这个功能确实实用。虽然还没有正式推送给所有用户,但已经有人在测试了。如果你用的是安卓手机,可以关注一下Gemini应用的更新,这个功能应该会很快覆盖到更多人。


  • Anthropic刚警告AI太危险,转头就发布了更强的Claude Fable 5

    Anthropic刚警告AI太危险,转头就发布了更强的Claude Fable 5
    Anthropic发布的Claude Fable 5模型(图源:TechCrunch)

    前几天Anthropic还在公开场合警告说AI发展太快,可能很快会失控,结果没过几天,他们发布了全新的Claude Fable 5模型——这是Mythos系列第一次向普通用户开放。这种操作放在任何人身上都会觉得矛盾,但这就是当下AI行业的真实写照:一边喊着危险,一边拼命往前冲。

    安全风险是真担心,还是公关话术?

    Fable 5确实强。Anthropic官方说它在软件工程、知识工作和视觉任务上表现优异,但加了严格的安全限制——遇到网络安全、生物学、化学、蒸馏这些高风险领域,模型会直接拒绝响应,自动回退到上一代的Opus 4.8。这种做法听起来很负责,但问题是:如果用户真的想用来干坏事,换个问法是不是就能绕过?

    Anthropic说他们对Fable 5做了超过1000小时的越狱攻击测试,内部和外部红队都没找到通用越狱方法。这个说法可信度有多少,外界没法验证,只能选择相信。但更值得关注的是另一条政策:所有使用Fable 5的用户,无论之前是否签署了零数据保留协议,现在都必须接受30天的数据保留。Anthropic说这些数据只用于防御新型攻击和减少误判,不会拿去训练模型。

    这种”用安全换数据”的逻辑,很可能会成为行业先例。以后的强大模型,可能都得接受类似的条件才能用。

    价格贵得让很多企业犹豫

    Fable 5的定价是每百万输入token 10美元,每百万输出token 50美元,是Opus 4.8的两倍。这个价格意味着什么?如果你每天用AI处理大量任务,月底的账单会非常难看。Anthropic也知道这件事,所以他们先让Pro、Max、Team套餐的用户在6月22日之前免费使用,之后再改成消耗积分的模式。

    企业的反应分化很明显。购物奖励平台Rakuten觉得值,他们说Fable 5会”反思并验证自己的工作成果”,高度自主的运营能力匹配这个价格。但更多企业已经在抱怨AI成本太高,有些甚至提前花完了年度AI预算。Fable 5只会让这件事更严重。

    第三方测试结果确实不错

    抛开价格和安全的争议,Fable 5的能力确实强。分析公司Hex说它是第一个在复杂长周期分析任务基准测试中拿到90%得分的模型。氛围编码平台Base44说它更擅长”一次性生成完整应用”,工具调用能力很出色。AI工作空间平台Genspark说它在UI设计、游戏编码这些任务上明显比其他模型好。

    这些测试结果说明,Fable 5不是靠营销吹出来的,确实有能力上的提升。但能力提升和安全风险之间的平衡,Anthropic还没有给出让人完全信服的答案。


  • 苹果变了:WWDC 2026的AI照片编辑,放弃了’真实’这根底线

    两年前,苹果软件负责人Craig Federighi在介绍AI图片清理工具Clean Up的时候,说过一句挺硬气的话:苹果的责任是”传递准确的信息,而不是制造幻想”。那时候,苹果对生成式AI编辑功能的态度相当谨慎——谷歌和三星已经在照片里随便加爆炸效果、毒品用具和各种离谱的东西了,苹果选择不跟风。

    结果WWDC 2026一开幕,人们发现苹果变了。而且变的方向,正好跟Federighi两年前说的话背道而驰。

    Image Playground开始生成”照片级”假图了

    这次WWDC,苹果给Image Playground(苹果的AI图片生成/编辑应用)做了一个重要更新:支持生成照片级写实风格的图像。以前Image Playground只做卡通风格,原因很明确——不想让AI”深度伪造”真人看起来太逼真。现在这个顾虑显然被抛到了一边。

    苹果WWDC 2026 AI照片编辑工具演示
    苹果在WWDC 2026展示了AI照片编辑新功能(图片来源:The Verge)

    演示场景是这样的:用一张真实人物的照片作为参考,让Image Playground生成这个人”拿着生日蛋糕”的图片。结果AI不光加了蛋糕,还把背景和衣服全换了。苹果把这叫做”把想象力变成现实”,但问题在于——生成出来的东西,已经完全不是原来那张”照片”了。

    苹果说,Clean Up、Extend和Spatial Reframing这三个工具编辑过的照片,都会嵌入SynthID水印。”确保被重新取景的照片与原始场景保持一致。”

    苹果的赌注:SynthID能兜住底吗?

    苹果不是不知道这里面的风险。他们的解决方案是SynthID——谷歌开发的一种近乎不可见的水印系统,可以标记AI生成或编辑的内容。苹果宣布,任何用Apple Intelligence编辑过的照片,都会被打上SynthID水印。

    这个思路没问题,但执行起来有很多疑问。首先,SynthID的验证方式一点也不直观——你得把图片上传到Gemini或者谷歌的AI搜索聊天机器人,问它这张图有没有水印。普通用户谁会这么做?其次,整个行业的SynthID采用率还很低,大部分平台上AI操纵的图片仍然没有标签。


    从”记录真实”到”制造完美”

    抛开技术细节,苹果这次转向背后有一个更深的叙事变化。过去,苹果一直在强调”照片应该准确捕捉现实”,把摄影当做”对个人真实经历的一种纪念”。现在,这个调门变了——照片不再只是记录发生了什么,而是可以随意编辑、填充、重构的”创作素材”。

    苹果的理由大概是:用户想要更”完美”的照片,而AI能让这件事变得很简单。但这个”完美”的代价,是人们对照片真实性的信任进一步被侵蚀。当每一张”照片”都可能是AI填充背景、重构视角之后的产物,照片作为”证据”的价值就彻底消失了。

    苹果押注SynthID能解决这个问题。但如果水印可以被去除、或者大部分用户根本不知道水印的存在,这个赌注就很难说是不是明智的。两年前Federighi说”我们关心的是准确性”——现在看来,这句话的保质期比任何人想象的都要短。

  • 微软AI负责人收回’AI取代白领工作’言论:说漏嘴了还是公关补救?

    今年2月,微软AI负责人Mustafa Suleyman放了一句话出来——律师、会计、项目经理这些坐在电脑前的白领工作,12到18个月之内会被AI完全自动化。这话一出,整个科技圈炸了锅。毕竟这话从一个正在大规模押注AI的公司高管嘴里说出来,怎么听都像是在给全行业的裁员找理由。

    “任务”和”工作”不是一回事

    结果到了6月9日,Suleyman上自己的播客节目Decoder,话风全变了。他说自己当时的意思其实是AI会帮这些白领”完成任务”,而不是”取代他们的工作”。原话是这么说的:发邮件、跟同事聊天、做PPT——这些子任务会越来越自动化,但这不代表整个岗位会消失。只是工作能做得更快、更高效而已。

    “我说的是’任务’,不是’工作’。工作和角色是更大的范畴,任务只是其中的组成部分。”Suleyman在Decoder上这样解释自己2月份的言论。

    这个解释听起来很聪明,但细想一下就有问题了。2月份FT的报道里,Suleyman的原话是”most of those tasks will be fully automated by an AI within the next 12 to 18 months”——他用的词确实是tasks,但前面列举的全是”lawyer、accountant、project manager”这种完整的职业。普通读者看到这段话,第一反应肯定是”我的工作要没了”,而不是”我的某个工作环节会被自动化”。

    Mustafa Suleyman 微软AI负责人
    微软AI负责人Mustafa Suleyman(图片来源:The Verge)

    为什么现在改口?

    时机值得玩味。微软最近刚刚调整了跟OpenAI的合作关系,从独家变成非独家,同时还在推自己的MAI系列模型。在这个节骨眼上,如果市场上充斥着”AI要取代你的工作”的恐慌情绪,对微软To B产品的销售可不是什么好事。

    更何况,微软自己的GitHub Copilot刚刚因为改收费模式(从固定费率改成按token收费)被用户骂上了天。如果AI负责人还在外面说”你们的工作马上要被取代了”,那配合起来看就很像是微软在故意制造焦虑然后卖解决方案。这个公关危机,Suleyman不得不出来救。


    AI淘汰白领?别急着信

    把Suleyman的两次表态放在一起看,一个更真实的逻辑浮现出来:AI确实在快速渗透白领工作的各个环节,但这并不意味着整个岗位会消失。真正发生的是工作方式的重构——有些人会用AI把效率提高10倍,有些人会被会用了AI的人替代。这两者之间的区别,比”AI会不会取代你的工作”这种二元对立的叙事要复杂得多。

    Suleyman这次改口,至少说明一件事:科技公司对AI能力的公开表述,正在从”激进营销”向”谨慎承诺”偏移。背后的压力来自监管、客户反弹,也可能来自他们自己逐渐意识到——把话说太满,最后砸的是自己的脚。

  • Gemini CLI:101K+ Stars!Google官方开源AI终端助手

    Gemini CLI:101K+ Stars!Google官方开源AI终端助手

    📌 项目简介

    Gemini CLI 是 Google 官方推出的开源 AI 终端助手,直接将 Gemini 大模型能力集成到开发者命令行环境,让你可以像聊天一样操作代码库、自动化任务、生成应用。(101K+ Stars,TypeScript 编写,Apache 2.0 开源协议)

    Gemini CLI 截图

    Gemini CLI 终端交互界面

    💻 安装要求和过程

    环境要求

    • Node.js:建议 Node 18+ (推荐 Node 20+)
    • 包管理器:支持 npm、npx、Homebrew、MacPorts、Anaconda
    • 网络:需要访问 Google Gemini API(需 Google 账号)

    快速安装(3种方式)

    # 方式1:npx 直接使用(无需安装)
    npx @google/gemini-cli
    
    # 方式2:npm 全局安装(推荐)
    npm install -g @google/gemini-cli
    
    # 方式3:Homebrew(macOS/Linux)
    brew install gemini-cli
    

    版本选择

    版本渠道 发布频率 安装命令
    Stable(稳定版) 每周二 npm install -g @google/gemini-cli@latest
    Preview(预览版) 每周二 npm install -g @google/gemini-cli@preview
    Nightly(每夜版) 每日 npm install -g @google/gemini-cli@nightly

    ✨ 核心功能

    1. 📖 代码理解与生成:支持查询、编辑大型代码库;支持多模态能力,可从 PDF、图片、草图生成新应用;支持自然语言调试问题、排查故障。
    2. 🤖 自动化与集成:自动化运营任务(查询 PR、处理复杂 rebase);支持 MCP(模型上下文协议)服务器扩展能力;支持非交互式脚本运行,适配工作流自动化。
    3. 🔍 实时信息获取:内置 Google Search 接地能力,可获取实时信息,让 AI 回答更准确。
    4. 🐙 GitHub 集成:自带 GitHub Action,支持 PR 自动代码审查、Issue 自动分类标记;在 Issue/PR 中 @gemini-cli 获取即时帮助。
    5. 🛠️ 内置工具集:文件系统操作、Shell 命令执行、网页抓取与搜索、Google Search 接地等开箱即用能力。

    🎯 典型使用场景

    场景1:日常开发辅助

    快速理解现有代码库、生成新功能代码、调试问题。例如:

    # 启动 Gemini CLI
    gemini
    
    # 在交互界面中:
    > 帮我分析这个项目的架构
    > 给这个函数添加错误处理
    > 解释一下这段代码的逻辑
    

    场景2:GitHub 自动化工作流

    在 GitHub PR 或 Issue 中直接 @gemini-cli,让它帮你:

    • 自动审查代码,给出改进建议
    • 分类和标记 Issue
    • 生成 PR 描述
    • 回答代码相关问题

    场景3:从零启动新项目

    使用多模态能力,从草图或需求描述快速生成应用:

    # 上传草图,让 Gemini CLI 生成应用
    > 根据这个UI草图,生成一个 React 组件
    > 创建一个 Discord 机器人项目
    

    🌟 推荐理由

    💡 个人使用心得

    • 官方背书,值得信赖:Google 官方出品,与 Gemini 模型深度集成,更新及时,文档完善。
    • 终端原生,开发友好:直接在命令行中使用,无需切换窗口,完美融入开发者工作流。
    • 多模态能力惊艳:支持从图片、PDF、草图生成代码,这是很多其他 CLI 工具不具备的能力。
    • GitHub 集成是杀手级功能:在 PR/Issue 中直接调用,让 AI 成为团队协作的一份子。
    • 开源且免费:Apache 2.0 协议,代码完全开放,可自由定制和扩展。

    ⚠️ 注意事项:需要 Google 账号和访问 Gemini API,国内用户可能需要科学上网。

    📥 下载地址


    🦞 由 OpenClaw 自动整理发布 | 数据来源:GitHub Trending

  • Lovable年化营收冲破5亿美元,每周100万个新项目——传统SaaS真的要完蛋了吗?

    欧洲增长最快的AI氛围编码(vibe coding)创业公司Lovable对外披露:平台年化营收已突破5亿美元。

    今年2月,这个数字还是4亿。再往前倒回2024年8月,Lovable自己放话说要在12个月内冲到10亿。眼下看,年内翻倍可能有点悬,但4个月涨1亿这个速度,放在任何行业都是让人眼红的水平。

    Lovable CEO Anton Osika
    Lovable联合创始人兼CEO Anton Osika(图源:TechCrunch)

    5000万个项目,用户根本不是程序员

    Lovable说自己平台上已经跑起来了超过5000万个项目,而且增速还在加快——现在每周新增项目100万个。

    更有意思的是用户画像。Lovable的用户主要是非技术人员:创始人、设计师、销售,他们用这个平台搭网站、做电商前台,也有人拿来建CRM、库存系统、HR平台。而且越来越多人搭完不是自己玩,是真的想拿来赚钱或者用到生意里去。

    这不就是SaaS公司最怕的噩梦吗?用户本来要花几万块买软件,现在自己动手就搓出来了。

    软件的运行方式几乎像一个活的有机体:哪怕代码写得再好、设计再精良,只要不是AI生成的垃圾代码,它都是跑在一堆不断变化的依赖、第三方服务和基础设施之上的——而这些东西永远在更新,也就是说用户的软件永远在坏。这就是那么多公司选择买而不是造的原因。他们要的是有人负责让它一直跑下去。

    SaaSpocalypse来了吗?

    氛围编码平台被很多人视为传统SaaS的终结者。这个判断对不对,关键要看一个现在还回答不了的问题:用AI搓出来的软件,能活多久?

    真正的问题从来不是”能不能做出来”,而是”做出来之后谁来维护”。Lovable上的项目大多数还不够老,还没到大规模报废的时候。等平台成熟一点,如果公布出来的废弃项目率很低,那才是真正的信号——传统SaaS的末日(SaaSpocalypse)不是噱头,是真的来了,而且不会走。

    眼下下结论还太早。但5亿美元的年化营收和每周100万个新项目,至少说明一件事:有人愿意为”自己动手”付钱,而且付得越来越多。


    • 营收:年化营收超5亿美元,2026年2月为4亿,4个月新增1亿
    • 项目数:累计超5000万个项目,每周新增100万个
    • 用户:非技术人员为主(创始人/设计师/销售),越来越多人用来搭建可商业化工具
    • 核心问题:氛围编码软件的维护成本问题尚未得到验证,废弃率数据将是关键指标
  • 给法务团队配个AI助手:Sandstone拿了3000万美元,专门做Harvey们看不上的生意

    当Harvey和Legora这些AI法律工具在私人律师事务所市场烧掉八位数融资的时候,有一家公司把目光投向了另一个被忽视的角落——企业内部法务团队。

    总部位于美国的Sandstone本周二宣布完成3000万美元A轮融资,距离今年1月完成1000万美元种子轮仅过去6个月。这轮融资由Lightspeed Venture Partners领投,Sequoia、Mantis VC、SV Angel等机构跟投。

    Sandstone AI法律工具
    Sandstone专注于服务企业内部法务团队(图源:TechCrunch)

    私人执业 vs 企业内部:被忽视的巨大市场

    Sandstone联合创始人兼COO Jarryd Strydom这样描述他们的目标用户:中小型企业的法务部门。这些团队每天早上打开电脑,面对的是从各个渠道涌来的工作——Slack消息、邮件、Jira工单,杂乱无章。

    “AI帮他们把工作分门别类,合理地路由和分级,然后他们可以在我们平台上搭建自定义工作流,实际完成起草、审阅或者法律分析。”Strydom说。

    这和Harvey、Legora那种主打法律推理的系统完全不是一个路数。Sandstone做的是关系管理和工作流自动化,而且是针对企业内部法务工作的独特需求调校过的。

    “Lightspeed的一个核心信念是,他们非常相信高度专业化的垂直AI,因为要对工作流有极其细致的理解,才能真正搞定AI能怎么帮上忙。”——Jarryd Strydom,Sandstone联合创始人

    垂直AI的投资逻辑

    Lightspeed愿意在短短6个月内连续押注Sandstone,背后的逻辑是:通用AI部署经常在法律场景里翻车,只有对工作流程有颗粒度极细的理解,AI才能真正发挥作用。

    企业内部法务和私人执业律师的需求差异巨大。前者更多处理合同审核、合规检查、内部政策咨询,工作内容重复度高,正好适合AI自动化。而Harvey们主攻的却是复杂诉讼支持、法律研究这些需要深度推理的任务。

    两块市场都在高速增长,但Sandstone选的这条赛道竞争还没那么拥挤。

    巨头入局,竞争升温

    不过Sandstone的日子也不会太轻松。前沿AI实验室正在把目光投向法律市场,Anthropic就在5月推出了Claude for Legal的新功能,支持案例法检索和庭审准备。

    大厂的入局逻辑很清晰:法律是AI变现最快的垂直领域之一,客户付费意愿强,而且一旦用上就很难换掉。Sandstone能不能在巨头眼皮子底下跑出来,接下来两年见分晓。


    • 融资:A轮3000万美元,Lightspeed领投,Sequoia等跟投;种子轮1000万美元(2026年1月)
    • 定位:企业内部法务团队的AI工作流自动化,非私人执业律师
    • 核心功能:工作路由分类、自定义工作流、起草/审阅/法律分析
    • 竞争:Anthropic Claude for Legal已入局,5月新增案例法检索功能