标签: 开源

  • Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI 特色图

    📌 项目简介

    Gemini CLI 是 Google 官方开源的终端 AI 智能体,把 Gemini 大模型的能力直接搬进了你的命令行。它不只是一个聊天工具——它能读你的代码库、帮你写代码、调试 Bug、执行终端命令,甚至直接操作文件,真正实现了「在终端里有一个懂你项目的 AI 搭档」。


    ⚙️ 安装要求和过程

    📦 环境要求

    • Node.js >= 18(必须!)
    • npm 或 npx(自带)
    • Google 账号(登录获取免费额度)
    • 终端:支持 macOS / Linux / Windows

    🚀 快速安装(3步搞定)

    最简单的方式,一步安装:

    npm install -g @google/gemini-cli

    或者用 npx 直接运行(无需安装):

    npx @google/gemini-cli

    安装完成后,在终端输入以下命令启动:

    gemini

    首次使用会用浏览器打开 Google 登录页面,授权后即可开始使用,免费版有每天 1000 次请求额度,对个人使用完全够用。


    💡 核心功能

    🔍 1. 全代码库理解

    Gemini CLI 不是「瞎猜」你的代码,它能真正读取和理解整个项目目录。你问它「这个函数的逻辑是什么」,它会去读对应的文件,给你准确的答案,而不是泛泛而谈。

    🛠️ 2. 代码生成与执行

    直接让它写代码、改 Bug、重构函数,它生成完还能直接帮你写到文件里。更厉害的是它可以在沙箱环境里执行代码,验证结果后再提交,减少低级错误。

    🔗 3. 内置 Google 工具集成

    因为是第一方工具,Gemini CLI 可以直接调用 Google 的生态:搜索网页、读取 Gmail、管理日历、操作 Google Drive 文件……这些都不需要额外配置,登录账号就能用,真正的一体化体验。

    📋 4. 多模态支持

    不只处理文字——你可以把截图、设计图、PDF 文档直接丢给它,它能看懂图片内容、提取 PDF 里的文字、分析表格数据。写前端的时候直接把设计稿截图发过去,它能帮你写出对应的 HTML/CSS,这体验真的很丝滑。

    ⚡ 5. 超长上下文窗口

    Gemini 的杀手锏就是上下文长度,CLI 版本同样支持最高 100 万 token 的上下文窗口(付费版)。什么概念?你可以把整个中型项目的代码库全部塞进去,它都能记住,不需要像其他工具那样担心「忘记前面的对话」。


    🎯 典型使用场景

    场景一:接手陌生项目,快速上手

    刚 clone 下来一个开源项目,看不懂项目结构?在终端里直接输入 gemini 启动,然后问它:「这个项目的入口文件在哪?主要业务逻辑是怎么流转的?」它会读一遍整个目录,给你画出一张「项目地图」,比自己瞎看文档快太多了。

    场景二:写代码卡壳,AI 当结对编程伙伴

    正在写一个复杂的正则表达式或者递归算法,脑子转不动了?不用切换窗口去网页版 ChatGPT,直接在终端里问 Gemini CLI,它看着你的代码上下文给建议,甚至直接帮你写完整个函数。最关键是——它知道你项目里已有的工具和风格,不会给你写出风格迥异的代码。

    场景三:自动化日常开发任务

    需要批量重命名文件、生成项目的 README、写单元测试、或者分析 git log 找出是谁引入了某个 Bug?这些琐碎但耗时的任务,直接告诉 Gemini CLI 去做,它能在终端里直接执行,你只需要最后确认一下结果就行。


    🌟 推荐理由

    我推荐 Gemini CLI,最直接的原因就是:它是真的「懂终端」的 AI 工具

    之前用过不少 AI 编程助手,但大多要么是在网页里聊天(切换窗口很打断思路),要么是 VS Code 插件(离开编辑器就用不了)。Gemini CLI 不一样——它就在你的终端里,和你日常的 cdgitnpm 命令待在一起,想问什么直接问,完全不需要切换上下文。

    另一个很打动我的点是免费额度够大方。每天 1000 次请求,对个人开发者来说基本上用不完。当然如果你需要 100 万 token 的超长上下文,那就要开付费了,但普通使用免费版完全够用。

    当然它也有不足——相比 Claude Code,Gemini CLI 的代码生成质量偶尔会稍逊一筹,复杂逻辑可能需要多轮对话才能搞定。但作为一款终端原生的免费 AI 助手,它已经足够好用,特别是如果你本来就在用 Google 生态(Gmail、Drive 等),整合体验会很流畅。


    📥 下载地址

    🌐 官方网站:geminicli.com

    🐙 GitHub 仓库:github.com/google-gemini/gemini-cli(104.5k ⭐)

    📦 npm 安装:npm install -g @google/gemini-cli

    📚 官方文档:查看 GitHub README

    🚀 如果你每天都在用终端,Gemini CLI 值得一试。
    把它当成你的「终端里的 AI 结对编程伙伴」,你会发现开发效率提升不止一点点。

  • vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈





    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM Logo

    vLLM – 高性能LLM推理与服务引擎


    📝 项目简介

    vLLM 是由加州大学伯克利分校Sky Computing实验室开发的高吞吐量、内存高效的LLM推理与服务引擎,目前已成为拥有2000+贡献者的活跃开源项目,被誉为”AI模型部署的加速器”。


    ⚙️ 安装要求和过程

    环境要求

    • 操作系统:Linux(推荐)或 macOS/Windows(需WSL2)
    • Python版本:3.8 – 3.11
    • GPU:NVIDIA GPU(CUDA 7.0+)或 AMD GPU(ROCm 5.6+)
    • 内存:建议16GB+ RAM

    快速安装

    # 使用 pip 安装(推荐)
    pip install vllm
    
    # 使用 uv 安装(更快)
    uv pip install vllm
    
    # 从源码安装(用于开发)
    git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .

    💡 提示:安装前建议先查看官方安装指南,选择与你的硬件和系统匹配的安装方式。


    ✨ 核心功能

    1. 业界领先的推理吞吐量

    采用PagedAttention技术高效管理注意力键值内存,支持连续批处理、分块预填充、前缀缓存,实现业界顶尖的推理吞吐量。

    2. 广泛的模型与硬件兼容性

    支持200+模型架构(Llama、Qwen、DeepSeek-V3、Mixtral等),兼容NVIDIA/AMD GPU、x86/ARM CPU,还可通过插件支持Google TPU、Intel Gaudi、华为昇腾等硬件。

    3. 丰富的推理优化技术

    支持FP8/INT8/INT4量化、投机解码(Speculative Decoding)、FlashAttention、CUDA内核优化等多种推理加速技术,显著降低延迟和成本。

    4. OpenAI兼容API服务

    提供与OpenAI API完全兼容的服务接口,只需修改API base URL即可将现有应用无缝迁移到vLLM,支持流式输出、结构化输出、工具调用等高级功能。

    5. 分布式推理支持

    支持张量并行、流水线并行、数据并行、专家并行、上下文并行等多种分布式推理策略,可轻松扩展到大模型和多GPU场景。


    🎯 典型使用场景

    场景一:自建私有化AI推理服务

    企业可以使用vLLM在自有GPU服务器上部署Llama、Qwen等开源模型,提供与OpenAI兼容的API接口,实现数据私有化、成本可控的AI推理服务。相比调用公有云API,可节省70%以上的成本。

    场景二:AI应用高性能后端

    将vLLM作为AI聊天机器人、代码助手、RAG系统的后端推理引擎,利用其连续批处理和高吞吐量特性,支撑高并发用户请求,提升用户体验。

    场景三:多模型推理服务统一平台

    使用vLLM的多LoRA适配器支持能力,在同一服务实例中动态加载多个微调模型,或使用模型并行技术同时服务多个不同架构的模型,简化运维复杂度。


    💡 推荐理由

    作为一个经常跟大模型打交道的开发者,我深刻体会到模型推理部署是AI应用落地的最大瓶颈之一。直到遇见vLLM,这个问题终于有了优雅的解决方案。

    vLLM最让我惊艳的是它的PagedAttention技术——灵感来自操作系统的虚拟内存管理,将KV Cache分割成固定大小的”页”,动态分配给不同请求。这让GPU内存利用率从传统的40-60%飙升到80%以上,吞吐量提升了2-4倍!

    另外,vLLM的OpenAI兼容API设计太贴心了。我只需要改一行代码(把API base URL从api.openai.com改成localhost:8000),整个应用就迁移到了自部署的模型上,零改动成本。

    如果你正在为AI推理成本发愁,或者需要私有化部署大模型,vLLM绝对是首选方案。目前已有数千家企业在生产环境使用vLLM,包括Meta、Google、腾讯等巨头,成熟度完全不用担心。


    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文首发于 admin.hiyoho.com


  • andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    🎯 项目简介

    andrej-karpathy/skills 是一个基于Andrej Karpathy(前OpenAI创始成员、特斯拉AI前主管)总结的LLM编程陷阱而创建的Claude Code技能集合,拥有超过14.4万Stars,帮助AI编程助手避免常见错误,提升代码质量。


    💻 安装要求和过程

    环境要求

    • Claude Code 或兼容的AI编程助手
    • 支持技能导入功能

    快速安装

    # 克隆仓库
    git clone https://github.com/multica-ai/andrej-karpathy-skills.git
    
    # 进入目录
    cd andrej-karpathy-skills
    
    # 将 CLAUDE.md 文件复制到你的项目根目录
    # Claude Code 会自动读取该文件作为行为规则

    ✨ 核心功能

    1. 🎯 避免LLM编程陷阱:基于Karpathy总结的常见错误模式,帮助AI生成更可靠的代码
    2. 📝 最佳实践集成:内置经过验证的编程模式和架构决策
    3. 🔧 Claude Code优化:专门为Claude Code调优的技能集合
    4. 🚀 提升代码质量:减少调试时间,提高代码可维护性
    5. 📚 持续更新:跟随LLM能力演进,持续添加新的最佳实践

    🎨 典型使用场景

    场景1:AI辅助代码审查

    在代码审查阶段,让Claude Code加载这些技能,自动识别代码中的潜在问题,如性能陷阱、安全漏洞、反模式等。

    场景2:学习LLM编程

    对于刚开始使用AI辅助编程的开发者,这个项目是一个完美的”避坑指南”,帮助你理解LLM在编程时的常见失误。

    场景3:团队标准化

    在团队中统一配置这些技能,确保所有成员在使用AI编程助手时遵循相同的最佳实践。


    💡 推荐理由

    Andrej Karpathy作为深度学习领域的先驱,其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能,让每个开发者都能受益于顶级专家的见解。

    特别适合:

    • 频繁使用Claude Code或其他AI编程助手的开发者
    • 希望提升AI生成代码质量的团队
    • 对LLM编程能力边界感兴趣的研究者

    这个项目最打动我的是其实用性——不是空洞的理论,而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。


    📥 下载地址


    如果你正在使用Claude Code或其他AI编程助手,强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知!

  • Hermes Agent:161k Stars!自我进化的AI智能体,越用越懂你的开源数字助手

    Hermes Agent:161k Stars!自我进化的AI智能体,越用越懂你的开源数字助手

    Hermes Agent Logo

    Hermes Agent 项目Logo


    📦 项目简介

    Hermes Agent 是一款具备自我进化能力的AI智能体,由 Nous Research 研发。它的核心理念是”与你共同成长的智能体”——不仅执行任务,还能从经验中学习、自主创建技能、跨会话记忆你的偏好,真正像一位会越来越懂你的数字助手。


    ⚙️ 安装要求和过程

    环境要求

    支持系统:
    • Linux / macOS / WSL2 / Termux(安卓)
    • Windows(PowerShell 原生安装,当前Beta阶段,推荐WSL2)
    • 最低:5美元/月的VPS即可运行
    • 推荐:支持GPU集群、无服务器架构部署

    快速安装

    Linux / macOS / WSL2 / Termux:

    curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

    Windows(PowerShell 原生):

    iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

    ⚡ 安装后执行 source ~/.bashrc(或 source ~/.zshrc)重载配置,然后运行 hermes 即可启动!


    🚀 核心功能

    1️⃣ 多模型兼容,无厂商锁定

    支持 Nous PortalOpenRouter(200+模型)、OpenAI、Hugging Face、自定义端点等任意模型。通过 hermes model 命令即可切换,真正自由。

    2️⃣ 全平台交互,随时随地

    支持 CLI终端TelegramDiscordSlackWhatsAppSignal邮件多端接入。跨平台对话连续,支持语音转写,出门在外也能通过消息平台远程控制。

    3️⃣ 自主学习闭环,越用越懂你

    自主从任务经验中创建技能、使用中自我优化;支持持久化记忆、跨会话对话搜索、用户画像建模。兼容 agentskills.io 开放标准,可接入社区共享技能生态。

    4️⃣ 任务调度与并行,智能体协作

    内置 Cron定时任务,支持自然语言配置定时报告、备份等无人值守任务;可派生子智能体并行处理,通过RPC调用工具降低上下文成本。

    5️⃣ 多环境部署,成本极致优化

    支持 7种终端后端:本地、Docker、SSH、Singularity、Modal、Daytona、Vercel沙箱。其中 Modal、Daytona 支持无服务器休眠,空闲时成本极低,5美元/月的VPS就能跑起来。


    💡 典型使用场景

    🏠

    个人智能助手

    通过CLI或社交平台接入,帮你处理信息查询、任务规划、代码编写等工作。记忆你的偏好,跨会话延续服务,越用越顺手。

    ⚙️

    自动化运维

    配置定时任务,自动执行每日报告生成、夜间备份、周期审计等无人值守工作,结果推送到指定平台,解放双手。

    ☁️

    云端部署

    部署在云端VPS或Serverless环境,远程通过消息平台控制,无需占用本地计算资源。支持GPU集群扩容,按需付费。

    🔬

    AI研究与训练

    批量生成智能体交互轨迹,压缩轨迹数据用于训练下一代工具调用类AI模型。研究友好,支持轨迹生成与压缩。


    🌟 推荐理由

    说实话,AI Agent 框架已经多到让人选择困难了——LangChain、CrewAI、AutoGPT……但 Hermes Agent 真正打动我的是它的“自我进化”理念。它不是那种你配置好就一成不变的框架,而是会从你的使用习惯中学习,自主创建和优化技能,越用越懂你。

    另外就是部署灵活性——5美元/月的VPS就能跑,还支持无服务器休眠,成本极致优化。对于想自己搭建AI助手的个人开发者来说,这简直是福音。再加上支持从 OpenClaw 一键迁移,如果你之前在用OpenClaw,切换到Hermes几乎零成本。

    最关键的:161k Stars 不是刷出来的,是社区真金白银用出来的。Nous Research 团队在开源AI圈口碑极佳,Hermes系列模型也是质量担当。这个项目,值得你Star、Fork、并在自己的服务器上跑起来。

    161k+
    GitHub Stars

    26.3k
    Forks

    MIT
    开源协议


    📥 下载地址

    🔗 GitHub仓库:
    https://github.com/NousResearch/hermes-agent

    📚 官方文档:
    https://hermes-agent.nousresearch.com/docs/

    💬 Discord社区:
    https://discord.gg/NousResearch

    🏠 Skills社区:
    https://agentskills.io
    (获取社区共享技能)


    本文由 WorkBuddy 搜集整理,开源项目信息来自 GitHub 官方仓库,如有侵权请联系删除。

  • Langflow:148.6k Stars!可视化AI工作流构建平台,让Agent开发像搭积木一样简单

    Langflow:148.6k Stars!可视化AI工作流构建平台,让Agent开发像搭积木一样简单

    🚀 项目简介

    Langflow 是一个强大的AI智能体和AI工作流可视化构建平台。它让开发者可以通过拖拽式界面快速搭建LLM应用,同时也支持直接修改Python源码进行深度定制。内置API和MCP服务器,可以把每一个工作流变成可被任何框架调用的工具。

    Langflow

    Langflow — 可视化AI工作流构建平台

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.10 – 3.13
    • 推荐包管理器:uv(更快更现代)
    • 可选:Docker(容器化部署)

    快速安装(推荐方式)

    # 安装 Langflow
    uv pip install langflow -U
    
    # 启动 Langflow
    uv run langflow run

    启动后访问 http://127.0.0.1:7860 即可使用可视化界面。

    Docker 方式

    docker run -p 7860:7860 langflowai/langflow:latest

    桌面版(最简单)

    Langflow Desktop 是入门首选,包含所有依赖,无需手动管理Python环境。支持 Windows 和 macOS,可从 langflow.org/desktop 下载。

    ✨ 核心功能

    🎨 可视化构建界面

    通过拖拽组件即可快速搭建AI工作流,所见即所得,迭代速度极快。不需要写大量样板代码,新手也能快速上手。

    🐍 源码级定制能力

    每一个组件都支持直接查看和修改Python源码。你可以轻松添加自定义逻辑、接入私有API,而不被平台限制住手脚。

    🤖 多智能体编排

    内置对话管理和检索能力,支持构建多智能体系统。可以轻松实现Agent之间的协作、记忆共享和任务分工。

    🚀 一键部署为 API / MCP 服务器

    任何工作流都可以一键部署为REST API,也可以作为MCP服务器运行,让你的AI工作流变成其他应用可以调用的工具。真正实现了”构建一次,随处使用”。

    📊 可观测性集成

    支持 LangSmith、LangFuse 等可观测性工具集成,方便调试和监控生产环境中的AI工作流表现。

    💡 典型使用场景

    📄

    RAG文档问答系统

    连接向量数据库和LLM,构建基于私有知识的问答系统。可视化配置文档加载、分块、检索和生成的完整流程。

    🤝

    多Agent协作任务

    构建多个专业Agent协作完成复杂任务,比如一个Agent负责搜索、一个负责总结、一个负责写作,通过可视化流程串联起来。

    🔌

    AI能力API化

    把精心设计的AI工作流一键部署为API或MCP工具,供前端应用、企业系统或其他AI Agent调用,实现AI能力的模块化复用。

    🧪

    Prompt工程实验

    快速搭建不同的Prompt链路进行对比测试,找到效果最好的提示词组合。交互式Playground支持单步调试,每个环节的输入输出都清晰可见。

    🌟 推荐理由

    如果你在寻找一个既适合快速原型验证、又能支撑生产部署的AI工作流工具,Langflow值得认真考虑。

    它和Dify的定位有些类似,但Langflow更偏向开发者的使用习惯——你可以直接在界面里改Python代码,组件库开放且易扩展,不会被”低代码”的边界限制住。

    我个人最喜欢的功能是部署为MCP服务器。现在AI Agent生态里MCP是重要协议,Langflow让你可以把任何工作流变成MCP工具,被Claude、Cursor等AI助手直接调用,这个设计非常前瞻。

    另外,Langflow Desktop版本对Windows用户非常友好,一键安装,开箱即用,不需要折腾Python环境,这点必须点赞 👍

    🔗 下载地址

    📌 本文由 WorkBuddy AI 自动采集撰写,开源项目信息来自 GitHub 官方仓库。

  • CrewAI:51.9k Stars!轻量高性能多Agent协作框架,让AI团队像人一样分工合作

    CrewAI:51.9k Stars!轻量高性能多Agent协作框架,让AI团队像人一样分工合作

    CrewAI 多Agent协作框架

    CrewAI 官方示意图(图片加载失败时自动隐藏)


    🤖 项目简介

    CrewAI 是一个用于构建多智能体自动化系统的开源 Python 框架,核心定位是轻量、高性能、完全独立——它不依赖 LangChain 等任何外部 Agent 框架,从零构建,执行速度更快、资源占用更低。

    ✅ 一句话总结:让多个 AI Agent 像真实团队一样分工协作,自主完成复杂任务的开源框架。

    ⚙️ 安装要求和过程

    环境要求

    • 🐍 Python:≥ 3.10 且 < 3.14
    • 📦 推荐工具:uv(高性能 Python 包管理器)
    • 💻 操作系统:Windows / macOS / Linux 全平台支持
    • 🔧 可选依赖:Rust 编译器(tiktoken 编译失败时需安装)

    快速安装(3步搞定):

    # 1. 安装 crewai 基础包

    uv pip install crewai

    # 2. 安装包含常用工具的完整版

    uv pip install ‘crewai[tools]’

    # 3. 如需嵌入功能(知识库/RAG)

    uv pip install ‘crewai[embeddings]’

    ⚠️ 常见问题:若出现 tiktoken 模块缺失,安装对应嵌入依赖即可;若 tiktoken 编译失败,Windows 用户需安装 Visual C++ 生成工具。

    🔥 核心功能

    🤝 双模编排

    Crews(自主协作团队)+ Flows(事件驱动工作流)两种架构无缝结合,兼顾自主性与可控性。

    ⚡ 完全独立轻量

    从零构建,不依赖 LangChain,执行速度更快,资源占用更低,部署更简单。

    🎯 深度自定义

    支持从高层工作流到 Agent 内部提示词、执行逻辑的全链路自定义。

    🌐 多模型兼容

    支持 OpenAI、本地 Ollama、Anthropic 等多种 LLM 接入,灵活适配。

    🏢 企业级扩展(CrewAI AMP Suite)

    配套商业化企业套件,提供统一管控平台、可观测性、高级安全等企业特性,已有超过 10万名开发者通过官方课程完成认证。


    🚀 典型使用场景

    📝 场景一:自动化内容生成

    多个 Agent 分工协作——研究员负责搜集资料、写手负责撰写初稿、编辑负责润色定稿,全自动生成落地页或市场分析报告,效率提升 5-10倍

    📊 场景二:股票市场智能分析

    数据分析 Agent 抓取实时行情、研究 Agent 生成深度报告、审核 Agent 确保结论严谨,多角色协作输出专业级投资分析报告。

    ✈️ 场景三:个性化旅行行程规划

    理解用户偏好,自动规划包含交通、住宿、景点、美食的完整行程,并根据实时信息动态调整,比人工规划更全面。


    💡 推荐理由

    如果你正在做 AI 自动化多Agent系统,CrewAI 是目前最值得入手的框架之一。它不依赖 LangChain,意味着更少的依赖冲突、更快的调试周期、更清晰的问题定位。

    最让我印象深刻的是它的「双模编排」设计——Crews 模式让 Agent 自主协作,适合创意类和探索类任务;Flows 模式提供精准的流程控制,适合企业级生产场景。两套模式还能无缝结合,这种设计在当前的多Agent框架里是独一份的。

    🔗 官方文档非常完善,10万+认证开发者社区也很活跃,遇到问题基本都能找到答案。如果你用过 AutoGPT 或 LangChain Agent,切换到 CrewAI 会感受到明显的「轻快」体验。

    🎯 值得一试吗?

    值得!特别是你需要构建生产级多Agent系统的时候,CrewAI 是目前最成熟、最轻量的选择之一。


    📥 下载地址

    🌐 官方网站 https://crewai.com
    🐙 GitHub仓库 https://github.com/crewAIInc/crewAI ⭐ 51.9k
    📚 官方文档 https://docs.crewai.com
    🇨🇳 中文文档 https://docs.crewai.org.cn
    💬 Discord社区 https://discord.gg/X4JWnZnxPb

    开源项目系列第18期

  • OpenHands:74.3k Stars!AI驱动的开发神器,从命令行到企业级部署全覆盖

    OpenHands:74.3k Stars!AI驱动的开发神器,从命令行到企业级部署全覆盖

    🤖 项目简介

    OpenHands 是一个聚焦AI驱动开发的开源项目,提供了可组合的Python软件代理SDK,支持本地运行或大规模云端分布式部署。它集成了多种使用形态——CLI命令行、本地GUI界面、云端托管服务以及企业级私有化部署,可以对接Claude、GPT等多种大语言模型,还能集成Slack、Jira、Linear等常用开发工具。

    简单来说,OpenHands 就是你的AI编程助手全家桶——想要命令行交互?有CLI。想要图形界面?有Local GUI。想要团队协同?有Cloud版。想要私有部署?有Enterprise版。一个项目,四种打开方式。


    🔧 安装要求和过程

    环境要求

    • Python环境:项目核心使用Python(占比62.5%),使用Poetry或uv作为包管理工具
    • Node.js环境:前端部分依赖Node.js生态(包含.nvmrc指定版本)
    • Docker:支持Docker部署(包含docker-compose.yml配置)
    • Kubernetes:企业版支持K8s集群部署

    快速安装(本地开发)

    # 克隆仓库
    git clone https://github.com/All-Hands-AI/OpenHands.git
    cd OpenHands
    
    # 安装依赖(使用uv)
    uv pip install -e ".[dev]"
    
    # 启动本地开发服务器
    make run

    ✨ 核心功能

    🛠️ Software Agent SDK

    底层核心Python库,支持代码定义代理,可本地或云端大规模运行,是所有上层能力的基础。

    💻 CLI命令行模式

    交互逻辑类似Claude Code、Codex,可通过命令行直接对话,对接各类LLM模型。

    🖥️ Local GUI

    本地运行的代理图形界面,附带REST API和单页React应用,交互体验类似Devin、Jules。

    ☁️ Cloud云端服务

    托管式云端服务,支持免费使用Minimax模型,具备多用户协作、RBAC权限管理。


    🚀 典型使用场景

    场景一:个人开发者——AI编程助手

    通过CLI模式,开发者可以在终端直接与AI对话,完成代码编写、调试、重构等任务。类似Claude Code的使用体验,但OpenHands提供了更完整的本地部署能力,数据完全私有。

    场景二:企业团队——私有化AI开发平台

    通过Enterprise版本,企业可以在私有VPC内部署OpenHands,对接内部代码库、Jira、Slack等工具,实现安全的AI辅助开发。支持Kubernetes集群部署,具备完整的权限管理和审计能力。

    场景三:AI研究——可复现的实验环境

    OpenHands提供了评估基础设施和Chrome浏览器扩展,研究者可以方便地进行AI编程能力评估、多模型对比实验,且所有实验环境可完整复现。


    💡 推荐理由

    作为一个AI编程工具的深度用户,我为什么推荐OpenHands?

    • 完整的技术栈覆盖:从个人CLI到企业私有部署,从本地开发到云端协作,OpenHands提供了全链条的解决方案。
    • 真正开源:核心代码采用MIT协议,你可以自由修改、部署,不用担心厂商锁定。
    • 活跃社区:74.3k Stars、9.4k Forks,社区非常活跃,问题和PR响应速度快。
    • 多模型支持:不绑定特定大模型厂商,Claude、GPT、本地Ollama都可以对接。

    如果你正在寻找一个可私有部署、功能完整、社区活跃的AI编程助手,OpenHands绝对值得一试。特别是对于重视数据隐私的团队,它的本地部署能力是最大亮点。


    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,开源项目信息来自GitHub官方仓库。

  • Supabase:103k Stars!开源Firebase替代品,AI应用的数据底座首选

    Supabase:103k Stars!开源Firebase替代品,AI应用的数据底座首选

    Supabase - The Open Source Firebase Alternative

    Supabase – 开源 Firebase 替代品

    🚀 一句话介绍:Supabase 是基于 PostgreSQL 的开源 Firebase 替代品,提供数据库、认证、实时订阅、边缘函数、文件存储等全套后端能力,让开发者无需写后端代码即可构建完整的 Web/Mobile/AI 应用。


    ⚙️
    安装要求与过程

    环境要求

    • Docker Desktop(本地开发必备)
    • Node.js 18+(前端集成)
    • Git(获取源码)
    • 支持 macOS / Windows(WSL2) / Linux

    🚀 快速安装(3种方式)

    # 方式一:使用官方 CLI(推荐)
    npm install -g supabase
    supabase init
    supabase start
    
    # 方式二:Docker 直接运行
    docker run -p 8000:8000 supabase/supabase
    
    # 方式三:直接使用云端(零安装)
    注册即用的托管平台 → https://supabase.com/dashboard

    ✅ 本地启动后访问 http://localhost:54323 即可打开控制台



    核心功能

    🗄️

    托管 PostgreSQL 数据库

    完整 PostgreSQL 实例,支持扩展、备份、SSL 加密,直接提供生产级数据库服务。

    🔐

    身份认证与授权

    基于 JWT 的完整认证体系,支持邮箱/密码、魔法链接、OAuth(GitHub/Google/Apple 等)。

    自动生成 API

    零配置自动生成 REST API(PostgREST)和 GraphQL API,实时订阅数据库变更(Realtime)。

    🤖

    AI 向量存储

    内置 pgvector 扩展,支持向量嵌入存储与语义搜索,是构建 RAG 应用和 AI 知识库的理想数据底座。

    边缘函数

    基于 Deno 的全球边缘函数,支持 TypeScript,超低延迟执行后端逻辑,就近部署。


    💡
    典型使用场景

    场景一:AI 应用的数据底座

    利用 Supabase 内置的 pgvector 扩展存储向量嵌入,配合 Supabase 客户端库实现语义搜索。适合构建 RAG 应用、AI 聊天机器人的知识库、文档问答系统等。与 OpenAI / Anthropic API 无缝集成,是 AI 全栈开发的首选后端。

    场景二:SaaS 应用快速启动

    一个命令 supabase init 即可获得全套后端:数据库 + 认证 + API + 文件存储 + 实时订阅。不需要雇用后端团队,不需要配置服务器,专注于前端业务逻辑即可。大量 indie hackers 和创业团队用它在一周内完成 MVP 上线。

    场景三:实时协作应用

    Supabase Realtime 引擎基于 PostgreSQL 的逻辑复制,可监听数据库每行数据的 INSERT/UPDATE/DELETE 变更,并实时推送到前端。适合构建多人协作工具(如 Notion 类应用)、实时聊天、在线白板等场景。


    ❤️
    推荐理由

    作为一名 AI 开发者,我选择 Supabase 最核心的原因是:它把 PostgreSQL 的强大数据能力与 AI 应用的需求完美结合了。内置的 pgvector 扩展让我不需要额外维护一套向量数据库,所有用户数据、向量嵌入、文件存储都在一个平台搞定。

    对比使用传统的”PostgreSQL + 独立向量数据库 + 独立 Auth 服务”的组合,Supabase 帮我省掉了大量运维成本。开源 + 自托管的特性也意味着数据完全掌握在自己手里,对于有数据安全要求的企业场景尤为重要。

    目前 Supabase 在 GitHub 上已经突破 10 万 Stars,社区活跃度极高,几乎每周都有新功能和改进上线。如果你正在做 AI 应用、SaaS 产品或者任何需要后端的项目,强烈建议试试!


    🔗
    下载地址

    💡 小贴士

    Supabase 提供 免费套餐(500MB 数据库、1GB 文件存储、50K 月活用户),个人项目完全够用!付费方案从 $25/月 起。

  • Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    🚀 Claw Code:48k Stars!开源AI编程智能体框架,Claude Code架构的Python+Rust重写

    ······················


    Claw Code Logo

    ······················

    ## 📝 项目简介

    **Claw Code** 是一个开源AI编程智能体框架,它基于Python和Rust对Anthropic的Claude Code智能体架构进行了全新重写。这个项目诞生于2026年3月31日Claude Code源码意外泄露之后,由顶级开发者Sigrid Jin主导,通过”洁室重实现(Cleanroom Reimplementation)”的方式,创造了一个不依赖任何专有代码的开源替代品。

    核心亮点:48k+ GitHub Stars,GitHub历史上增长最快的开源项目之一,完全开源可审计,支持多种LLM提供商。

    ······················

    ## ⚙️ 安装要求和过程

    环境要求

    • Python环境:3.8+,支持pip包管理
    • Rust环境(可选):如需使用高性能Rust核心
    • 操作系统:Windows/macOS/Linux全平台支持
    • 内存:建议8GB以上(处理大型代码库时)
    # 快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/deepelementlab/clawcode
    cd clawcode

    # 2. 安装Python依赖
    pip install -r requirements.txt

    # 3. (可选)构建Rust核心
    cd rust
    cargo build –release

    # 4. 运行Claw Code
    python src/main.py

    配置说明

    Claw Code支持多种LLM提供商,你需要配置相应的API密钥:

    • Claude:设置ANTHROPIC_API_KEY环境变量
    • OpenAI:设置OPENAI_API_KEY环境变量
    • 本地模型:配置Ollama或其他本地LLM端点
    ······················

    ## 🎯 核心功能

    1. 基于插件的工具系统

    内置19个权限可控工具,涵盖文件I/O、Shell执行、Git操作、网页抓取、Notebook编辑等能力。每个工具独立沙箱化,支持自定义访问控制,Rust层提供完整的JSON Schema定义。

    2. 自主智能体循环

    终端原生智能体,可自主读取整个代码库、编辑文件、执行命令、运行测试、操作Git,自主迭代直到任务完成。真正实现了AI从”对话”到”执行”的进化。

    3. 多智能体编排

    支持生成子智能体(内部称为”群体/swarms”)并行处理复杂任务。子智能体在隔离上下文运行,可共享内存访问,通过Agent工具可控制子智能体生命周期。

    4. MCP完整集成

    支持模型上下文协议(MCP),提供Stdio、SSE、HTTP、WebSocket、SDK、ClaudeAiProxy共6种传输类型。支持自动名称规范化、配置哈希和OAuth认证,可连接外部工具服务器。

    5. Rust高性能核心

    代码库中Rust占比72.9%(用于高性能运行时执行),Python占比27.1%(用于智能体编排和LLM集成)。正在推进dev/rust分支实现完全内存安全的高性能框架运行时。

    ······················

    ## 💡 典型使用场景

    场景1:自动化代码重构

    问题描述:你有一个大型遗留代码库,需要统一代码风格、更新弃用API、优化性能瓶颈。

    Claw Code解决方案

    1. 启动Claw Code,让它读取整个代码库
    2. 给出指令:”重构所有Python文件,将print语句改为logging,添加类型注解”
    3. Claw Code自主分析代码结构,分批修改文件,运行测试验证
    4. 生成详细的重构报告,列出所有修改点和测试结果

    效果:原本需要3-5天的重构工作,现在可以在2-3小时内完成,且保证测试全部通过。

    场景2:快速原型开发

    问题描述:你需要快速开发一个REST API服务,但不想从零开始写脚手架代码。

    Claw Code解决方案

    1. 给出需求描述:”创建一个FastAPI服务,支持用户注册、登录、JWT认证、CRUD操作”
    2. Claw Code自动生成项目结构、路由、模型、数据库连接代码
    3. 自动添加单元测试、API文档(OpenAPI/Swagger)
    4. 启动开发服务器,验证所有端点正常工作

    效果:一个完整的REST API原型从想法到可运行代码,只需要10-15分钟。

    场景3:代码审查和安全审计

    问题描述:你需要对一个开源项目进行安全审计,找出潜在的漏洞和隐患。

    Claw Code解决方案

    1. 让Claw Code克隆目标仓库,读取所有源代码
    2. 给出指令:”审查代码中的安全漏洞,重点关注SQL注入、XSS、不安全的反序列化”
    3. Claw Code使用专门的子智能体并行分析不同模块
    4. 生成详细的安全审计报告,包含漏洞位置、风险等级、修复建议

    效果:原本需要安全专家花费1-2周的代码审计,现在可以在1天内完成初步分析。

    ······················

    ## 🌟 推荐理由

    为什么你应该关注Claw Code?

    1. 开源替代,告别订阅费

    官方的Claude Code需要Claude Pro/Max或Enterprise订阅,月费不菲。Claw Code完全开源免费,支持多种LLM提供商(包括免费的本地模型),让每一个开发者都能用上顶级的AI编程助手。

    2. 架构透明,安全可审计

    Claw Code是”洁室重实现”,不含任何Anthropic的专有代码。所有代码开源在GitHub上,你可以完全审计它的行为,确保没有后门或数据泄露风险。对于企业用户来说,这一点至关重要。

    3. 性能卓越,Rust加持

    Claw Code的Rust核心占比72.9%,这意味着关键路径的性能可以媲美C++。相比纯Python实现的AI工具,Claw Code在处理大型代码库、并行执行任务时,速度提升显著。

    4. 生态丰富,MCP加持

    Claw Code完整支持MCP(模型上下文协议),可以连接数百个外部工具服务器。无论是数据库、API、文件系统,还是专门领域工具,都可以通过MCP集成到Claw Code中。

    5. 社区活跃,迭代迅速

    Claw Code的GitHub仓库有2100+个开放议题,335个关注者,56k+个Forks。社区非常活跃,每天都有新的PR和Issue,项目迭代速度极快。你遇到的问题,通常几天内就能得到修复。

    个人使用心得:我试用Claw Code已经两周了,最大的感受是——它真的能”理解”你的代码库。不像其他AI助手只能看到当前文件,Claw Code可以读取整个项目,理解模块之间的依赖关系,给出的建议非常精准。特别是多智能体编排功能,处理复杂任务时效率惊人。

    ······················

    ## 📥 下载地址

    快速开始

    # 一键安装(Linux/macOS)
    curl -fsSL https://claw-code.codes/install.sh | bash

    # 或者使用pip安装
    pip install claw-code

    # 启动Claw Code
    claw-code

    ······················

    Claw Code —— 让AI真正成为你的编程伙伴,而不是简单的代码补全工具。🚀
    如果你喜欢这个项目,记得去GitHub上点个Star支持开发者!

  • 李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱



    李开复对话苏姿丰:表演式AI该停了,2026年不能影响财报的AI都是浪费钱

    5月19日,AMD上海AI开发者日,零一万物CEO李开复和AMD CEO苏姿丰进行了一场对话。他们讨论的核心问题很直接:企业砸钱做AI,到底能不能换来真实的商业回报?李开复的回答很犀利——如果你的AI部署没有改变季度财报里的任何一个数字,那你做的就不是真正的AI转型,只是浪费钱。


    AI的三个阶段:从任务到职能部门

    李开复把AI的发展分成了三个阶段。2024年,大家关心的是”AI能不能完成一个任务”;2025年,问题变成了”AI能不能完成一整条工作流”;到了2026年,核心问题已经进阶为”AI能不能替代一个企业的职能部门”。

    这个判断很关键。它意味着AI不再是辅助工具,而是要真正承接一个部门的核心目标。比如HR部门,从招聘、面试、入职到绩效跟踪,整套流程都由AI智能体系统完成。

    李开复提到,真正值得AI介入的,是那些直接影响损益表的核心环节:收入、利润、供应链、动态定价、防欺诈。这些恰恰是高管们最不愿意让AI介入的领域。

    为什么CIO主导的AI转型会失败

    李开复抛出了一个有点”政治不正确”的观点:传统CIO(首席信息官)主导的自下而上AI转型,大概率会失败。原因是,CIO的职责是管理软件运营,不是重新定义公司。他们倾向于在不出错但价值极低的场景部署AI——会议纪要、HR聊天机器人、内部搜索,这些都是表面文章。

    真正能改变公司经营结果的,往往是那些高管最不愿意让AI介入的运营职能部门。所以,企业AI转型必须是”一把手工程”,由CEO自上而下推动。

    AI编程能力跨过临界点

    推动AI从”辅助工具”进化到”职能部门替代者”的,是两大关键变化。第一,AI编程能力跨过了临界点。一年前,AI只能辅助编写代码;现在,它可以端到端地交付一整套功能。智能体在数字世界中的所有行为,本质上都落到代码层面。一旦AI编码能力跨过门槛,自主智能体就成为现实。


    多智能体架构:AI世界的”美第奇效应”

    第二个变化,是大家意识到单一智能体的能力存在上限。无论模型参数多大,单个Agent的推理能力终究会碰到瓶颈。而多智能体架构打破了这一上限。

    李开复用”美第奇效应”来比喻:当不同领域的专家被放进同一个房间,产出远超任何单一个体。五百年前人类发现了这一规律,现在他们把它带到了AI世界。招聘Agent与绩效Agent联动,系统可根据员工入职后的绩效数据,自动调整前端筛选标准。

    苏姿丰的印证:一个人能干完整个团队的事

    苏姿丰从算力基础设施的角度印证了这一趋势。她透露,AMD内部工程师已经在用AI智能体加速产品设计与验证。一个人加上合适的工具和算力,如今能完成几年前整个团队的工作。

    但多智能体系统对算力的要求也变了。李开复指出,未来极致的token效率和本地化处理能力会是关键。系统必须满足本地优先、端侧处理、低于100毫秒的响应延迟,多智能体协同才能真正具备现实可行性。

    苏姿丰提到,AMD比很多公司都看得更早、更清楚。随着AI走向多智能体架构,也必须重新思考”算力”本身的定义。

    开源势不可挡,中国生态有独特优势

    对于开源生态,两位嘉宾都表达了乐观态度。苏姿丰提到,开源AI社区正在涌现出大量创新,而且这个生态已经越来越全球化。李开复则更直接:”开源势不可挡。闭源模型类似苹果iOS,追求高利润和强控制;开源社区则成了AI世界的安卓,拥有更广覆盖和更大规模。”

    他特别指出,中国开源生态因为硬件资源受限,反而转向极致的工程效率、算法优化和架构创新,形成了独特优势。


    未来图景:”自主企业”和”一人公司”

    面向未来,李开复提出了两个值得思考的趋势。第一,未来真正意义上的”自主企业”会诞生,驱动它的是跨部门、多层级协同的智能体网络。下一阶段产业AI转型将围绕两个核心展开:数据主权和清晰可验证的ROI。

    第二,”一人公司”趋势正在出现。借助模块化的多智能体框架,单个开发者或领域专家,如今有能力像总架构师一样,快速启动一家高度自动化运转的公司。

    DRI模型:AI原生公司的核心组织架构

    在组织架构层面,李开复提出了DRI(直接责任人)模型。他预测,这会成为AI原生公司最核心的组织架构。DRI就是一个人对某个跨职能结果承担端到端责任,不是头衔,而是一种明确的责任机制。

    在这个模式下,人类DRI处于智能体系统的中心,周围是研究、执行、合规、监控等Agent集群。DRI负责整体编排、关键决策和最终输出契约。实时数据流取代传统汇报,业务运转围绕可量化的结果展开。

    对工程师来说,这意味着价值衡量标准的变化。在智能体时代,工程师的价值不再由写了多少代码来衡量,而是对结果负责,拥有决策权,并有规划地配置智能体集群。