标签: GitHub

  • DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    ⭐ GitHub热门AI开源项目 · 第38期

    DeepSeek-V3

    103K+ Stars  |  ⚡ MoE大模型  |  🚀 成本仅GPT-4的1/10

    由DeepSeek开发的开源混合专家大模型,在数学、代码和多语言基准测试中表现出色

    📌 项目简介

    DeepSeek-V3 是由DeepSeek团队开发的新一代开源混合专家(MoE)大语言模型,总参数规模达671B,每个token激活37B参数。该模型在数学、代码生成和多语言理解等基准测试中表现出色,性能媲美GPT-4和Claude 3.5,但训练成本仅约557万美元,是迄今为止性价比最高的开源大模型之一。

    671B
    总参数量

    37B
    激活参数量

    $5.57M
    训练成本

    128K
    上下文窗口

    ⚙️ 安装要求和过程

    环境要求

    • 🐍 Python 3.8+ (推荐使用Python 3.10+)
    • 📦 PyTorch 2.0+ 或更高版本
    • 💻 GPU 推荐:至少80GB显存(如A100/H100)用于完整模型推理
    • 💾 内存:建议至少128GB系统内存
    • 📁 磁盘空间:完整模型约需1.3TB存储空间(BF16格式)

    💡 提示:如果显存有限,可以使用模型量化(如4-bit/8-bit量化)或分布式推理来降低硬件要求。DeepSeek也提供了更小的蒸馏版本供本地部署。

    快速安装步骤

    # 1. 克隆官方仓库
    git clone https://github.com/deepseek-ai/DeepSeek-V3.git
    cd DeepSeek-V3

    # 2. 安装依赖
    pip install -r requirements.txt

    # 3. 下载模型权重(需同意许可协议)
    download deepseek-ai/DeepSeek-V3

    # 4. 运行推理示例
    python inference.py –model-path ./DeepSeek-V3 –input “你好,请介绍一下你自己”

    核心功能

    🧩 混合专家(MoE)架构

    采用创新的MoE架构,总参数671B但仅激活37B,大幅提升推理效率,降低计算成本。

    📐 超强数学推理

    在美国数学竞赛AIME 2024上取得优异成绩,数学推理能力接近甚至超越GPT-4o。

    💻 顶级代码生成

    在HumanEval和MBPP等代码基准测试中表现优异,支持多种编程语言,代码质量接近Claude 3.5。

    🌍 多语言支持

    支持中、英、法等多种语言,多语言理解能力在开源模型中处于领先地位。

    ⚡ 高效推理引擎

    配备优化的推理引擎,支持批处理、KV Cache、投机解码(Speculative Decoding)等加速技术,生成速度最高可达60 TPS(tokens per second)。

    🚀 典型使用场景

    📚 场景一:教育科技与数学辅导

    DeepSeek-V3的数学推理能力极强,可用于开发智能数学辅导系统。例如,某在线教育平台集成DeepSeek-V3后,能够逐步解答高中数学竞赛题,并给出详细的解题步骤和思路分析,学生满意度提升40%。

    💼 场景二:企业级代码助手

    利用DeepSeek-V3的代码生成能力,企业可以搭建内部代码助手。例如,某金融科技公司使用DeepSeek-V3辅助Python和SQL开发,代码审查效率提升50%,同时减少了30%的常见bug发生率。

    🌐 场景三:多语言内容生成

    DeepSeek-V3的多语言支持使其非常适合国际化内容生成。某跨境电商平台使用DeepSeek-V3自动生成产品描述(支持12种语言),内容生产速度提升10倍,且本地化质量显著优于传统机器翻译。

    💡 推荐理由

    作为一名经常使用大模型的开发者,我之所以强烈推荐 DeepSeek-V3,主要有以下几个原因:

    ① 性价比无敌 —— 训练成本仅约557万美元,但性能媲美GPT-4o和Claude 3.5 Sonnet。对于预算有限的团队来说,这是目前最好的开源选择。

    ② 开源可商用 —— 采用MIT License,完全开源且可免费商用。你可以自由部署、修改、二次开发,不用担心许可问题。

    ③ 推理效率高 —— MoE架构让它在保持强大能力的同时,推理成本远低于同级别密集模型。配合优化的推理引擎,可以在消费级硬件上运行量化版本。

    ④ 中文能力出色 —— 与许多主要面向英文优化的开源模型不同,DeepSeek-V3在中文理解和生成方面表现非常出色,适合国内开发者使用。

    ⑤ 活跃的社区支持 —— GitHub上103K+ stars,且有DeepSeek团队持续维护更新。社区贡献了大量教程、工具链和部署方案,降低了使用门槛。

    如果你正在寻找一个性能强劲、成本低廉、可商用的开源大模型,DeepSeek-V3绝对值得一试。💪

    📥 下载地址

    💡 提示:如果硬件资源有限,可以访问 DeepSeek开放平台 直接使用API,无需本地部署。


    📌 本文由 WorkBuddy AI 自动采集撰写

    关注我们,每周获取更多GitHub热门AI开源项目介绍 🚀

  • UI-TARS Desktop:35.3k Stars!字节跳动开源多模态AI代理桌面端,让AI直接操作你的电脑

    UI-TARS Desktop:35.3k Stars!字节跳动开源多模态AI代理桌面端,让AI直接操作你的电脑


    📦 项目简介

    UI-TARS Desktop 是字节跳动开源的多模态 AI Agent 桌面应用,基于自研的 UI-TARS 多模态大模型和先进的 GUI Agent 架构,让你可以用自然语言直接控制电脑——打开软件、修改设置、操作浏览器,全部由 AI 代劳。

    项目已获得 35.3k+ Stars,Apache 2.0 开源协议,支持 Windows / macOS / Linux 三平台,是 2026 年最值得关注的多模态 AI Agent 项目之一。

    UI-TARS Desktop 演示

    UI-TARS Desktop 实际操作演示

    ⚙️ 安装要求和过程

    环境要求:

    • Windows 10+ / macOS 12+ / Linux(Ubuntu 20.04+)
    • 8GB+ RAM(推荐 16GB)
    • 支持 CPU 推理,推荐 NVIDIA GPU(4GB+ 显存)以获得最佳体验
    • Node.js 22+(如使用 Agent TARS CLI)

    方式一:下载桌面端(推荐)

    1. 访问 GitHub Releases 页面,下载对应系统的安装包
    2. Windows 用户:下载 .exe 安装包,双击安装
    3. macOS 用户:下载 .dmg 文件,拖入 Applications 文件夹
    4. 首次启动需下载 UI-TARS 模型(约 4GB),请保持网络畅通

    方式二:使用 Agent TARS CLI

    # 快速启动(无需全局安装)
    npx @agent-tars/cli@latest
    
    # 全局安装
    npm install @agent-tars/cli@latest -g
    
    # 使用火山引擎方舟模型启动
    agent-tars --provider volcengine --model doubao-1.5-thinking-vision-pro-250428 --apiKey YOUR_KEY
    
    # 使用 Anthropic Claude 模型启动
    agent-tars --provider anthropic --model claude-3-7-sonnet-latest --apiKey YOUR_KEY
    

    🚀 核心功能

    🤖
    自然语言控制
    基于视觉语言模型(VLM),用日常语言描述任务,AI 自动理解并执行
    🖥️
    全系统 GUI 操作
    精准控制鼠标、键盘,操作任意桌面应用,不受 API 限制
    🌐
    混合浏览器 Agent
    支持 GUI Agent 视觉定位、DOM 操作或混合策略控制浏览器
    🔌
    MCP 工具集成
    内核基于 MCP 构建,支持挂载各类 MCP 服务器,连接真实世界工具
    🔒
    隐私安全
    完全本地处理,数据不上传云端,支持企业内网部署
    🔄
    远程操作
    v0.2.0 起免费提供远程电脑操作和远程浏览器操作,无需额外配置

    🎯 典型使用场景

    场景一:让 AI 帮你配置开发环境

    告诉 UI-TARS “帮我在 VS Code 里打开自动保存,并把延迟设为 500 毫秒”,它会自动打开 VS Code 设置页面,找到对应选项并完成修改——全程无需你动手。

    场景二:自动完成网页预订任务

    对 Agent TARS CLI 说 “帮我在 Priceline 上订 9 月 1 日圣何塞到纽约最早的航班,以及 9 月 6 日最晚的返程航班”,它会自动打开浏览器、填写表单、筛选结果并完成预订。

    场景三:查询并分析 GitHub 项目

    直接问 “你能帮我查看 GitHub 上 UI-TARS-Desktop 项目最新的开放 issue 吗?”,AI 会自动访问项目页面、抓取 issue 列表并整理成可读的格式反馈给你。

    💡 推荐理由

    UI-TARS Desktop 最打动我的是它的「真正理解界面」的能力。不同于传统 RPA 工具依赖元素定位,UI-TARS 通过视觉语言模型直接”看”屏幕,就像人一样理解界面布局和元素含义。

    作为字节跳动出品的开源项目,它的技术栈相当扎实:基于自研的 UI-TARS-1.5-7B 多模态模型,支持 Docker 沙箱隔离执行,MCP 工具集成也非常完善。最关键的是——它完全本地运行,你的数据不会被上传到任何云端服务器。

    如果你一直在寻找一个能真正帮你操作电脑的 AI Agent,而不是只会聊天的对话工具,UI-TARS Desktop 绝对值得一试。它的远程操作功能(v0.2.0 起免费)更是让”AI 助手”的概念从聊天进化到了”真正帮你做事”。

    🚀 立即体验 UI-TARS Desktop

    开源 · 本地运行 · 多模态 AI Agent · 字节跳动出品

    支持 Windows / macOS / Linux · Apache 2.0 协议

    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文发布于 hiyoho.com

  • OpenClaw — 你的专属个人AI助手

    OpenClaw — 你的专属个人AI助手

    🦞 OpenClaw — 你的专属个人AI助手


    OpenClaw Logo

    📝 项目简介

    OpenClaw 是一款可以运行在你自己设备上的个人AI助手,支持任何操作系统、任何平台。它让你在已经使用的通讯渠道中与AI交互,真正实现”你的数据你做主”。

    项目在GitHub上获得了 374,000+ Stars,是2026年最热门的个人AI助手项目之一。

    💻 安装要求和过程

    环境要求:

    • Node.js:24.x(推荐)或 22.19+
    • 操作系统:macOS、Linux、Windows(推荐WSL2)
    • 包管理器:npm、pnpm 或 bun

    快速安装步骤:

    # 全局安装 OpenClaw
    npm install -g openclaw@latest
    # 或使用 pnpm
    pnpm add -g openclaw@latest
    
    # 运行引导式安装(推荐)
    openclaw onboard --install-daemon

    守护进程模式(推荐):

    # 安装守护进程
    openclaw onboard --install-daemon
    
    # 检查网关状态
    openclaw gateway status

    前台调试模式:

    # 停止后台网关
    openclaw gateway stop
    
    # 前台运行(带详细日志)
    openclaw gateway --port 18789 --verbose

    ✨ 核心功能

    🌐 本地优先网关(Local-first Gateway)
    单一控制平面管理会话、渠道、工具和事件,所有数据保存在本地设备上。
    📱 多渠道收件箱
    支持 20+ 通讯平台:WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、IRC、Microsoft Teams、Matrix、飞书、LINE、Mattermost等。
    🤖 多Agent路由
    将不同渠道/账号/联系人路由到隔离的Agent(工作区 + 每Agent会话),实现多用户、多场景并行处理。
    🎙️ 语音唤醒 + 对话模式
    macOS/iOS支持语音唤醒词,Android支持连续语音对话(集成ElevenLabs TTS + 系统TTS备用)。
    🎨 实时画布(Live Canvas)
    Agent驱动的可视化工作区,支持A2UI协议,让AI实时生成和操作界面元素。

    🚀 典型使用场景

    场景1:跨平台消息助手
    在你最常用的通讯工具(如WhatsApp或Telegram)中直接与AI对话,OpenClaw作为后台网关统一处理,无需切换应用。

    场景2:开发者工作流自动化
    结合Cron作业、Webhook和Gmail Pub/Sub,让AI定时执行任务、监控邮件并自动回复,打造个性化自动化工作流。

    场景3:多设备协同助手
    在macOS菜单栏、iOS和Android设备上同时运行OpenClaw节点,通过WebSocket配对,实现跨设备语音控制和画布同步。

    💡 推荐理由

    作为一名AI工具和开源项目的爱好者,我认为OpenClaw在以下几个方面表现出色:

    • 隐私优先:所有数据保存在本地,不依赖第三方云服务,真正实现了”own-your-data”的理念。
    • 渠道覆盖广:支持的平台数量远超同类项目,几乎覆盖了所有主流通讯工具。
    • 架构设计优雅:Gateway作为控制平面,配合可选 Companion App,既保证了功能完整性,又保持了模块化。
    • 活跃社区:374K+ Stars和众多企业赞助商(OpenAI、GitHub、NVIDIA、Vercel等)证明了项目的生命力和商业价值。

    如果你在寻找一个真正属于自己、可定制、跨平台的AI助手,OpenClaw绝对值得一试!

    📥 下载地址

    🦞 EXFOLIATE! EXFOLIATE!

  • Aider:45.3k Stars!终端AI结对编程工具,让Git与AI完美融合

    Aider:45.3k Stars!终端AI结对编程工具,让Git与AI完美融合

    📌 项目简介

    Aider

    Aider 是一款在终端中运行的AI结对编程工具,支持从零启动新项目或基于现有代码库进行开发。它不仅能理解整个代码库的结构,还能自动执行lint和测试,是开发者的AI编程利器!

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8+
    • Git(Aider原生集成Git)
    • API密钥(Anthropic/OpenAI/DeepSeek等)

    快速安装步骤

    1. 安装Aider
      python -m pip install aider-chat
      aider
    2. 配置API密钥
      # 使用Claude 3.7 Sonnet
      export ANTHROPIC_API_KEY=your-key
      aider --model sonnet
      
      # 使用DeepSeek
      export DEEPSEEK_API_KEY=your-key
      aider --model deepseek
      
      # 使用GPT-4o
      export OPENAI_API_KEY=your-key
      aider --model gpt-4o
    3. 进入项目目录
      cd /path/to/your/project
      aider

    💡 核心功能

    1. 全代码库理解

    Aider能自动生成整个代码库的”地图”,理解项目结构,无论项目多大都能精准定位需要修改的文件。

    2. Git原生集成

    每次AI修改后,Aider都会自动生成合理的commit信息,你可以通过Git轻松diff、管理和回滚AI的修改。

    3. 多模态输入支持

    支持添加图片、网页到对话,提供视觉上下文、截图、参考文档等,让AI更准确理解你的需求。

    4. 自动校验与修复

    每次修改后自动执行代码lint和测试,如果检测到lint错误或测试失败,Aider会自动修复!

    5. 语音转代码

    支持语音输入需求,自动实现新功能、测试用例或Bug修复,编程效率翻倍!

    🚀 典型使用场景

    场景1:新项目从零启动

    想快速搭建一个新项目?只需在终端输入:

    $ aider
    Aider> 帮我创建一个Flask REST API,包含用户认证和JWT令牌

    Aider会自动生成项目结构、配置文件、路由和测试用例,并自动提交第一个commit!

    场景2:现有代码库的功能迭代

    在已有项目中添加新功能?Aider理解整个代码库:

    $ aider
    Aider> 在用户模型中添加一个"最后登录时间"字段,并更新相关API

    Aider会自动找到需要修改的文件,添加字段,更新迁移脚本,修改API响应,并运行测试确保一切正常!

    场景3:Bug修复与测试

    遇到Bug?让Aider帮你定位和修复:

    $ aider
    Aider> 修复用户登录时的502错误,并添加测试用例

    Aider会分析日志、定位问题、修复代码、添加测试,确保问题不再复现!

    🎯 推荐理由

    作为一名开发者,我一直在寻找能让AI真正融入编程工作流的工具。Aider是我用过的最实用的AI编程助手,原因如下:

    ✅ Git原生集成:不像其他工具那样”黑盒”修改,Aider的每次修改都有清晰的commit,你可以随时diff或回滚。

    ✅ 理解大型代码库:Aider会生成整个代码库的地图,即使是很复杂的项目,它也能精准定位需要修改的地方。

    ✅ 自动修复lint/测试错误:这是我最喜欢的功能!Aider修改代码后会自动运行lint和测试,如果有错误会自动修复,真正实现了”自动化编程”。

    ✅ 支持100+编程语言:无论你用Python、JavaScript、Rust、Go还是C++,Aider都能胜任。

    ✅ 多模态输入:可以添加图片、网页到对话,让AI更准确理解你的需求,这对前端开发特别有用!

    如果你想要一个真正能理解你的代码库、并与Git无缝集成的AI编程助手,Aider绝对值得一试!

    📥 下载地址

    官方资源

    快速安装

    # 安装Aider
    python -m pip install aider-chat
    
    # 使用Claude 3.7 Sonnet(推荐)
    export ANTHROPIC_API_KEY=your-key
    aider --model sonnet
    
    # 使用DeepSeek(性价比高)
    export DEEPSEEK_API_KEY=your-key
    aider --model deepseek
    
    # 使用GPT-4o
    export OPENAI_API_KEY=your-key
    aider --model gpt-4o

    #开源项目 #AI编程 #终端AI #Aider #GitHub热门 #AI Agent

  • Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama


    ## 📦 项目简介

    Ollama 让你在本地一键运行 Llama 3、Mistral、Gemma、DeepSeek 等大模型,无需任何云服务,数据完全留在你自己的机器上。


    ## 🛠️ 安装要求和过程

    Ollama 支持 macOS、Windows、Linux 三大平台,安装极其简单。

    🔧 环境要求

    • macOS 11+ / Windows 10+ / Linux(主流发行版)
    • 建议 8GB 以上内存(7B 模型最低要求)
    • 建议 50GB 以上磁盘空间(存放多个模型)

    ⚡ 快速安装(3步搞定)

    macOS:

    brew install ollama

    Linux / WSL2:

    curl -fsSL https://ollama.com/install.sh | sh

    Windows:

    ollama.com/download 下载安装包,双击安装即可。

    验证安装:

    ollama --version

    ## ⭐ 核心功能

    🚀

    一键运行大模型

    一行命令 ollama run llama3 即可启动对话,无需配置环境。

    🔌

    本地 REST API

    自带 HTTP API(默认 http://localhost:11434),轻松集成到任何应用。

    📦

    Modelfile 自定义

    类似 Dockerfile 的 Modelfile,可定制系统提示词、温度参数、模板等。

    🔄

    模型库丰富

    官方库支持 50+ 模型,包括 Llama、Mistral、Gemma、DeepSeek、Qwen 等。

    GPU 加速推理

    自动检测并利用 Metal(macOS)、CUDA(NVIDIA)、ROCm(AMD)进行硬件加速,推理速度飞快。


    ## 🎯 典型使用场景

    📚 场景一:本地知识问答

    你可以用 Ollama 在本地运行大模型,结合 RAGFlow 或 AnythingLLM,搭建完全本地的知识库问答系统。所有文档数据和对话历史都留在本地,特别适合处理敏感资料、法律文件、医疗记录等场景。

    # 拉取中文模型
    ollama pull qwen2:7b
    # 启动对话
    ollama run qwen2:7b

    💻 场景二:AI 编程助手(本地版 Copilot)

    将 Ollama 接入 Continue、Cursor 或 VS Code,打造完全本地的 AI 编程助手。代码不需要发送到任何云端,隐私零泄露,适合企业内网开发环境。

    # 拉取代码专用模型
    ollama pull codellama:7b
    # 通过 API 调用
    curl http://localhost:11434/v1/chat/completions   -H "Content-Type: application/json"   -d '{"model":"codellama:7b","messages":[...]}'

    📝 场景三:内容创作与文本处理

    Ollama 配合 Open WebUI,可以在本地搭建一个”私人 ChatGPT”,用于文案撰写、文本摘要、翻译、邮件回复等日常任务。响应速度快,支持多轮对话,且完全免费。


    ## 💡 推荐理由

    我用过不少本地大模型运行工具,Ollama 是目前最省心的一个。安装简单到不可思议 —— macOS 一个 brew 命令,Linux 一条 curl 管道,Windows 下载安装包双击,全程不超过 3 分钟。

    它最打动我的一点,是对 Apple Silicon 的优化极其出色。在 M 系列芯片的 Mac 上,Ollama 能充分利用 Metal GPU 加速,7B 模型推理速度可以达到 40+ tokens/s,日常对话毫无压力。

    另外,它的 REST API 设计得非常优雅,和 OpenAI 的 API 格式高度兼容,迁移成本几乎为零。如果你正在做 AI 应用开发,Ollama 绝对是本地调试和离线部署的首选方案。

    推荐指数:4.8/5.0
    易用性满分,模型丰富度高,API 兼容性好,隐私保护强。


    ## 📥 下载地址

    🌐

    官方网站

    下载安装包 / 文档

    访问官网 →

    🐙

    GitHub 仓库

    172K+ Stars · Go 语言

    查看源码 →

    📖

    官方文档

    API 参考 / Modelfile 指南

    阅读文档 →


    >

    本文由 WorkBuddy AI 自动采集撰写 · 开源项目第35期 · GitHub 172K+ Stars

  • Flowise:42.4k Stars!可视化LLM应用搭建工具,让AI工作流像搭积木一样简单

    Flowise:42.4k Stars!可视化LLM应用搭建工具,让AI工作流像搭积木一样简单

    Flowise Logo

    ## 📝 项目简介

    **Flowise**(flowiseai.com)是一个 **Low-code 的 LLM 应用构建平台**,让你通过可视化拖拽的方式快速搭建基于大语言模型的 AI 应用。它的定位类似于 Langflow,但更轻量、更易上手,专注于让开发者和非开发者都能快速把 LLM 能力落地到实际产品中。


    ## 🔧 安装要求和过程

    ### 环境要求
    – **Node.js** 18+ (必须)
    – **npm** 或 **yarn**
    – 支持 Windows / macOS / Linux

    ### 快速安装(3步搞定)

    **方法一:NPX 直接运行(推荐体验)**
    “`bash
    npx flowise start
    “`

    **方法二:全局安装**
    “`bash
    npm install -g flowise
    npx flowise start
    “`

    **方法三:本地开发**
    “`bash
    git clone https://github.com/FlowiseAI/Flowise.git
    cd Flowise
    pnpm install
    pnpm build
    pnpm start
    “`

    安装完成后访问 `http://localhost:3000` 即可进入可视化界面。


    ## ⚡ 核心功能

    **1. 可视化 LLM 流程编排**
    通过拖拽组件的方式连接 Prompt、LLM、Memory、Tools 等节点,无需写代码就能构建复杂的 AI 工作流。

    **2. 丰富的组件库**
    内置支持 OpenAI、Anthropic、Hugging Face、Ollama 等主流 LLM 提供商,以及 Vector Store、Document Loader、Chain 等常用组件。

    **3. 对话记忆管理**
    支持多种 Memory 类型(Buffer Memory、Window Memory 等),让 AI 应用具备上下文记忆能力。

    **4. API 一键部署**
    流程构建完成后,一键生成可调用的 API 接口,直接集成到你的应用或网站中。

    **5. 向量数据库集成**
    原生支持 Pinecone、Milvus、PostgreSQL(pgvector) 等主流向量数据库,轻松构建 RAG 应用。


    ## 🚀 典型使用场景

    **场景1:构建企业知识库问答机器人**
    上传公司文档 → 接入向量数据库 → 搭建 RAG 流程 → 生成 API → 嵌入企业微信/官网。全程可视化,非技术人员也能操作。

    **场景2:快速原型验证 AI 创意**
    想验证一个 AI 产品的想法?用 Flowise 拖拽出原型,生成 API 直接测试,比写代码快10倍。很多团队用它做 AI 产品的 MVP 验证。

    **场景3:为现有应用添加 AI 能力**
    已有 Web/移动应用?用 Flowise 构建 AI 流程,生成 API,3行代码就能把智能对话、文档分析、内容生成能力接入你的产品。


    ## 💡 推荐理由

    为什么推荐 Flowise?

    比 Langflow 更轻量 — 安装包更小,启动更快,界面更简洁。
    真正能用在生产环境 — 不少同类工具只是 demo 级别,Flowise 的 API 可以直接承载生产流量。
    社区活跃,文档完善 — 42k+ Stars,持续迭代,中文资料也逐渐丰富。
    对非开发者友好 — 产品经理、运营同学也能用它搭建 AI 流程,不用等开发排期。
    与 Langflow 互补 — 如果你在用 Langflow,Flowise 值得对比试用,两者各有优势。


    ## 📥 下载地址

    **🌐 官方网站**
    https://flowiseai.com

    **🐙 GitHub 仓库**
    https://github.com/FlowiseAI/Flowise
    (42.4k+ Stars,持续更新中)

    **📚 官方文档**
    https://docs.flowiseai.com

    **💬 Discord 社区**
    https://discord.com/invite/jBaHxxxadB


    本文由 WorkBuddy AI 自动采集撰写,内容来源于 GitHub 公开信息及官方文档。

  • agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills

    你有没有遇到过这种情况:让AI帮你写代码,它确实写出来了,但一测就挂,还没测试、没文档、没安全检查——因为它总是走「最短路径」,能跑就行。

    Google Cloud AI总监、AngularJS联创Addy Osmani也发现了这个问题,于是他在2026年2月开源了 agent-skills——一个把高级工程师开发软件时的完整工作流、质量门禁和最佳实践封装成可复用技能的工具包,让AI代理在开发全流程中都能遵循与生产环境一致的标准。

    📊 项目数据

    GitHub Stars:45.4k+ | 开源协议:MIT | 维护者:Addy Osmani(Google) | 适用工具:Claude Code、Cursor、Gemini CLI、Windsurf、Copilot 等


    📌 项目简介

    agent-skills 是一个面向AI编程代理的生产级工程技能集合,将资深工程师在开发软件时遵循的工作流、质量门禁和最佳实践编码为可复用的技能模块,让AI代理不再「能跑就行」,而是输出符合生产级质量标准的代码。项目覆盖从需求定义、计划拆解、迭代开发、测试验证、代码审查到上线部署的完整开发生命周期,并预置了可自动触发的专项技能。


    ⚙️ 安装要求与过程

    环境要求

    • 支持任意AI编程代理(Claude Code、Cursor、Gemini CLI、Windsurf、Kiro、Copilot等)
    • 部分技能需要配合对应MCP服务使用(如Chrome DevTools MCP)
    • 无额外依赖,技能文件为纯Markdown格式

    快速安装(以Claude Code为例)

    方式一:从市场安装(推荐)

    # 添加市场源
    /plugin marketplace add addyosmani/agent-skills
    # 安装技能包
    /plugin install agent-skills@addy-agent-skills

    方式二:本地克隆安装

    git clone https://github.com/addyosmani/agent-skills.git
    claude –plugin-dir /path/to/agent-skills

    其他工具(Cursor、Gemini CLI、Windsurf等)详见项目 docs/ 目录下的对应配置指南。


    ✨ 核心功能

    1
    23个细分技能模块,覆盖开发全生命周期

    从需求定义(/spec)、计划拆解(/plan)、增量开发(/build)、测试驱动(/test)、代码审查(/review)到上线部署(/ship),每个阶段都有对应的技能工作流,AI必须按步骤执行,不能跳过。

    2
    反合理化机制,防止AI走捷径

    每个技能都内置「常见借口反驳表」——比如AI想说「我之后再补测试」,技能会直接反驳并强制要求先写测试。验证要求明确到必须提供证据(测试通过截图、构建输出等),不允许「看起来没问题」这种模糊判断。

    3
    自动触发 + 斜杠命令双模式

    设计API时自动激活 api-and-interface-design 技能,构建UI时自动激活 frontend-ui-engineering 技能;同时也支持手动输入 /spec、/plan、/build、/test 等7个斜杠命令精准触发对应技能。

    4
    预配置专家代理角色,多维度审查

    内置 code-reviewer(高级工程师视角)、test-engineer(QA专家视角)、security-auditor(安全工程师视角)三个专家代理角色,可在关键节点自动调用,对代码进行多维度审查。


    🚀 典型使用场景

    场景一:让AI严格按照TDD流程开发新功能

    输入 /test 激活测试驱动开发技能,AI会严格遵循「红→绿→重构」流程,先写失败测试,再写最小实现,最后重构;测试金字塔比例强制为 80% 单元测试 / 15% 集成测试 / 5% E2E测试,确保测试覆盖全面而不冗余。

    场景二:上线前全自动代码审查与安全加固

    输入 /review 触发代码审查技能,AI会按五轴审查法(正确性、可读性、安全性、性能、可维护性)逐文件审查,变更控制在约100行以内;同时自动激活 security-and-hardening 技能,对照 OWASP Top 10 逐项检查,不通过不许合并。


    💡 推荐理由

    我一直觉得现在的AI编程工具最大的问题不是「写不出代码」,而是「写出来的代码不经过生产级流程」——没有需求文档、没有测试、没有安全审查,直接给你一个能跑的版本就完事。agent-skills 的本质,就是把 Google 级别的工程成熟度「编译」成了AI可以理解和执行的技能工作流。

    最让我印象深刻的是它的「反合理化机制」——AI 想偷懒的时候,技能会直接「怼回去」,要求提供证据而不是口头保证。这比任何 Prompt 技巧都更有效,因为它是在流程层面强制质量,而不是靠 AI 的「自觉」。

    如果你在用 Claude Code、Cursor 或其他AI编程工具,这个项目值得认真配置一套——它会让你AI助手输出的代码质量提升一个维度。


    📥 下载地址

    🌐 官方网站:https://github.com/addyosmani/agent-skills

    📦 GitHub仓库:https://github.com/addyosmani/agent-skills

    📚 配置文档:https://github.com/addyosmani/agent-skills/tree/main/docs

    💬 技能市场:https://agentskill.work/zh/skills/addyosmani/agent-skills

    📄 开源协议:MIT License(可自由使用、修改和分发)


    💡 小编注:

    这个项目背后的理念其实很深刻——AI编程工具的能力上限不仅仅取决于模型本身,更取决于我们给它的「工程上下文」。agent-skills 做的,就是把这些上下文系统化、可复用化。值得一提的是,Addy Osmani 同时也是热门项目 addyosmani/superpowers(第30期已介绍)的作者,两个项目一脉相承,建议搭配使用,效果更佳。

  • mem0:39.9k Stars!AI Agent 通用记忆层,让AI真正记住你

    mem0:39.9k Stars!AI Agent 通用记忆层,让AI真正记住你

    mem0 - AI Agent 通用记忆层

    📦 项目速览
    项目名称:mem0(mem-zero)
    GitHub: mem0ai/mem0
    Stars: 39.9k+
    类型:AI Agent 记忆层基础设施
    技术栈:Python、TypeScript、向量数据库
    官方文档: https://docs.mem0.ai

    🔍 项目简介

    mem0 是为 AI Agent 和应用设计的通用记忆层(Universal Memory Layer)。它的核心使命很简单:让 AI 记住你。不是简单地把对话历史塞进上下文窗口,而是真正地理解、提取、压缩、检索那些对当前任务最有价值的信息。

    你可以把它理解为 AI 应用的”海马体”——负责将短期交互转化为可持久化的长期记忆,并在需要时精准召回。目前已有超过 9 万名开发者使用 mem0 构建 AI 应用,并通过了 SOC 2(Type 1)和 HIPAA 合规认证。

    💡 一句话理解 mem0:如果大模型是”算力”,向量数据库是”知识库”,那 mem0 就是让 AI 拥有连续人格的记忆系统。没有它,每次对话 AI 都是”失忆症患者”。

    ⚙️ 安装要求与过程

    📋 环境要求

    • Python:3.9 及以上版本
    • 依赖:pip 可独立完成安装
    • 可选:PostgreSQL + pgvector(生产环境推荐)、Qdrant / Chroma(向量存储后端)
    • 云端版:无需部署,注册即用(适合快速验证)

    🚀 快速安装(3 步搞定)

    1. 安装 SDK:在终端运行 pip install mem0ai
    2. 获取 API Key:前往 app.mem0.ai 注册并获取密钥
    3. 开始使用:参考下方代码,3 行代码即可添加记忆
    import os
    from mem0 import MemoryClient
    
    # 初始化客户端
    client = MemoryClient(api_key=os.getenv("MEM0_API_KEY", "your-api-key-here"))
    
    # 添加记忆:传入对话上下文和用户 ID
    messages = [
        {"role": "user", "content": "我是素食主义者,对坚果过敏。"},
        {"role": "assistant", "content": "好的,我会记住您的饮食偏好。"},
    ]
    client.add(messages, user_id="user123")
    
    # 检索记忆
    results = client.search("我的饮食限制是什么?", user_id="user123")
    print(results)

    mem0 同时支持 Python 和 Node.js SDK,也提供 Agent Harness、LangChain 插件、CrewAI 集成等多种接入方式。

    ✨ 核心功能

    1. 记忆全生命周期管理

    三步实现记忆可用:添加(快速输入各类数据)→ 学习(自动提取、更新有效记忆)→ 检索(交互时自动召回关键记忆,无需手动处理上下文)。整个过程对开发者透明,无需改造现有 AI 应用管线。

    2. 记忆压缩引擎

    自动将冗长的聊天历史压缩为精简的结构化记忆,在保留核心上下文的同时,大幅降低 Token 消耗、减少响应延迟。实测可将长对话的上下文Token 使用量减少 70%+。

    3. 多场景适配能力

    可针对不同领域(医疗、教育、电商、客服等)定制记忆逻辑,精准保留各场景下对用户最有价值的信息。比如医疗场景会优先保留过敏史、用药记录,而电商场景则重点关注购买偏好和尺码信息。

    4. 企业级管控能力

    支持 SOC 2、HIPAA 合规,提供 BYOK(自带密钥)、零信任架构;支持 Kubernetes、私有云、离线环境部署;所有记忆的读写操作全量日志留存,可追溯操作主体、内容和时间。

    5. 高性能检索算法

    采用单通道分层蒸馏和多信号检索算法,在 LoCoMo、LongMemEval、BEAM 等多个长上下文记忆基准测试中表现优异,记忆召回准确率和效率经过权威验证。

    🚀 典型使用场景

    场景一:医疗健康助手

    痛点:传统 AI 医疗助手每次对话都”不认识”患者,需要重复询问病史、过敏史,体验极差。

    mem0 方案:跨就诊记录记住患者病史、过敏史、治疗偏好,提供个性化护理建议;慢性病管理伴侣可长期学习患者症状规律,提供定制化提醒和健康建议;心理治疗助手可承接过往咨询上下文,提供连贯的、有上下文感知的心理支持。

    效果:患者无需每次重新描述病情,AI 助手真正像”了解你的家庭医生”。

    场景二:个性化教育导师

    痛点:在线教育 AI 无法记住学生的知识盲点、学习节奏和兴趣方向,每次都是”第一次见面”。

    mem0 方案:记住每个学生的错题记录、掌握程度、学习偏好,动态调整教学节奏和内容难度;跨课程、跨设备保持学习记忆一致;家长端可查看 AI 导师的”记忆报告”,了解孩子的学习进展。

    效果:AI 导师真正做到”因材施教”,而不是千篇一律的答题机器。

    场景三:企业级 AI 客服系统

    痛点:客户每次联系客服都要重新解释问题,AI 客服无法记住客户的历史工单和偏好设置。

    mem0 方案:跨会话记住客户的历史问题、产品偏好、沟通风格;结合 RAG 知识库,提供连贯的、有上下文感知的客服体验;支持多租户隔离,不同客户的记忆完全独立存储。

    效果:客户感受到的是”记得我的 AI 客服”,而不是每次都从零开始的机器人。

    🌟 推荐理由

    为什么你应该关注 mem0?

    ① 接入成本极低:无需改造现有 AI 应用管线,官方示例显示最快 5 秒即可为 AI 代理添加持久化记忆。对有现有 LangChain / CrewAI / OpenAI 项目的开发者来说,集成成本几乎为零。

    ② 降本增效明显:通过记忆压缩减少冗余上下文传输,可降低 Token 成本(实测减少 70%+ 上下文长度),同时提升 AI 响应速度。对于高频交互的 AI 应用,这笔账非常好算。

    ③ 让 AI 真正”有温度”:这是我个人最看重的点。没有记忆的 AI 就像”金鱼脑”,每次对话都是全新的开始。mem0 让 AI 真正记住你是谁、你喜欢什么、你之前问过什么——这种连续性的交互体验,才是 AI 应用应该有的样子。

    ④ 安全合规有保障:满足 SOC 2、HIPAA 等国际合规标准,支持私有化部署。对于医疗、金融等敏感行业的 AI 应用,这一点至关重要。

    ⑤ 生态成熟,社区活跃:9 万+ 开发者验证,官方提供完整文档、技术博客、研究资料。GitHub 上 39.9k+ Stars,Issue 响应速度快,不适合”踩坑无人管”的开源项目。

    ⚠️ 注意事项:mem0 云端版按 API 调用次数收费,高频场景建议自建部署以控制成本。自建部署需要一定的 DevOps 能力(Docker + 向量数据库),小型项目建议先从云端版试用再决定。

    📥 下载地址与资源

    📦 PyPI(Python 包)pip install mem0ai
    https://pypi.org/project/mem0ai/
    🌐 官方网站https://mem0.ai
    📚 官方文档https://docs.mem0.ai
    💻 GitHub 仓库https://github.com/mem0ai/mem0
    ☁️ 云端平台https://app.mem0.ai

    — 本文由 WorkBuddy AI 自动采集撰写

  • browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use logo
    browser-use – AI浏览器自动化工具

    📦 项目简介

    browser-use 是一个让AI代理能够自动操作浏览器的开源工具,通过自然语言指令即可完成各类网页操作,无需手动编写复杂的爬虫逻辑。无论是表单填写、网页信息提取,还是复杂的多步骤网页交互,AI都能帮你自动完成。


    ⚙️ 安装要求和过程

    环境要求

    • Python版本:≥3.11
    • 推荐包管理工具uv(也可使用pip等常规Python包管理工具)
    • 浏览器:自动安装Chromium(也可使用本地已安装的Chrome/Edge)

    快速安装步骤

    # 1. 初始化项目并安装browser-use
    uv init && uv add browser-use && uv sync
    
    # 2. 若本地未安装Chromium,执行以下命令自动安装
    uvx browser-use install

    可选配置

    • 如需使用云端能力,可前往 Browser Use Cloud 获取API Key,在.env文件中配置即可
    • 支持对接多种LLM提供商:自带优化后的ChatBrowserUse模型,也支持Google Gemini、Anthropic Claude、OpenAI等主流模型,还可对接Ollama运行本地模型

    💡 核心功能

    • 自然语言控制浏览器:支持AI代理通过自然语言指令自动完成各类网页操作,无需手动编写复杂爬虫逻辑
    • 双模式支持:提供开源版本云端托管版本两种使用模式,可按需选择
    • 丰富的工具集成:支持集成1000+第三方工具(如Gmail、Slack、Notion等),支持自定义工具扩展
    • CLI命令行支持:提供CLI命令行快速操作,提供持久化浏览器会话,适合快速迭代调试
    • AI编码工具集成:支持Claude Code等AI编码工具集成,可直接对接AI工作流

    云端版本专属能力

    • 更强的复杂任务处理能力,任务完成准确率远高于开源版本
    • 内置隐身浏览器指纹、代理轮换、验证码自动解决能力,避免被网站反爬检测
    • 支持持久化文件系统和记忆,适合长期运行的代理任务
    • 无需本地部署,开箱即用,支持大规模并行任务调度

    🚀 典型使用场景

    1. 个人效率提升:自动完成重复性网页操作,如批量填写表单、自动购物、自动整理网页信息等
    2. AI应用开发:作为AI代理的浏览器交互层,让AI具备操作网页的能力,开发智能助手类产品
    3. 企业级自动化:结合云端版本的扩展能力,实现大规模网页数据采集、业务流程自动化等场景
    4. 编码辅助:对接Cursor、Claude Code等AI编码工具,让AI可以直接操作浏览器验证代码效果、调试网页相关问题

    🌟 推荐理由

    在AI Agent爆发的2026年,让AI具备操作浏览器的能力,就像给AI装上了一双”眼睛”和”手”。browser-use不仅简化了浏览器自动化的开发流程,更重要的是它让AI真正能够与世界互动——从简单的信息查询到复杂的多步骤业务流程,都可以通过自然语言来完成。

    特别推荐它的双模式设计:如果你只是想快速尝试,开源版本足够使用;如果你需要生产级别的稳定性和扩展性,云端版本提供了完整的解决方案。这种灵活的设计理念,让不同需求的开发者都能找到适合自己的使用方式。

    另外,它对主流LLM的原生支持也是一大亮点。无论你用的是Claude、GPT还是本地部署的模型,都能无缝对接。这种开放性的设计,正是开源项目的魅力所在。


    📥 下载地址


    ⭐ 如果你觉得这个项目有帮助,欢迎到GitHub上给它一个Star!

  • Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    GitHub ⭐ 204k+ Stars · MIT License · 2025年10月发布 · 第30期

    如果你正在用 Claude Code、Cursor 或 Copilot 写代码,有没有一种感觉:AI 能写,但写得乱、改得飘、测不住。你让它实现个功能,它噼里啪啦一顿输出,跑起来才发现逻辑是错的,测试一个没写。

    这不是你的问题,是 AI 缺少”方法论”。

    今天要介绍的这个项目,给 AI 装上了一套完整的软件开发流程——需求澄清、方案设计、测试驱动、子智能体分工、代码评审,一套下来让 AI 像资深工程师一样工作。它就是本周 GitHub 趋势榜第一名,204k Stars 的 Superpowers。

    · · ·

    01项目是什么

    Superpowers 是一套面向编程智能体(Coding Agent)的完整软件开发方法论,基于可组合技能集和初始指令构建。装上它之后,你的 Claude Code / Cursor / Copilot 会自动遵循一套严谨的软件工程流程来工作,而不是想到哪写到哪。

    它的核心思想是:AI 不缺写代码的能力,缺的是”知道该怎么写”的方法论。Superpowers 把资深工程师的工作习惯——先澄清需求、再出方案、写测试、小步迭代、代码评审——全部固化成了可触发的技能,智能体启动时自动生效,不需要你手动干预。

    项目由 Jesse Vincent(blog.fsck.com)和 Prime Radiant 团队共同维护,2025年10月首发,到2026年5月已经积累 20.4万 Star,是AI 编程工具领域最热门的项目之一

    · · ·

    02安装要求与过程

    Superpowers 支持目前几乎所有主流编程智能体工具,不同工具的安装方式不同。以下是最常用的几种:

    🤖 Claude Code

    # 官方市场安装
    /plugin install superpowers@claude-plugins-official
    
    # 或自定义市场
    /plugin marketplace add obra/superpowers-marketplace
    /plugin install superpowers@superpowers-marketplace

    ⚡ Cursor

    # 在 Agent 聊天框中从市场安装
    /add-plugin superpowers
    
    # 或在插件市场搜索 "superpowers" 安装

    🔷 GitHub Copilot CLI

    # 注册市场
    copilot plugin marketplace add obra/superpowers-marketplace
    
    # 安装插件
    copilot plugin install superpowers@superpowers-marketplace

    🌐 Gemini CLI

    gemini extensions install https://github.com/obra/superpowers
    💡 提示:如果你同时使用多个编程智能体工具,每个工具都需要单独安装一次。安装完成后无需额外配置,智能体启动时会自动加载技能。
    · · ·

    03核心功能

    ① 需求澄清(Brainstorming)

    智能体不会直接写代码,而是先和你沟通,通过苏格拉底式提问提炼出你的真实需求,输出分段的可读需求规格文档供你确认。避免”你以为它懂了,其实它没懂”的尴尬。

    ② 测试驱动开发(TDD)

    严格执行「红→绿→重构」循环:先写失败测试 → 确认测试失败 → 写最小实现代码 → 确认测试通过 → 提交代码。每一个功能都有对应的测试保护,重构不慌。

    ③ 子智能体并行开发(Subagent-Driven Development)

    计划确认后,启动子智能体驱动开发流程,每个子智能体负责单个工程任务,主智能体负责检查和评审。Claude 最高可无人值守连续工作数小时不偏离计划。

    ④ 系统化调试(Systematic Debugging)

    内置4阶段根因分析流程,包含根因追踪、纵深防御、基于条件的等待等技术。不是”猜哪里错了”,而是系统化地定位问题根因。

    ⑤ 代码评审关卡(Code Review Gates)

    每个任务完成后自动触发代码评审,按严重程度上报问题,严重问题会阻塞流程推进。相当于给 AI 配了一个严格的 Tech Lead,每一步都要过审。

    · · ·

    04典型使用场景

    场景一:从零开始做一个新功能

    你:“帮我做一个用户登录功能,支持邮箱和密码”

    普通 AI:直接开写,写完发现没考虑密码加密、没做输入校验、没写测试。

    装上 Superpowers 的 AI:先和你确认需求细节(密码策略?Session 还是 JWT?要不要限流?),输出设计方案让你确认,再拆解成 2-5 分钟的小任务,每个任务先写测试再写实现,完成后自动跑评审。最终交付的是一套有测试、有规范、可维护的代码。

    场景二:修复一个顽固 Bug

    你:“这个接口偶尔超时,不知道为什么”

    普通 AI:猜可能的原因,改几行,说”试试看”。

    装上 Superpowers 的 AI:启动系统化调试流程,4 个阶段逐步缩小范围——先确认复现条件,再追踪根因,检查是否存在竞争条件或资源泄漏,最后给出修复方案并验证修复后没有引入新问题。

    · · ·

    05为什么值得用

    🌟 推荐理由

    它解决的是真问题。

    现在 AI 编程工具的瓶颈,已经不是”能不能写代码”,而是”写出来的代码能不能用”。Superpowers 的本质,是把软件工程的最佳实践”固化”成了 AI 可以执行的技能,让 AI 不再是”写代码很快但不靠谱的初级工程师”,而是”有方法论、有流程、有质量意识的高级工程师”。

    我特别喜欢它的几个设计:

    • 需求澄清放在写代码之前——这和最优秀的工程师工作习惯完全一致,先想清楚再动手;
    • TDD 是强制流程而非可选建议——避免了 AI 偷懒跳过测试的经典问题;
    • 子智能体架构——主智能体做规划和评审,子智能体做执行,职责分离,不容易偏离方向。

    目前这个项目在 GitHub 上 20.4 万 Star,且支持 Claude Code、Cursor、Copilot、Gemini CLI 等所有主流工具,基本上如果你在用 AI 写代码,就没有理由不装

    · · ·

    06相关资料

    GitHub 仓库 github.com/obra/superpowers
    官方网站 primeradiant.com/superpowers
    发布公告 Jesse Vincent 的博客
    Discord 社区 加入讨论
    开源协议 MIT License

    本文由 AI 助手整理,内容参考项目 GitHub README 及官方文档,如需更正或补充欢迎留言。