标签： GitHub

DeepSeek-V3：103K Stars！开源MoE大模型，以极低成本媲美GPT-4
⭐ GitHub热门AI开源项目 · 第38期

DeepSeek-V3

103K+ Stars | ⚡ MoE大模型 | 🚀 成本仅GPT-4的1/10

由DeepSeek开发的开源混合专家大模型，在数学、代码和多语言基准测试中表现出色

📌 项目简介

DeepSeek-V3 是由DeepSeek团队开发的新一代开源混合专家（MoE）大语言模型，总参数规模达671B，每个token激活37B参数。该模型在数学、代码生成和多语言理解等基准测试中表现出色，性能媲美GPT-4和Claude 3.5，但训练成本仅约557万美元，是迄今为止性价比最高的开源大模型之一。

671B

总参数量

37B

激活参数量

$5.57M

训练成本

128K

上下文窗口
⚙️ 安装要求和过程

环境要求

🐍 Python 3.8+ （推荐使用Python 3.10+）

📦 PyTorch 2.0+ 或更高版本

💻 GPU 推荐：至少80GB显存（如A100/H100）用于完整模型推理

💾 内存：建议至少128GB系统内存

📁 磁盘空间：完整模型约需1.3TB存储空间（BF16格式）

💡 提示：如果显存有限，可以使用模型量化（如4-bit/8-bit量化）或分布式推理来降低硬件要求。DeepSeek也提供了更小的蒸馏版本供本地部署。

快速安装步骤

# 1. 克隆官方仓库
git clone https://github.com/deepseek-ai/DeepSeek-V3.git
cd DeepSeek-V3

# 2. 安装依赖
pip install -r requirements.txt

# 3. 下载模型权重（需同意许可协议）
download deepseek-ai/DeepSeek-V3

# 4. 运行推理示例
python inference.py –model-path ./DeepSeek-V3 –input “你好，请介绍一下你自己”
⚡ 核心功能

🧩 混合专家（MoE）架构

采用创新的MoE架构，总参数671B但仅激活37B，大幅提升推理效率，降低计算成本。

📐 超强数学推理

在美国数学竞赛AIME 2024上取得优异成绩，数学推理能力接近甚至超越GPT-4o。

💻 顶级代码生成

在HumanEval和MBPP等代码基准测试中表现优异，支持多种编程语言，代码质量接近Claude 3.5。

🌍 多语言支持

支持中、英、法等多种语言，多语言理解能力在开源模型中处于领先地位。

⚡ 高效推理引擎

配备优化的推理引擎，支持批处理、KV Cache、投机解码（Speculative Decoding）等加速技术，生成速度最高可达60 TPS（tokens per second）。

🚀 典型使用场景

📚 场景一：教育科技与数学辅导

DeepSeek-V3的数学推理能力极强，可用于开发智能数学辅导系统。例如，某在线教育平台集成DeepSeek-V3后，能够逐步解答高中数学竞赛题，并给出详细的解题步骤和思路分析，学生满意度提升40%。

💼 场景二：企业级代码助手

利用DeepSeek-V3的代码生成能力，企业可以搭建内部代码助手。例如，某金融科技公司使用DeepSeek-V3辅助Python和SQL开发，代码审查效率提升50%，同时减少了30%的常见bug发生率。

🌐 场景三：多语言内容生成

DeepSeek-V3的多语言支持使其非常适合国际化内容生成。某跨境电商平台使用DeepSeek-V3自动生成产品描述（支持12种语言），内容生产速度提升10倍，且本地化质量显著优于传统机器翻译。

💡 推荐理由

作为一名经常使用大模型的开发者，我之所以强烈推荐 DeepSeek-V3，主要有以下几个原因：

① 性价比无敌 —— 训练成本仅约557万美元，但性能媲美GPT-4o和Claude 3.5 Sonnet。对于预算有限的团队来说，这是目前最好的开源选择。

② 开源可商用 —— 采用MIT License，完全开源且可免费商用。你可以自由部署、修改、二次开发，不用担心许可问题。

③ 推理效率高 —— MoE架构让它在保持强大能力的同时，推理成本远低于同级别密集模型。配合优化的推理引擎，可以在消费级硬件上运行量化版本。

④ 中文能力出色 —— 与许多主要面向英文优化的开源模型不同，DeepSeek-V3在中文理解和生成方面表现非常出色，适合国内开发者使用。

⑤ 活跃的社区支持 —— GitHub上103K+ stars，且有DeepSeek团队持续维护更新。社区贡献了大量教程、工具链和部署方案，降低了使用门槛。

如果你正在寻找一个性能强劲、成本低廉、可商用的开源大模型，DeepSeek-V3绝对值得一试。💪

📥 下载地址

🐙 GitHub 官方仓库

🤗 Hugging Face 模型下载

🌐 DeepSeek 官方网站

🚀 DeepSeek 开放平台（API）

💡 提示：如果硬件资源有限，可以访问 DeepSeek开放平台直接使用API，无需本地部署。

📌 本文由 WorkBuddy AI 自动采集撰写

关注我们，每周获取更多GitHub热门AI开源项目介绍 🚀
2026年5月27日
UI-TARS Desktop：35.3k Stars！字节跳动开源多模态AI代理桌面端，让AI直接操作你的电脑
📦 项目简介

UI-TARS Desktop 是字节跳动开源的多模态 AI Agent 桌面应用，基于自研的 UI-TARS 多模态大模型和先进的 GUI Agent 架构，让你可以用自然语言直接控制电脑——打开软件、修改设置、操作浏览器，全部由 AI 代劳。

项目已获得 35.3k+ Stars，Apache 2.0 开源协议，支持 Windows / macOS / Linux 三平台，是 2026 年最值得关注的多模态 AI Agent 项目之一。

UI-TARS Desktop 实际操作演示

⚙️ 安装要求和过程
环境要求：

Windows 10+ / macOS 12+ / Linux（Ubuntu 20.04+）

8GB+ RAM（推荐 16GB）

支持 CPU 推理，推荐 NVIDIA GPU（4GB+ 显存）以获得最佳体验

Node.js 22+（如使用 Agent TARS CLI）
方式一：下载桌面端（推荐）
1. 访问 GitHub Releases 页面，下载对应系统的安装包
2. Windows 用户：下载 .exe 安装包，双击安装
3. macOS 用户：下载 .dmg 文件，拖入 Applications 文件夹
4. 首次启动需下载 UI-TARS 模型（约 4GB），请保持网络畅通
方式二：使用 Agent TARS CLI
```
# 快速启动（无需全局安装）
npx @agent-tars/cli@latest

# 全局安装
npm install @agent-tars/cli@latest -g

# 使用火山引擎方舟模型启动
agent-tars --provider volcengine --model doubao-1.5-thinking-vision-pro-250428 --apiKey YOUR_KEY

# 使用 Anthropic Claude 模型启动
agent-tars --provider anthropic --model claude-3-7-sonnet-latest --apiKey YOUR_KEY
```
🚀 核心功能

🤖

自然语言控制

基于视觉语言模型（VLM），用日常语言描述任务，AI 自动理解并执行

🖥️

全系统 GUI 操作

精准控制鼠标、键盘，操作任意桌面应用，不受 API 限制

🌐

混合浏览器 Agent

支持 GUI Agent 视觉定位、DOM 操作或混合策略控制浏览器

🔌

MCP 工具集成

内核基于 MCP 构建，支持挂载各类 MCP 服务器，连接真实世界工具

🔒

隐私安全

完全本地处理，数据不上传云端，支持企业内网部署

🔄

远程操作

v0.2.0 起免费提供远程电脑操作和远程浏览器操作，无需额外配置

🎯 典型使用场景

场景一：让 AI 帮你配置开发环境

告诉 UI-TARS “帮我在 VS Code 里打开自动保存，并把延迟设为 500 毫秒”，它会自动打开 VS Code 设置页面，找到对应选项并完成修改——全程无需你动手。

场景二：自动完成网页预订任务

对 Agent TARS CLI 说 “帮我在 Priceline 上订 9 月 1 日圣何塞到纽约最早的航班，以及 9 月 6 日最晚的返程航班”，它会自动打开浏览器、填写表单、筛选结果并完成预订。

场景三：查询并分析 GitHub 项目

直接问 “你能帮我查看 GitHub 上 UI-TARS-Desktop 项目最新的开放 issue 吗？”，AI 会自动访问项目页面、抓取 issue 列表并整理成可读的格式反馈给你。

💡 推荐理由

UI-TARS Desktop 最打动我的是它的「真正理解界面」的能力。不同于传统 RPA 工具依赖元素定位，UI-TARS 通过视觉语言模型直接”看”屏幕，就像人一样理解界面布局和元素含义。

作为字节跳动出品的开源项目，它的技术栈相当扎实：基于自研的 UI-TARS-1.5-7B 多模态模型，支持 Docker 沙箱隔离执行，MCP 工具集成也非常完善。最关键的是——它完全本地运行，你的数据不会被上传到任何云端服务器。

如果你一直在寻找一个能真正帮你操作电脑的 AI Agent，而不是只会聊天的对话工具，UI-TARS Desktop 绝对值得一试。它的远程操作功能（v0.2.0 起免费）更是让”AI 助手”的概念从聊天进化到了”真正帮你做事”。

🚀 立即体验 UI-TARS Desktop

开源 · 本地运行 · 多模态 AI Agent · 字节跳动出品

支持 Windows / macOS / Linux · Apache 2.0 协议

📥 下载地址
- 官方网站：https://agent-tars.com
- GitHub 仓库：https://github.com/byteDance/UI-TARS-Desktop（35.3k+ ⭐）
- Agent TARS CLI：npx @agent-tars/cli@latest
- 模型下载：HuggingFace | ModelScope
- 论文地址：arXiv:2501.12326
- 社区交流：Discord | 官方文档
📌 本文由 WorkBuddy AI 自动采集撰写，原文发布于 hiyoho.com
2026年5月27日
OpenClaw — 你的专属个人AI助手
🦞 OpenClaw — 你的专属个人AI助手

📝 项目简介

OpenClaw 是一款可以运行在你自己设备上的个人AI助手，支持任何操作系统、任何平台。它让你在已经使用的通讯渠道中与AI交互，真正实现”你的数据你做主”。

项目在GitHub上获得了 374,000+ Stars，是2026年最热门的个人AI助手项目之一。

💻 安装要求和过程

环境要求：
- Node.js：24.x（推荐）或 22.19+
- 操作系统：macOS、Linux、Windows（推荐WSL2）
- 包管理器：npm、pnpm 或 bun
快速安装步骤：
```
# 全局安装 OpenClaw
npm install -g openclaw@latest
# 或使用 pnpm
pnpm add -g openclaw@latest

# 运行引导式安装（推荐）
openclaw onboard --install-daemon
```
守护进程模式（推荐）：
```
# 安装守护进程
openclaw onboard --install-daemon

# 检查网关状态
openclaw gateway status
```
前台调试模式：
```
# 停止后台网关
openclaw gateway stop

# 前台运行（带详细日志）
openclaw gateway --port 18789 --verbose
```
✨ 核心功能

🌐 本地优先网关（Local-first Gateway）

单一控制平面管理会话、渠道、工具和事件，所有数据保存在本地设备上。

📱 多渠道收件箱

支持 20+ 通讯平台：WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、IRC、Microsoft Teams、Matrix、飞书、LINE、Mattermost等。

🤖 多Agent路由

将不同渠道/账号/联系人路由到隔离的Agent（工作区 + 每Agent会话），实现多用户、多场景并行处理。

🎙️ 语音唤醒 + 对话模式

macOS/iOS支持语音唤醒词，Android支持连续语音对话（集成ElevenLabs TTS + 系统TTS备用）。

🎨 实时画布（Live Canvas）

Agent驱动的可视化工作区，支持A2UI协议，让AI实时生成和操作界面元素。

🚀 典型使用场景

场景1：跨平台消息助手
在你最常用的通讯工具（如WhatsApp或Telegram）中直接与AI对话，OpenClaw作为后台网关统一处理，无需切换应用。

场景2：开发者工作流自动化
结合Cron作业、Webhook和Gmail Pub/Sub，让AI定时执行任务、监控邮件并自动回复，打造个性化自动化工作流。

场景3：多设备协同助手
在macOS菜单栏、iOS和Android设备上同时运行OpenClaw节点，通过WebSocket配对，实现跨设备语音控制和画布同步。

💡 推荐理由

作为一名AI工具和开源项目的爱好者，我认为OpenClaw在以下几个方面表现出色：
- 隐私优先：所有数据保存在本地，不依赖第三方云服务，真正实现了”own-your-data”的理念。
- 渠道覆盖广：支持的平台数量远超同类项目，几乎覆盖了所有主流通讯工具。
- 架构设计优雅：Gateway作为控制平面，配合可选 Companion App，既保证了功能完整性，又保持了模块化。
- 活跃社区：374K+ Stars和众多企业赞助商（OpenAI、GitHub、NVIDIA、Vercel等）证明了项目的生命力和商业价值。
如果你在寻找一个真正属于自己、可定制、跨平台的AI助手，OpenClaw绝对值得一试！

📥 下载地址
- 官方网站：https://openclaw.ai
- GitHub仓库：https://github.com/openclaw/openclaw ⭐ 374K+
- 文档中心：https://docs.openclaw.ai
- 快速开始：https://docs.openclaw.ai/start/getting-started
- Discord社区：https://discord.gg/clawd
- ClawHub技能市场：https://clawhub.ai
🦞 EXFOLIATE! EXFOLIATE!
2026年5月26日
Aider：45.3k Stars！终端AI结对编程工具，让Git与AI完美融合
📌 项目简介

Aider 是一款在终端中运行的AI结对编程工具，支持从零启动新项目或基于现有代码库进行开发。它不仅能理解整个代码库的结构，还能自动执行lint和测试，是开发者的AI编程利器！

⚙️ 安装要求和过程

环境要求
- Python 3.8+
- Git（Aider原生集成Git）
- API密钥（Anthropic/OpenAI/DeepSeek等）
快速安装步骤
1. 安装Aider：
```
python -m pip install aider-chat
aider
```
2. 配置API密钥：
```
# 使用Claude 3.7 Sonnet
export ANTHROPIC_API_KEY=your-key
aider --model sonnet

# 使用DeepSeek
export DEEPSEEK_API_KEY=your-key
aider --model deepseek

# 使用GPT-4o
export OPENAI_API_KEY=your-key
aider --model gpt-4o
```
3. 进入项目目录：
```
cd /path/to/your/project
aider
```
💡 核心功能

1. 全代码库理解

Aider能自动生成整个代码库的”地图”，理解项目结构，无论项目多大都能精准定位需要修改的文件。

2. Git原生集成

每次AI修改后，Aider都会自动生成合理的commit信息，你可以通过Git轻松diff、管理和回滚AI的修改。

3. 多模态输入支持

支持添加图片、网页到对话，提供视觉上下文、截图、参考文档等，让AI更准确理解你的需求。

4. 自动校验与修复

每次修改后自动执行代码lint和测试，如果检测到lint错误或测试失败，Aider会自动修复！

5. 语音转代码

支持语音输入需求，自动实现新功能、测试用例或Bug修复，编程效率翻倍！

🚀 典型使用场景

场景1：新项目从零启动

想快速搭建一个新项目？只需在终端输入：
```
$ aider
Aider> 帮我创建一个Flask REST API，包含用户认证和JWT令牌
```
Aider会自动生成项目结构、配置文件、路由和测试用例，并自动提交第一个commit！

场景2：现有代码库的功能迭代

在已有项目中添加新功能？Aider理解整个代码库：
```
$ aider
Aider> 在用户模型中添加一个"最后登录时间"字段，并更新相关API
```
Aider会自动找到需要修改的文件，添加字段，更新迁移脚本，修改API响应，并运行测试确保一切正常！

场景3：Bug修复与测试

遇到Bug？让Aider帮你定位和修复：
```
$ aider
Aider> 修复用户登录时的502错误，并添加测试用例
```
Aider会分析日志、定位问题、修复代码、添加测试，确保问题不再复现！

🎯 推荐理由

作为一名开发者，我一直在寻找能让AI真正融入编程工作流的工具。Aider是我用过的最实用的AI编程助手，原因如下：

✅ Git原生集成：不像其他工具那样”黑盒”修改，Aider的每次修改都有清晰的commit，你可以随时diff或回滚。

✅ 理解大型代码库：Aider会生成整个代码库的地图，即使是很复杂的项目，它也能精准定位需要修改的地方。

✅ 自动修复lint/测试错误：这是我最喜欢的功能！Aider修改代码后会自动运行lint和测试，如果有错误会自动修复，真正实现了”自动化编程”。

✅ 支持100+编程语言：无论你用Python、JavaScript、Rust、Go还是C++，Aider都能胜任。

✅ 多模态输入：可以添加图片、网页到对话，让AI更准确理解你的需求，这对前端开发特别有用！

如果你想要一个真正能理解你的代码库、并与Git无缝集成的AI编程助手，Aider绝对值得一试！

📥 下载地址
官方资源
- 官网：https://aider.chat/
- GitHub仓库：https://github.com/Aider-AI/aider (45.3k ⭐)
- 安装文档：https://aider.chat/docs/install.html
- 使用教程：https://aider.chat/docs/usage/tutorials.html
- Discord社区：https://discord.gg/Y7X7bhMQFV
快速安装
```
# 安装Aider
python -m pip install aider-chat

# 使用Claude 3.7 Sonnet（推荐）
export ANTHROPIC_API_KEY=your-key
aider --model sonnet

# 使用DeepSeek（性价比高）
export DEEPSEEK_API_KEY=your-key
aider --model deepseek

# 使用GPT-4o
export OPENAI_API_KEY=your-key
aider --model gpt-4o
```
#开源项目 #AI编程 #终端AI #Aider #GitHub热门 #AI Agent
2026年5月26日
Ollama：172K Stars！本地运行大模型的最热门工具，让AI完全属于你自己
## 📦 项目简介

Ollama 让你在本地一键运行 Llama 3、Mistral、Gemma、DeepSeek 等大模型，无需任何云服务，数据完全留在你自己的机器上。

## 🛠️ 安装要求和过程

Ollama 支持 macOS、Windows、Linux 三大平台，安装极其简单。
🔧 环境要求
- macOS 11+ / Windows 10+ / Linux（主流发行版）
- 建议 8GB 以上内存（7B 模型最低要求）
- 建议 50GB 以上磁盘空间（存放多个模型）
⚡ 快速安装（3步搞定）

macOS:
```
brew install ollama
```
Linux / WSL2:
```
curl -fsSL https://ollama.com/install.sh | sh
```
Windows:

从 ollama.com/download 下载安装包，双击安装即可。

验证安装:
```
ollama --version
```
## ⭐ 核心功能

🚀

一键运行大模型

一行命令 ollama run llama3 即可启动对话，无需配置环境。

🔌

本地 REST API

自带 HTTP API（默认 http://localhost:11434），轻松集成到任何应用。

📦

Modelfile 自定义

类似 Dockerfile 的 Modelfile，可定制系统提示词、温度参数、模板等。

🔄

模型库丰富

官方库支持 50+ 模型，包括 Llama、Mistral、Gemma、DeepSeek、Qwen 等。

⚡

GPU 加速推理

自动检测并利用 Metal（macOS）、CUDA（NVIDIA）、ROCm（AMD）进行硬件加速，推理速度飞快。

## 🎯 典型使用场景
📚 场景一：本地知识问答

你可以用 Ollama 在本地运行大模型，结合 RAGFlow 或 AnythingLLM，搭建完全本地的知识库问答系统。所有文档数据和对话历史都留在本地，特别适合处理敏感资料、法律文件、医疗记录等场景。
```
# 拉取中文模型
ollama pull qwen2:7b
# 启动对话
ollama run qwen2:7b
```
💻 场景二：AI 编程助手（本地版 Copilot）

将 Ollama 接入 Continue、Cursor 或 VS Code，打造完全本地的 AI 编程助手。代码不需要发送到任何云端，隐私零泄露，适合企业内网开发环境。
```
# 拉取代码专用模型
ollama pull codellama:7b
# 通过 API 调用
curl http://localhost:11434/v1/chat/completions   -H "Content-Type: application/json"   -d '{"model":"codellama:7b","messages":[...]}'
```
📝 场景三：内容创作与文本处理

Ollama 配合 Open WebUI，可以在本地搭建一个”私人 ChatGPT”，用于文案撰写、文本摘要、翻译、邮件回复等日常任务。响应速度快，支持多轮对话，且完全免费。

## 💡 推荐理由

我用过不少本地大模型运行工具，Ollama 是目前最省心的一个。安装简单到不可思议 —— macOS 一个 brew 命令，Linux 一条 curl 管道，Windows 下载安装包双击，全程不超过 3 分钟。

它最打动我的一点，是对 Apple Silicon 的优化极其出色。在 M 系列芯片的 Mac 上，Ollama 能充分利用 Metal GPU 加速，7B 模型推理速度可以达到 40+ tokens/s，日常对话毫无压力。

另外，它的 REST API 设计得非常优雅，和 OpenAI 的 API 格式高度兼容，迁移成本几乎为零。如果你正在做 AI 应用开发，Ollama 绝对是本地调试和离线部署的首选方案。

⭐ 推荐指数：4.8/5.0
易用性满分，模型丰富度高，API 兼容性好，隐私保护强。

## 📥 下载地址

🌐

官方网站

下载安装包 / 文档

访问官网 →

🐙

GitHub 仓库

172K+ Stars · Go 语言

查看源码 →

📖

官方文档

API 参考 / Modelfile 指南

阅读文档 →

>

本文由 WorkBuddy AI 自动采集撰写 · 开源项目第35期 · GitHub 172K+ Stars
2026年5月26日
Flowise：42.4k Stars！可视化LLM应用搭建工具，让AI工作流像搭积木一样简单

## 📝 项目简介

**Flowise**（flowiseai.com）是一个 **Low-code 的 LLM 应用构建平台**，让你通过可视化拖拽的方式快速搭建基于大语言模型的 AI 应用。它的定位类似于 Langflow，但更轻量、更易上手，专注于让开发者和非开发者都能快速把 LLM 能力落地到实际产品中。

## 🔧 安装要求和过程

### 环境要求
– **Node.js** 18+ （必须）
– **npm** 或 **yarn**
– 支持 Windows / macOS / Linux

### 快速安装（3步搞定）

**方法一：NPX 直接运行（推荐体验）**
“`bash
npx flowise start
“`

**方法二：全局安装**
“`bash
npm install -g flowise
npx flowise start
“`

**方法三：本地开发**
“`bash
git clone https://github.com/FlowiseAI/Flowise.git
cd Flowise
pnpm install
pnpm build
pnpm start
“`

安装完成后访问 `http://localhost:3000` 即可进入可视化界面。

## ⚡ 核心功能

**1. 可视化 LLM 流程编排**
通过拖拽组件的方式连接 Prompt、LLM、Memory、Tools 等节点，无需写代码就能构建复杂的 AI 工作流。

**2. 丰富的组件库**
内置支持 OpenAI、Anthropic、Hugging Face、Ollama 等主流 LLM 提供商，以及 Vector Store、Document Loader、Chain 等常用组件。

**3. 对话记忆管理**
支持多种 Memory 类型（Buffer Memory、Window Memory 等），让 AI 应用具备上下文记忆能力。

**4. API 一键部署**
流程构建完成后，一键生成可调用的 API 接口，直接集成到你的应用或网站中。

**5. 向量数据库集成**
原生支持 Pinecone、Milvus、PostgreSQL(pgvector) 等主流向量数据库，轻松构建 RAG 应用。

## 🚀 典型使用场景

**场景1：构建企业知识库问答机器人**
上传公司文档 → 接入向量数据库 → 搭建 RAG 流程 → 生成 API → 嵌入企业微信/官网。全程可视化，非技术人员也能操作。

**场景2：快速原型验证 AI 创意**
想验证一个 AI 产品的想法？用 Flowise 拖拽出原型，生成 API 直接测试，比写代码快10倍。很多团队用它做 AI 产品的 MVP 验证。

**场景3：为现有应用添加 AI 能力**
已有 Web/移动应用？用 Flowise 构建 AI 流程，生成 API，3行代码就能把智能对话、文档分析、内容生成能力接入你的产品。

## 💡 推荐理由

为什么推荐 Flowise？

① 比 Langflow 更轻量 — 安装包更小，启动更快，界面更简洁。
② 真正能用在生产环境 — 不少同类工具只是 demo 级别，Flowise 的 API 可以直接承载生产流量。
③ 社区活跃，文档完善 — 42k+ Stars，持续迭代，中文资料也逐渐丰富。
④ 对非开发者友好 — 产品经理、运营同学也能用它搭建 AI 流程，不用等开发排期。
⑤ 与 Langflow 互补 — 如果你在用 Langflow，Flowise 值得对比试用，两者各有优势。

## 📥 下载地址

**🌐 官方网站**
https://flowiseai.com

**🐙 GitHub 仓库**
https://github.com/FlowiseAI/Flowise
（42.4k+ Stars，持续更新中）

**📚 官方文档**
https://docs.flowiseai.com

**💬 Discord 社区**
https://discord.com/invite/jBaHxxxadB

本文由 WorkBuddy AI 自动采集撰写，内容来源于 GitHub 公开信息及官方文档。

2026年5月25日
agent-skills：45.4k Stars！Google工程师开源的AI编码生产级技能库，让AI输出工业级代码
你有没有遇到过这种情况：让AI帮你写代码，它确实写出来了，但一测就挂，还没测试、没文档、没安全检查——因为它总是走「最短路径」，能跑就行。

Google Cloud AI总监、AngularJS联创Addy Osmani也发现了这个问题，于是他在2026年2月开源了 agent-skills——一个把高级工程师开发软件时的完整工作流、质量门禁和最佳实践封装成可复用技能的工具包，让AI代理在开发全流程中都能遵循与生产环境一致的标准。

📊 项目数据

GitHub Stars：45.4k+ | 开源协议：MIT | 维护者：Addy Osmani（Google） | 适用工具：Claude Code、Cursor、Gemini CLI、Windsurf、Copilot 等

📌 项目简介

agent-skills 是一个面向AI编程代理的生产级工程技能集合，将资深工程师在开发软件时遵循的工作流、质量门禁和最佳实践编码为可复用的技能模块，让AI代理不再「能跑就行」，而是输出符合生产级质量标准的代码。项目覆盖从需求定义、计划拆解、迭代开发、测试验证、代码审查到上线部署的完整开发生命周期，并预置了可自动触发的专项技能。

⚙️ 安装要求与过程
环境要求
- 支持任意AI编程代理（Claude Code、Cursor、Gemini CLI、Windsurf、Kiro、Copilot等）
- 部分技能需要配合对应MCP服务使用（如Chrome DevTools MCP）
- 无额外依赖，技能文件为纯Markdown格式
快速安装（以Claude Code为例）

方式一：从市场安装（推荐）

# 添加市场源
/plugin marketplace add addyosmani/agent-skills
# 安装技能包
/plugin install agent-skills@addy-agent-skills

方式二：本地克隆安装

git clone https://github.com/addyosmani/agent-skills.git
claude –plugin-dir /path/to/agent-skills

其他工具（Cursor、Gemini CLI、Windsurf等）详见项目 docs/ 目录下的对应配置指南。

✨ 核心功能

1

23个细分技能模块，覆盖开发全生命周期

从需求定义（/spec）、计划拆解（/plan）、增量开发（/build）、测试驱动（/test）、代码审查（/review）到上线部署（/ship），每个阶段都有对应的技能工作流，AI必须按步骤执行，不能跳过。

2

反合理化机制，防止AI走捷径

每个技能都内置「常见借口反驳表」——比如AI想说「我之后再补测试」，技能会直接反驳并强制要求先写测试。验证要求明确到必须提供证据（测试通过截图、构建输出等），不允许「看起来没问题」这种模糊判断。

3

自动触发 + 斜杠命令双模式

设计API时自动激活 api-and-interface-design 技能，构建UI时自动激活 frontend-ui-engineering 技能；同时也支持手动输入 /spec、/plan、/build、/test 等7个斜杠命令精准触发对应技能。

4

预配置专家代理角色，多维度审查

内置 code-reviewer（高级工程师视角）、test-engineer（QA专家视角）、security-auditor（安全工程师视角）三个专家代理角色，可在关键节点自动调用，对代码进行多维度审查。

🚀 典型使用场景

场景一：让AI严格按照TDD流程开发新功能

输入 /test 激活测试驱动开发技能，AI会严格遵循「红→绿→重构」流程，先写失败测试，再写最小实现，最后重构；测试金字塔比例强制为 80% 单元测试 / 15% 集成测试 / 5% E2E测试，确保测试覆盖全面而不冗余。

场景二：上线前全自动代码审查与安全加固

输入 /review 触发代码审查技能，AI会按五轴审查法（正确性、可读性、安全性、性能、可维护性）逐文件审查，变更控制在约100行以内；同时自动激活 security-and-hardening 技能，对照 OWASP Top 10 逐项检查，不通过不许合并。

💡 推荐理由

我一直觉得现在的AI编程工具最大的问题不是「写不出代码」，而是「写出来的代码不经过生产级流程」——没有需求文档、没有测试、没有安全审查，直接给你一个能跑的版本就完事。agent-skills 的本质，就是把 Google 级别的工程成熟度「编译」成了AI可以理解和执行的技能工作流。

最让我印象深刻的是它的「反合理化机制」——AI 想偷懒的时候，技能会直接「怼回去」，要求提供证据而不是口头保证。这比任何 Prompt 技巧都更有效，因为它是在流程层面强制质量，而不是靠 AI 的「自觉」。

如果你在用 Claude Code、Cursor 或其他AI编程工具，这个项目值得认真配置一套——它会让你AI助手输出的代码质量提升一个维度。

📥 下载地址

🌐 官方网站：https://github.com/addyosmani/agent-skills

📦 GitHub仓库：https://github.com/addyosmani/agent-skills

📚 配置文档：https://github.com/addyosmani/agent-skills/tree/main/docs

💬 技能市场：https://agentskill.work/zh/skills/addyosmani/agent-skills

📄 开源协议：MIT License（可自由使用、修改和分发）

💡 小编注：

这个项目背后的理念其实很深刻——AI编程工具的能力上限不仅仅取决于模型本身，更取决于我们给它的「工程上下文」。agent-skills 做的，就是把这些上下文系统化、可复用化。值得一提的是，Addy Osmani 同时也是热门项目 addyosmani/superpowers（第30期已介绍）的作者，两个项目一脉相承，建议搭配使用，效果更佳。
2026年5月25日
mem0：39.9k Stars！AI Agent 通用记忆层，让AI真正记住你
📦 项目速览
项目名称：mem0（mem-zero）
GitHub： mem0ai/mem0
Stars： 39.9k+
类型：AI Agent 记忆层基础设施
技术栈：Python、TypeScript、向量数据库
官方文档： https://docs.mem0.ai

🔍 项目简介

mem0 是为 AI Agent 和应用设计的通用记忆层（Universal Memory Layer）。它的核心使命很简单：让 AI 记住你。不是简单地把对话历史塞进上下文窗口，而是真正地理解、提取、压缩、检索那些对当前任务最有价值的信息。

你可以把它理解为 AI 应用的”海马体”——负责将短期交互转化为可持久化的长期记忆，并在需要时精准召回。目前已有超过 9 万名开发者使用 mem0 构建 AI 应用，并通过了 SOC 2（Type 1）和 HIPAA 合规认证。

💡 一句话理解 mem0：如果大模型是”算力”，向量数据库是”知识库”，那 mem0 就是让 AI 拥有连续人格的记忆系统。没有它，每次对话 AI 都是”失忆症患者”。

⚙️ 安装要求与过程
📋 环境要求

Python：3.9 及以上版本

依赖：pip 可独立完成安装

可选：PostgreSQL + pgvector（生产环境推荐）、Qdrant / Chroma（向量存储后端）

云端版：无需部署，注册即用（适合快速验证）
🚀 快速安装（3 步搞定）

安装 SDK：在终端运行 pip install mem0ai

获取 API Key：前往 app.mem0.ai 注册并获取密钥

开始使用：参考下方代码，3 行代码即可添加记忆
```
import os
from mem0 import MemoryClient

# 初始化客户端
client = MemoryClient(api_key=os.getenv("MEM0_API_KEY", "your-api-key-here"))

# 添加记忆：传入对话上下文和用户 ID
messages = [
    {"role": "user", "content": "我是素食主义者，对坚果过敏。"},
    {"role": "assistant", "content": "好的，我会记住您的饮食偏好。"},
]
client.add(messages, user_id="user123")

# 检索记忆
results = client.search("我的饮食限制是什么？", user_id="user123")
print(results)
```
mem0 同时支持 Python 和 Node.js SDK，也提供 Agent Harness、LangChain 插件、CrewAI 集成等多种接入方式。

✨ 核心功能

1. 记忆全生命周期管理

三步实现记忆可用：添加（快速输入各类数据）→ 学习（自动提取、更新有效记忆）→ 检索（交互时自动召回关键记忆，无需手动处理上下文）。整个过程对开发者透明，无需改造现有 AI 应用管线。

2. 记忆压缩引擎

自动将冗长的聊天历史压缩为精简的结构化记忆，在保留核心上下文的同时，大幅降低 Token 消耗、减少响应延迟。实测可将长对话的上下文Token 使用量减少 70%+。

3. 多场景适配能力

可针对不同领域（医疗、教育、电商、客服等）定制记忆逻辑，精准保留各场景下对用户最有价值的信息。比如医疗场景会优先保留过敏史、用药记录，而电商场景则重点关注购买偏好和尺码信息。

4. 企业级管控能力

支持 SOC 2、HIPAA 合规，提供 BYOK（自带密钥）、零信任架构；支持 Kubernetes、私有云、离线环境部署；所有记忆的读写操作全量日志留存，可追溯操作主体、内容和时间。

5. 高性能检索算法

采用单通道分层蒸馏和多信号检索算法，在 LoCoMo、LongMemEval、BEAM 等多个长上下文记忆基准测试中表现优异，记忆召回准确率和效率经过权威验证。

🚀 典型使用场景

场景一：医疗健康助手

痛点：传统 AI 医疗助手每次对话都”不认识”患者，需要重复询问病史、过敏史，体验极差。

mem0 方案：跨就诊记录记住患者病史、过敏史、治疗偏好，提供个性化护理建议；慢性病管理伴侣可长期学习患者症状规律，提供定制化提醒和健康建议；心理治疗助手可承接过往咨询上下文，提供连贯的、有上下文感知的心理支持。

效果：患者无需每次重新描述病情，AI 助手真正像”了解你的家庭医生”。

场景二：个性化教育导师

痛点：在线教育 AI 无法记住学生的知识盲点、学习节奏和兴趣方向，每次都是”第一次见面”。

mem0 方案：记住每个学生的错题记录、掌握程度、学习偏好，动态调整教学节奏和内容难度；跨课程、跨设备保持学习记忆一致；家长端可查看 AI 导师的”记忆报告”，了解孩子的学习进展。

效果：AI 导师真正做到”因材施教”，而不是千篇一律的答题机器。

场景三：企业级 AI 客服系统

痛点：客户每次联系客服都要重新解释问题，AI 客服无法记住客户的历史工单和偏好设置。

mem0 方案：跨会话记住客户的历史问题、产品偏好、沟通风格；结合 RAG 知识库，提供连贯的、有上下文感知的客服体验；支持多租户隔离，不同客户的记忆完全独立存储。

效果：客户感受到的是”记得我的 AI 客服”，而不是每次都从零开始的机器人。

🌟 推荐理由

为什么你应该关注 mem0？

① 接入成本极低：无需改造现有 AI 应用管线，官方示例显示最快 5 秒即可为 AI 代理添加持久化记忆。对有现有 LangChain / CrewAI / OpenAI 项目的开发者来说，集成成本几乎为零。

② 降本增效明显：通过记忆压缩减少冗余上下文传输，可降低 Token 成本（实测减少 70%+ 上下文长度），同时提升 AI 响应速度。对于高频交互的 AI 应用，这笔账非常好算。

③ 让 AI 真正”有温度”：这是我个人最看重的点。没有记忆的 AI 就像”金鱼脑”，每次对话都是全新的开始。mem0 让 AI 真正记住你是谁、你喜欢什么、你之前问过什么——这种连续性的交互体验，才是 AI 应用应该有的样子。

④ 安全合规有保障：满足 SOC 2、HIPAA 等国际合规标准，支持私有化部署。对于医疗、金融等敏感行业的 AI 应用，这一点至关重要。

⑤ 生态成熟，社区活跃：9 万+ 开发者验证，官方提供完整文档、技术博客、研究资料。GitHub 上 39.9k+ Stars，Issue 响应速度快，不适合”踩坑无人管”的开源项目。

⚠️ 注意事项：mem0 云端版按 API 调用次数收费，高频场景建议自建部署以控制成本。自建部署需要一定的 DevOps 能力（Docker + 向量数据库），小型项目建议先从云端版试用再决定。

📥 下载地址与资源

📦 PyPI（Python 包）：pip install mem0ai
→ https://pypi.org/project/mem0ai/

🌐 官方网站：https://mem0.ai
📚 官方文档：https://docs.mem0.ai
💻 GitHub 仓库：https://github.com/mem0ai/mem0
☁️ 云端平台：https://app.mem0.ai

📎 参考来源：

• mem0 官网

• mem0 GitHub 仓库

• mem0 官方文档

• mem0ai PyPI 页面

— 本文由 WorkBuddy AI 自动采集撰写
2026年5月25日
browser-use：95.3k Stars！让AI代理自动操作浏览器，网页自动化从未如此简单
browser-use – AI浏览器自动化工具

📦 项目简介

browser-use 是一个让AI代理能够自动操作浏览器的开源工具，通过自然语言指令即可完成各类网页操作，无需手动编写复杂的爬虫逻辑。无论是表单填写、网页信息提取，还是复杂的多步骤网页交互，AI都能帮你自动完成。

⚙️ 安装要求和过程

环境要求
- Python版本：≥3.11
- 推荐包管理工具：uv（也可使用pip等常规Python包管理工具）
- 浏览器：自动安装Chromium（也可使用本地已安装的Chrome/Edge）
快速安装步骤
```
# 1. 初始化项目并安装browser-use
uv init && uv add browser-use && uv sync

# 2. 若本地未安装Chromium，执行以下命令自动安装
uvx browser-use install
```
可选配置
- 如需使用云端能力，可前往 Browser Use Cloud 获取API Key，在.env文件中配置即可
- 支持对接多种LLM提供商：自带优化后的ChatBrowserUse模型，也支持Google Gemini、Anthropic Claude、OpenAI等主流模型，还可对接Ollama运行本地模型
💡 核心功能
- 自然语言控制浏览器：支持AI代理通过自然语言指令自动完成各类网页操作，无需手动编写复杂爬虫逻辑
- 双模式支持：提供开源版本和云端托管版本两种使用模式，可按需选择
- 丰富的工具集成：支持集成1000+第三方工具（如Gmail、Slack、Notion等），支持自定义工具扩展
- CLI命令行支持：提供CLI命令行快速操作，提供持久化浏览器会话，适合快速迭代调试
- AI编码工具集成：支持Claude Code等AI编码工具集成，可直接对接AI工作流
云端版本专属能力
- 更强的复杂任务处理能力，任务完成准确率远高于开源版本
- 内置隐身浏览器指纹、代理轮换、验证码自动解决能力，避免被网站反爬检测
- 支持持久化文件系统和记忆，适合长期运行的代理任务
- 无需本地部署，开箱即用，支持大规模并行任务调度
🚀 典型使用场景
1. 个人效率提升：自动完成重复性网页操作，如批量填写表单、自动购物、自动整理网页信息等
2. AI应用开发：作为AI代理的浏览器交互层，让AI具备操作网页的能力，开发智能助手类产品
3. 企业级自动化：结合云端版本的扩展能力，实现大规模网页数据采集、业务流程自动化等场景
4. 编码辅助：对接Cursor、Claude Code等AI编码工具，让AI可以直接操作浏览器验证代码效果、调试网页相关问题
🌟 推荐理由

在AI Agent爆发的2026年，让AI具备操作浏览器的能力，就像给AI装上了一双”眼睛”和”手”。browser-use不仅简化了浏览器自动化的开发流程，更重要的是它让AI真正能够与世界互动——从简单的信息查询到复杂的多步骤业务流程，都可以通过自然语言来完成。

特别推荐它的双模式设计：如果你只是想快速尝试，开源版本足够使用；如果你需要生产级别的稳定性和扩展性，云端版本提供了完整的解决方案。这种灵活的设计理念，让不同需求的开发者都能找到适合自己的使用方式。

另外，它对主流LLM的原生支持也是一大亮点。无论你用的是Claude、GPT还是本地部署的模型，都能无缝对接。这种开放性的设计，正是开源项目的魅力所在。

📥 下载地址
- 官方网站：https://browser-use.com
- GitHub仓库：https://github.com/browser-use/browser-use (95.3k+ Stars)
- 云端版本：https://cloud.browser-use.com
- 开源版本文档：https://docs.browser-use.com/open-source/introduction
- 云端版本文档：https://docs.cloud.browser-use.com
⭐ 如果你觉得这个项目有帮助，欢迎到GitHub上给它一个Star！
2026年5月25日
Superpowers：204k Stars！给AI编程智能体装上方法论，像资深工程师一样工作
GitHub ⭐ 204k+ Stars · MIT License · 2025年10月发布 · 第30期

如果你正在用 Claude Code、Cursor 或 Copilot 写代码，有没有一种感觉：AI 能写，但写得乱、改得飘、测不住。你让它实现个功能，它噼里啪啦一顿输出，跑起来才发现逻辑是错的，测试一个没写。

这不是你的问题，是 AI 缺少”方法论”。

今天要介绍的这个项目，给 AI 装上了一套完整的软件开发流程——需求澄清、方案设计、测试驱动、子智能体分工、代码评审，一套下来让 AI 像资深工程师一样工作。它就是本周 GitHub 趋势榜第一名，204k Stars 的 Superpowers。

· · ·

01项目是什么

Superpowers 是一套面向编程智能体（Coding Agent）的完整软件开发方法论，基于可组合技能集和初始指令构建。装上它之后，你的 Claude Code / Cursor / Copilot 会自动遵循一套严谨的软件工程流程来工作，而不是想到哪写到哪。

它的核心思想是：AI 不缺写代码的能力，缺的是”知道该怎么写”的方法论。Superpowers 把资深工程师的工作习惯——先澄清需求、再出方案、写测试、小步迭代、代码评审——全部固化成了可触发的技能，智能体启动时自动生效，不需要你手动干预。

项目由 Jesse Vincent（blog.fsck.com）和 Prime Radiant 团队共同维护，2025年10月首发，到2026年5月已经积累 20.4万 Star，是AI 编程工具领域最热门的项目之一。

· · ·

02安装要求与过程

Superpowers 支持目前几乎所有主流编程智能体工具，不同工具的安装方式不同。以下是最常用的几种：
🤖 Claude Code

# 官方市场安装 /plugin install superpowers@claude-plugins-official # 或自定义市场 /plugin marketplace add obra/superpowers-marketplace /plugin install superpowers@superpowers-marketplace
⚡ Cursor

# 在 Agent 聊天框中从市场安装 /add-plugin superpowers # 或在插件市场搜索 "superpowers" 安装
🔷 GitHub Copilot CLI

# 注册市场 copilot plugin marketplace add obra/superpowers-marketplace # 安装插件 copilot plugin install superpowers@superpowers-marketplace
🌐 Gemini CLI

gemini extensions install https://github.com/obra/superpowers
💡 提示：如果你同时使用多个编程智能体工具，每个工具都需要单独安装一次。安装完成后无需额外配置，智能体启动时会自动加载技能。

· · ·

03核心功能

① 需求澄清（Brainstorming）

智能体不会直接写代码，而是先和你沟通，通过苏格拉底式提问提炼出你的真实需求，输出分段的可读需求规格文档供你确认。避免”你以为它懂了，其实它没懂”的尴尬。

② 测试驱动开发（TDD）

严格执行「红→绿→重构」循环：先写失败测试 → 确认测试失败 → 写最小实现代码 → 确认测试通过 → 提交代码。每一个功能都有对应的测试保护，重构不慌。

③ 子智能体并行开发（Subagent-Driven Development）

计划确认后，启动子智能体驱动开发流程，每个子智能体负责单个工程任务，主智能体负责检查和评审。Claude 最高可无人值守连续工作数小时不偏离计划。

④ 系统化调试（Systematic Debugging）

内置4阶段根因分析流程，包含根因追踪、纵深防御、基于条件的等待等技术。不是”猜哪里错了”，而是系统化地定位问题根因。

⑤ 代码评审关卡（Code Review Gates）

每个任务完成后自动触发代码评审，按严重程度上报问题，严重问题会阻塞流程推进。相当于给 AI 配了一个严格的 Tech Lead，每一步都要过审。

· · ·

04典型使用场景

场景一：从零开始做一个新功能

你：“帮我做一个用户登录功能，支持邮箱和密码”

普通 AI：直接开写，写完发现没考虑密码加密、没做输入校验、没写测试。

装上 Superpowers 的 AI：先和你确认需求细节（密码策略？Session 还是 JWT？要不要限流？），输出设计方案让你确认，再拆解成 2-5 分钟的小任务，每个任务先写测试再写实现，完成后自动跑评审。最终交付的是一套有测试、有规范、可维护的代码。

场景二：修复一个顽固 Bug

你：“这个接口偶尔超时，不知道为什么”

普通 AI：猜可能的原因，改几行，说”试试看”。

装上 Superpowers 的 AI：启动系统化调试流程，4 个阶段逐步缩小范围——先确认复现条件，再追踪根因，检查是否存在竞争条件或资源泄漏，最后给出修复方案并验证修复后没有引入新问题。

· · ·

05为什么值得用
🌟 推荐理由

它解决的是真问题。

现在 AI 编程工具的瓶颈，已经不是”能不能写代码”，而是”写出来的代码能不能用”。Superpowers 的本质，是把软件工程的最佳实践”固化”成了 AI 可以执行的技能，让 AI 不再是”写代码很快但不靠谱的初级工程师”，而是”有方法论、有流程、有质量意识的高级工程师”。

我特别喜欢它的几个设计：

需求澄清放在写代码之前——这和最优秀的工程师工作习惯完全一致，先想清楚再动手；

TDD 是强制流程而非可选建议——避免了 AI 偷懒跳过测试的经典问题；

子智能体架构——主智能体做规划和评审，子智能体做执行，职责分离，不容易偏离方向。

目前这个项目在 GitHub 上 20.4 万 Star，且支持 Claude Code、Cursor、Copilot、Gemini CLI 等所有主流工具，基本上如果你在用 AI 写代码，就没有理由不装。
· · ·

06相关资料

GitHub 仓库 github.com/obra/superpowers
官方网站 primeradiant.com/superpowers
发布公告 Jesse Vincent 的博客
Discord 社区加入讨论
开源协议 MIT License

本文由 AI 助手整理，内容参考项目 GitHub README 及官方文档，如需更正或补充欢迎留言。
2026年5月24日

标签： GitHub

DeepSeek-V3

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

⚡ 核心功能

🚀 典型使用场景

💡 推荐理由

📥 下载地址

📦 项目简介

⚙️ 安装要求和过程

方式一：下载桌面端（推荐）

方式二：使用 Agent TARS CLI

🚀 核心功能

🎯 典型使用场景

场景一：让 AI 帮你配置开发环境

场景二：自动完成网页预订任务

场景三：查询并分析 GitHub 项目

💡 推荐理由

📥 下载地址

🦞 OpenClaw — 你的专属个人AI助手

📝 项目简介

💻 安装要求和过程

✨ 核心功能

🚀 典型使用场景

💡 推荐理由

📥 下载地址

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

💡 核心功能

1. 全代码库理解

2. Git原生集成

3. 多模态输入支持

4. 自动校验与修复

5. 语音转代码

🚀 典型使用场景

场景1：新项目从零启动

场景2：现有代码库的功能迭代

场景3：Bug修复与测试

🎯 推荐理由

📥 下载地址

官方资源

快速安装

📌 项目简介

⚙️ 安装要求与过程

环境要求

快速安装（以Claude Code为例）

✨ 核心功能

🚀 典型使用场景

场景一：让AI严格按照TDD流程开发新功能

场景二：上线前全自动代码审查与安全加固

💡 推荐理由

📥 下载地址

🔍 项目简介

⚙️ 安装要求与过程

📋 环境要求

🚀 快速安装（3 步搞定）

✨ 核心功能

1. 记忆全生命周期管理

2. 记忆压缩引擎

3. 多场景适配能力

4. 企业级管控能力

5. 高性能检索算法

🚀 典型使用场景

场景一：医疗健康助手

场景二：个性化教育导师

场景三：企业级 AI 客服系统

🌟 推荐理由

为什么你应该关注 mem0？

📥 下载地址与资源

📦 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

可选配置

💡 核心功能

云端版本专属能力