标签：开源

ComfyUI：109K Stars！最强节点式AI绘画工具，工作流可视化让创作更自由
ComfyUI 节点式工作流界面

📘 项目简介

ComfyUI 是一款功能最强大的开源生成式AI节点式应用程序，也是用于生成式AI的节点式界面和推理引擎。由 comfyanonymous 及众多贡献者开发，完全开源，支持在本地Windows、Linux、macOS设备上运行。用户可以通过节点组合各类AI模型和操作，实现高度可定制、可控的内容生成。

核心特点：
- GitHub Stars：109K+
- 开发语言：Python + JavaScript
- 开源协议：GPL-3.0
- 官网：https://www.comfy.org/
- GitHub：https://github.com/Comfy-Org/ComfyUI
💻 安装要求和过程

环境要求
硬件要求

显卡：NVIDIA GPU (推荐) 或 AMD GPU，至少 4GB 显存

内存：建议 16GB 以上

存储：至少 10GB 可用空间（用于模型文件）
软件要求

Python：3.9 – 3.12

Git：用于克隆仓库

CUDA：12.4+ (NVIDIA GPU)
快速安装步骤

# 方法一：使用官方桌面应用（推荐）
# 访问 https://comfy.org/download 下载安装

# 方法二：从源码安装
# 1. 克隆仓库
git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI

# 2. 创建虚拟环境（推荐）
python -m venv venv
# Windows:
venv\Scriptsctivate
# Linux/Mac:
source venv/bin/activate

# 3. 安装依赖
pip install -r requirements.txt

# 4. 启动 ComfyUI
python main.py

# 5. 访问浏览器
# 打开 http://127.0.0.1:8188

便携版（Windows）：

如果不想配置环境，可以下载官方提供的独立便携包，解压即可使用，无需安装Python和依赖。

⚙️ 核心功能

1. 节点式工作流搭建

通过可视化节点连接的方式组合AI模型、业务逻辑，灵活定制生成流程。每个节点代表一个功能模块（加载模型、输入提示词、采样、保存图像等），通过连线定义数据流。

2. 多模态内容生成

支持图像、视频、音频、3D等多种类型的内容生成，覆盖生成式AI主流应用场景。原生支持最新的开源SOTA模型。

3. 自定义扩展能力

支持自定义节点开发和发布，可对接第三方模型、工具，拓展功能边界。拥有丰富的社区插件生态，可以通过 ComfyUI Manager 一键安装扩展。

4. 工作流管理与复用

支持工作流模板复用、子图拆分、部分执行等特性。完成的工作流可以保存为JSON文件，方便分享和复用。内置 Comfy Hub 功能，可探索全球顶尖创作者的公开工作流。

5. API 与自动化对接

支持通过 MCP 协议连接AI智能体，实现生成任务的自动化调用。提供完整的 REST API，可以无缝集成到现有工作流中。

🎯 典型使用场景

场景一：AI 艺术创作者

需求：创作者需要精细控制AI绘画的每一个环节，尝试不同的模型组合和参数调整。

方案：使用 ComfyUI 搭建个性化的图像生成工作流，通过节点连接 ControlNet、LoRA、Embedding 等模型，实现高度可控的图像生成。可以保存多个工作流模板（如写实风格、动漫风格、概念设计等），一键切换。

优势：相比 WebUI，ComfyUI 的工作流方式让创作者能更清晰地理解生成过程，便于调试和优化。

场景二：AI 应用开发者

需求：开发者需要将AI图像生成功能集成到自己的应用或服务中，要求高并发、低延迟。

方案：利用 ComfyUI 的 API 模式，将工作流保存为JSON，通过 API 调用实现自动化图像生成。可以部署在服务器上，提供 HTTP 接口供其他应用调用。

优势：工作流可视化编辑，调试完成后一键部署，大幅降低开发门槛。

场景三：AI 研究与学习

需求：研究人员和学生需要深入理解扩散模型的各个组件和工作原理。

方案：ComfyUI 的节点式设计天然适合教学和研究。每个节点对应一个操作（如CLIP编码、VAE解码、KSampler采样等），可以清晰地看到数据流动和处理的全过程。

优势：模块化设计让实验和对比变得简单，方便快速验证新想法。

🌟 推荐理由

为什么推荐 ComfyUI？

1. 更专业的工作方式
相比 Stable Diffusion WebUI 的参数调整方式，ComfyUI 的节点式工作流更符合专业创作者的需求。它可以保存完整的工作流，方便复现和分享。

2. 更高的资源效率
ComfyUI 支持智能缓存，相同节点的计算结果会被复用，大幅减少重复计算。对显存的要求也相对更低。

3. 强大的社区生态
拥有超过 1000+ 自定义节点插件，覆盖各种功能需求。ComfyUI Manager 让插件安装变得极其简单。

4. 活跃的开发团队
由 comfyanonymous 主导开发，社区活跃度极高，Issues 和 PR 响应迅速，版本更新频繁。

5. 面向未来的设计
不仅支持图像生成，还在积极扩展视频、3D、音频等多模态生成能力，是真正的”生成式AI操作系统”。

使用心得：

我第一次使用 ComfyUI 时确实被满满的节点吓到了，感觉比 WebUI 复杂很多。但坚持使用后，我发现节点式工作流其实是更直观的方式——它让你看清AI绘画的每一个步骤。现在我已经积累了几十个工作流模板，从简单文生图到复杂的 ControlNet 组合，切换起来非常方便。如果你是想深入理解Stable Diffusion原理，或者需要高度定制化的生成流程，ComfyUI 绝对值得投入时间学习。

📥 下载地址
官方资源：

GitHub 仓库
 官方官网
 官方文档
 ComfyUI Manager

相关资源：

官方桌面应用：https://comfy.org/download (推荐新手使用)

Comfy Hub：https://www.comfy.org/hub (工作流分享社区)

模型下载：Hugging Face 或 Civitai

中文教程：B站搜索 “ComfyUI教程”
🎬 结语

ComfyUI 代表了AI创作工具的一个新方向——从”黑盒”转向”白盒”，从”简单参数调整”转向”可视化编程”。虽然学习曲线比 WebUI 陡峭，但一旦掌握，它将赋予你前所未有的控制力和创造力。

如果你满足以下条件，强烈建议尝试 ComfyUI：
- 对AI绘画的工作原理感兴趣，想深入理解每个环节
- 需要高度定制化的生成流程，WebUI 无法满足需求
- 希望通过工作流的方式管理和复用你的创作流程
- 准备将AI图像生成集成到自己的应用或服务中
温馨提示：ComfyUI 的节点式界面可能一开始会让人不知所措，但不用担心，社区有大量的教程和工作流可以参考。从简单的文生图工作流开始，逐步添加功能，你会发现这种方式的强大之处。

本文由 AI 辅助创作，开源项目信息来自 GitHub 官方仓库及社区贡献。
如果你觉得这个项目不错，欢迎到 GitHub 上给它一个 Star！
2026年6月8日
Ollama：170k Stars！本地LLM运行工具，让AI模型在本地飞速运行
配图

Ollama – 本地LLM运行工具

项目简介

Ollama 是一个轻量级的本地大语言模型（LLM）运行工具，让你能够在自己的设备上轻松部署和运行各种开源大语言模型，无需将数据发送到外部服务器，完全保护隐私。

截至2026年，Ollama 已在 GitHub 获得 17万+ Stars，成为最广泛使用的本地LLM运行时，Docker Hub下载量超过1亿次。

安装要求和过程

环境要求
- 操作系统：Linux（Ubuntu 20.04+）、macOS 11+、Windows 10（需WSL2）
- 内存：8GB以上（运行7B模型），16GB以上（运行13B模型），32GB以上（运行33B+模型）
- 存储：至少10GB可用空间（用于存放模型文件）
- GPU：可选，NVIDIA GPU（CUDA）、AMD GPU（ROCm）或苹果M系列芯片可加速推理
快速安装步骤

macOS/Linux 一键安装：
```
# Linux/macOS
curl -fsSL https://ollama.com/install.sh | sh

# macOS 也可用 Homebrew
brew install ollama
```
Windows 安装：
1. 访问 https://ollama.com/download 下载 Windows 安装包
2. 运行 OllamaSetup.exe，按照提示完成安装
3. 打开命令提示符或PowerShell，输入 ollama --version 验证安装
Docker 安装（推荐服务器环境）：
```
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
```
核心功能
1. 一键运行本地模型：支持一键拉取和运行100+开源大语言模型，包括 Llama 3.3、Mistral、Qwen、Phi、DeepSeek R1 等热门模型。
2. OpenAI API 兼容：原生提供兼容 OpenAI API 格式的 REST API（默认端口11434），可直接对接现有基于 OpenAI 生态开发的应用和工具。
3. 智能硬件加速：自动适配 NVIDIA（CUDA）、AMD（ROCm）、苹果 M 系列芯片（Metal）的 GPU 加速，大幅提升推理速度。
4. 模型自定义配置：支持通过 Modelfile 自定义模型参数（温度、上下文长度、系统提示词等），轻松创建专属模型。
5. 多模态支持：最新版本支持视觉模型（如 Llama 3.2 Vision），可处理图像输入，实现图文混合推理。
典型使用场景

场景一：开发者本地 AI 应用开发

作为开发者，你可以使用 Ollama 在本地运行 LLM，用于：
- 开发和测试 AI 应用，无需支付 API 费用
- 对接 Open-WebUI 等前端界面，搭建私有化 AI 聊天助手
- 通过 API 集成到自己的应用中，实现本地智能推理
示例：用 Ollama 运行 Llama 3.3 8B 模型，通过 OpenAI 兼容 API 为本地应用添加 AI 能力。

场景二：企业私有化部署

对于企业用户，Ollama 提供了：
- 数据隐私保护：所有推理过程在本地完成，敏感数据无需上传云端
- 零 API 成本：无需为每次 API 调用付费，适合高频调用场景
- 离线可用：模型下载后，无需联网即可使用，适合内网环境
推荐理由

我个人从2025年开始使用 Ollama，它已经成为我本地 AI 开发的标配工具。推荐理由如下：
1. 极简体验：一条命令就能安装，一条命令就能运行模型，对新手极其友好。
2. 生态丰富：支持对接 Open-WebUI、Continue（VS Code 插件）、LangChain 等50+主流工具，可玩性极高。
3. 性能优秀：支持 4-bit/8-bit 量化，即使在中端笔记本上也能流畅运行 7B 参数的模型。
4. 活跃社区：GitHub 上40000+社区集成，几乎任何你能想到的工作流，都有人已经做好了集成方案。
如果你想要一个简单、快速、隐私安全的本地 LLM 运行方案，Ollama 绝对是首选。

下载地址
- 官方网站：https://ollama.com
- GitHub 仓库：https://github.com/ollama/ollama
- 文档中心：https://github.com/ollama/ollama/blob/main/README.md
- 模型库：安装后运行 ollama pull <模型名> 即可拉取模型
2026年6月8日
Headroom：16.4k Stars！LLM上下文压缩层，最高省95% token消耗
用AI Agent干活，token消耗像流水。工具输出一多，日志一长，上下文就爆了。Headroom就是来解决这个问题的。

项目是什么

Headroom是一个面向AI Agent的上下文压缩层，在内容进入LLM之前先做压缩处理。工具输出、日志、RAG检索结果、代码文件、对话历史，统统可以压。官方数据说能省60-95%的token，而且答案质量不降。

安装要求和过程

要求Python 3.10以上。安装本身很简单：
```
# 全量安装（推荐）
pip install "headroom-ai[all]"

# Node.js版本
npm install headroom-ai

# Docker
docker pull ghcr.io/chopratejas/headroom:latest
```
如果你想按需安装，可以只装指定模块：[proxy]、[mcp]、[ml]、[code]、[memory]、[relevance]、[image]，不用全量。装完直接 headroom wrap claude 就能把Claude Code包起来用，零代码修改。

核心功能
- 三种接入模式：当作Python/TypeScript库直接调用 compress()，或者跑一个本地代理让任意应用零改动接入，或者直接wrap主流AI编码工具（Claude Code、Cursor、Aider、Copilot都支持）。
- MCP服务器模式：提供了 headroom_compress、headroom_retrieve、headroom_stats 三个工具，可以接进任何MCP客户端。对用Claude Desktop或者Cline的人很方便。
- 可逆压缩（CCR）：原始内容不会删，LLM觉得信息不够的时候可以通过工具调用把原始内容拿回来。不是有损压缩，是”按需取用”。
- 跨Agent共享内存：多个Agent（Claude、Codex、Gemini）可以共享同一套上下文存储，自动去重。做多Agent协作的人会喜欢这个功能。
- 自动学习：跑一下 headroom learn，它会去分析失败的会话，把修正规则自动写进 CLAUDE.md / AGENTS.md 这些配置文件。相当于Agent自己进化。
典型使用场景

先看数据。官方跑了一些真实工作负载的压缩测试：

工作负载类型压缩前token 压缩后token 压缩率

代码搜索（100条结果） 17,765 1,408 92%

SRE故障排查 65,694 5,118 92%

GitHub Issue分类 54,174 14,761 73%

实际场景里，最爽的是这两个：

第一，长日志排查。SRE场景里把6万多token的日志压缩到5千多，压缩率92%，而且LLM给出的排查结论和质量没差。这意味着你可以用更便宜的模型、更短的上下文窗口，处理同样复杂的任务。

第二，RAG场景。把检索回来的大量chunk先压缩再塞给LLM，原本只能放5条chunk的上下文窗口，现在能放20条。检索质量上去了，token消耗反而下来了。

为什么推荐它

我试过几个类似的方案，RTK、lean-ctx，还有OpenAI自己出的压缩方案。Headroom最打动我的是”可逆压缩”这个设计。很多压缩方案是单向的，压完原始信息就没了，LLM判断需要细节的时候拿不到原文。Headroom的CCR机制让LLM可以按需取回原始内容，这个设计很聪明。

另外就是接入成本真的低。如果你用的是Claude Code或者Cursor，一条命令 headroom wrap claude 就搞定，不需要改代码，不需要重新配置，直接生效。对于已经用上这些工具的人来说，几乎是零成本的优化。

本周Headroom在GitHub周增长榜排第一，新增了13,000+ star。16.4k的总star数不算高，但增长曲线很陡，说明用过的人都在往上加。这种”开发者口碑传播”的项目，通常比营销驱动的项目更值得跟。

GitHub：github.com/chopratejas/headroom
官网文档：headroom-docs.vercel.app
协议：Apache 2.0（可商用）
2026年6月7日

工作负载类型	压缩前token	压缩后token	压缩率
代码搜索（100条结果）	17,765	1,408	92%
SRE故障排查	65,694	5,118	92%
GitHub Issue分类	54,174	14,761	73%

Gemini CLI：105k Stars！Google官方终端AI Agent，让命令行拥有Gemini的超能力

项目简介

Gemini CLI 是 Google 官方开源的终端 AI Agent 工具，将 Gemini 的强大能力直接集成到你的命令行终端中。它是目前从提示词到模型调用最直接的路径，为开发者提供了轻量级的 Gemini 访问入口。

⭐ GitHub Stars: 105k+
🔗 项目地址: github.com/google-gemini/gemini-cli
📄 开源协议: Apache 2.0
🌐 官方网站: geminicli.com

安装要求和过程

环境要求

Node.js >= 18 (推荐 20+)
npm 或 Homebrew (macOS)
Google 账号 (免费使用 Gemini API)

快速安装步骤

方式一：npx 即时运行（推荐试用）

npx @google/gemini-cli

方式二：npm 全局安装

npm install -g @google/gemini-cli
gemini --version

方式三：Homebrew 安装（macOS/Linux）

brew install gemini-cli
gemini

首次启动认证：

# 启动后会自动打开浏览器进行 Google 账号 OAuth 认证
gemini

核心功能

功能	说明
🧠 代码理解与生成	支持查询、编辑大型代码库；可基于 PDF、图片、草图等多模态内容生成新应用；支持自然语言调试问题、排查故障
🤖 自动化与集成	支持自动化操作任务，比如查询拉取请求、处理复杂变基；可通过 MCP 服务器扩展能力，包括对接 Imagen、Veo、Lyria 等媒体生成工具
🔍 高级能力	内置 Google Search 搜索能力，支持实时信息检索；支持对话检查点，可保存、恢复复杂会话；支持自定义上下文文件 GEMINI.md
🚀 免费额度友好	个人 Google 账号即可享受免费 tier，支持 60 次请求/分钟、1000 次请求/天
🔧 内置工具丰富	自带 Google Search 搜索、文件操作、Shell 命令执行、网页抓取等能力；支持 MCP（模型上下文协议），可自定义集成第三方能力

典型使用场景

场景一：快速启动新项目

进入项目目录启动 gemini 后，直接用自然语言描述需求即可生成对应代码：

# 启动 Gemini CLI
cd my-new-project
gemini

# 在交互界面中输入：
> Write me a Discord bot that answers questions using a FAQ.md file I will provide

场景二：分析现有代码变更

克隆代码库后启动 gemini，可以快速获取代码变更总结：

# 克隆代码库
git clone https://github.com/some/repo.git
cd repo
gemini

# 在交互界面中输入：
> Give me a summary of all of the changes that went in yesterday

场景三：非交互式脚本自动化

使用 -p 参数可以在脚本中调用 Gemini CLI，实现工作流自动化：

# 获取简单文本响应
gemini -p "Explain the architecture of this codebase"

# 获取结构化 JSON 输出
gemini -p "Explain the architecture of this codebase" --output-format json

# 实时流式输出
gemini -p "Run tests and deploy" --output-format stream-json

下载地址

📦 GitHub 仓库：github.com/google-gemini/gemini-cli
🌐 官方网站：geminicli.com
📚 官方文档：geminicli.com/docs
📦 npm 包：@google/gemini-cli
💬 Discord 社区：discord.gg/gemini-cli

2026年6月7日

vLLM：82.1k Stars！高性能LLM推理引擎，让大模型部署又快又省
vLLM：82.1k Stars！高性能LLM推理引擎，让大模型部署又快又省

配图

项目简介

vLLM 是一个面向所有人的易用、快速、低成本的LLM服务引擎，提供高吞吐量、内存高效的推理能力，让大语言模型的生产部署变得简单高效。

安装要求和过程

环境要求
- 操作系统：Linux（推荐）或 macOS
- Python：3.8 – 3.12
- GPU：NVIDIA GPU（CUDA 7.0+）或 AMD GPU（ROCm 5.6+）
- CPU：x86、ARM 或 PowerPC（支持 CPU 推理）
快速安装步骤

方法一：使用 uv 安装（推荐）
```
uv pip install vllm
    
```
方法二：使用 pip 安装
```
pip install vllm
    
```
方法三：从源码构建
```
git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .
    
```
验证安装
```
python -c "import vllm; print(vllm.__version__)"
    
```
核心功能
1. 业界领先的推理吞吐量
  基于 PagedAttention 技术高效管理注意力键值内存，支持连续批处理、分块预填充、前缀缓存等优化技术，单GPU即可实现超高并发推理服务。
2. 丰富的量化方案支持
  原生支持 FP8、MXFP8/MXFP4、NVFP4、INT8、INT4、GPTQ/AWQ、GGUF 等多种量化格式，在保证模型质量的同时大幅降低显存占用和推理延迟。
3. 无缝的 Hugging Face 集成
  直接加载 Hugging Face 上 200+ 模型架构，包括 Llama、Qwen、Gemma、Mixtral、DeepSeek-V3 等热门模型，无需任何适配代码。
4. 分布式推理支持
  支持张量并行、流水线并行、数据并行、专家并行、上下文并行，可轻松扩展到大模型多卡、多机部署场景。
5. 多模态模型支持
  不仅支持纯文本LLM，还支持 LLaVA、Qwen-VL、Pixtral 等多模态模型，满足图文理解、视觉问答等复杂场景需求。
典型使用场景

场景一：企业级大模型API服务

某 AI 创业公司需要将 Qwen2.5-72B 模型部署为 OpenAI 兼容的 API 服务，供前端应用调用。

解决方案：使用 vLLM 启动兼容 OpenAI API 的服务器，仅需一行命令：
```
vllm serve Qwen/Qwen2.5-72B-Instruct --tensor-parallel-size 4
    
```
启动后自动提供与 OpenAI 完全兼容的 API，现有代码无需修改即可切换到底层模型，同时享受 vLLM 带来的 3-5倍吞吐量提升。

场景二：本地开发与环境测试

开发者需要在本地机器上快速测试不同 LLM 的能力，评估哪个模型最适合自己的应用场景。

解决方案：使用 vLLM 的 Python API 或 LLM 类，像使用 transformers 一样简单：
```
from vllm import LLM, SamplingParams
    
    # 初始化模型
    llm = LLM(model="meta-llama/Llama-3.1-8B-Instruct")
    
    # 设置生成参数
    params = SamplingParams(temperature=0.7, max_tokens=256)
    
    # 批量推理
    prompts = ["解释量子计算", "写一个快速排序"]
    outputs = llm.generate(prompts, params)
    
    for output in outputs:
        print(output.prompt, output.outputs[0].text)
    
```
推荐理由

作为一名经常需要部署和测试大模型的开发者，vLLM 已经成为我工具箱里不可或缺的利器。之前每次部署新模型都要折腾好几天，要么显存不够，要么吞吐量上不去，要么就是跟各种推理框架的适配问题。

vLLM 最大的价值在于它真的能做到开箱即用。你从 Hugging Face 上找到的模型，基本上扔给 vLLM 就能跑，不用自己写适配代码，不用深入研究模型架构。特别是它的 PagedAttention 技术，真的把显存利用率拉满了，同样一张 A100，用 vLLM 能服务的并发请求数是之前的好几倍。

另外很赞的一点是它的量化支持特别全面。现在模型越来越大，不量化根本跑不起来。vLLM 支持的量化格式特别多，AWQ、GPTQ、GGUF 这些主流的都有，而且量化后的精度损失控制得很好，实际业务里基本感觉不出来。

如果你正在做 LLM 相关的项目，不管是创业做 AI 产品，还是企业里搭私有化部署，vLLM 都值得一试。它现在基本上是业界标准了，82.1k 的 Stars 不是白来的。

下载地址
- 官方网站：https://vllm.ai
- GitHub 仓库：https://github.com/vllm-project/vllm（82.1k+ Stars）
- 官方文档：https://docs.vllm.ai
- PyPI 安装：pip install vllm
- 社区论坛：https://discuss.vllm.ai
如果你觉得这个项目有帮助，欢迎到 GitHub 上点个 Star，支持开源社区的发展！
2026年6月7日

MetaGPT：59.4k Stars！多智能体协作框架，让AI组成软件公司

配图

MetaGPT Logo

MetaGPT – 多智能体协作框架

项目简介

MetaGPT 是一款创新的多智能体协作框架，核心理念为 Code = SOP(Team)。通过模拟真实软件公司的组织架构（产品经理、架构师、工程师、测试员等角色）与标准化作业流程（SOP），实现复杂任务的自动化协作处理。

只需要输入一行自然语言需求，MetaGPT 就能自动生成产品需求文档（PRD）、技术设计方案、任务清单以及完整的代码实现。

安装要求和过程

环境要求

✅ Python 版本：3.9+
✅ 支持系统：macOS 13.x / Windows 11 / Ubuntu 22.04
✅ 依赖管理：pip 或 Docker

快速安装步骤

方式一：稳定版安装（推荐）

pip install metagpt

方式二：最新开发版

pip install git+https://github.com/geekan/MetaGPT

方式三：Docker 部署

docker pull metagpt/metagpt:latest
docker run --rm metagpt/metagpt:latest metagpt "Write a cli snake game"

可选功能扩展

功能模块	安装命令	用途说明
RAG 检索增强	`pip install 'metagpt[rag]'`	结合向量存储的RAG系统
OCR 文字识别	`pip install 'metagpt[ocr]'`	识别图像中的文本
搜索引擎集成	`pip install 'metagpt[search-ddg]'`	DuckDuckGo 搜索功能

核心功能

🏢 模拟软件公司架构

预设产品经理、架构师、工程师、测试员等角色，每个角色拥有独立的 LLM 实例和专业化 Prompt，协同完成软件开发生命周期全流程。

📋 SOP 标准化流程

将工业标准化作业程序（SOP）嵌入智能体协作流程，确保输出质量可控、可预期。每个角色按既定规范输出交付物。

📄 自动化文档生成

自动生成产品需求文档（PRD）、技术设计文档、API 接口文档、测试用例等完整软件工程文档。

💻 完整代码实现

基于需求自动编写、审查、迭代代码，支持多种编程语言，输出可直接运行的完整代码仓库。

📊 智能图表生成

集成 Mermaid 图表引擎，自动生成流程图、时序图、类图、架构图等多种技术图表（支持 PNG/SVG/PDF 格式）。

典型使用场景

场景一：快速原型开发

需求：创业者有一个 APP 想法，需要快速验证可行性并产出原型。

使用方式：执行 metagpt "开发一个任务管理APP，支持多人协作"，自动输出完整的需求分析、UI 设计建议、技术选型和示例代码。

场景二：竞品分析与调研

需求：产品经理需要快速了解某个领域的主流产品功能特性。

使用方式：MetaGPT 自动联网搜索、分析竞品、生成对比表格和策略建议，输出标准化竞品分析报告。

场景三：教学与学习辅助

需求：计算机专业学生学习软件工程流程，希望看到完整项目从需求到代码的实例。

使用方式：输入课程设计题目，MetaGPT 展示标准软件工程全流程输出，帮助学生理解各阶段交付物的规范与要求。

下载地址

🔗 GitHub 仓库：https://github.com/FoundationAgents/MetaGPT

🌐 官方文档：https://docs.deepwisdom.ai/

💬 Discord 社区：https://discord.gg/veseZ39udK

📦 PyPI 安装：pip install metagpt

项目持续更新中，欢迎 Star 支持开发者 🩵

2026年6月7日

ChatGPT Retrieval Plugin：20k+ Stars！RAG鼻祖项目，让ChatGPT拥有外部知识
📦 项目简介

chatgpt-retrieval-plugin 是 OpenAI 官方开源的 ChatGPT 检索插件模板，它是 RAG（检索增强生成） 领域的鼻祖级项目，让 ChatGPT 能够访问自定义数据源。

这个项目展示了如何让大模型动态访问外部知识库，而不是仅仅依赖训练数据。它是现在所有 RAG 应用的”祖师爷”。

⚙️ 安装要求和过程

环境要求
- Python：3.8+（推荐 3.10+）
- 向量数据库：Pinecone / Weaviate / Qdrant（任选其一）
- OpenAI API Key：必需（用于 Embedding 和 ChatGPT）
- 内存：建议 8GB+（本地测试可降级）
快速安装步骤
```
# 1. 克隆项目
git clone https://github.com/openai/chatgpt-retrieval-plugin.git
cd chatgpt-retrieval-plugin

# 2. 安装依赖
pip install -r requirements.txt

# 3. 配置环境变量
cp .env.example .env
# 编辑 .env，填入你的 OpenAI API Key 和向量数据库配置

# 4. 构建向量索引
python scripts/process_docs.py

# 5. 启动服务
uvicorn server.main:app --reload --port 8000
```
安装完成后，在 ChatGPT Plugins 模式中添加本地插件，指向 http://localhost:8000 即可。

🔥 核心功能

1. 向量检索（核心能力）

将文档切片后转化为向量，存储到 Pinecone 等向量数据库。用户提问时，系统自动检索最相关的文档片段，注入到 ChatGPT 的上下文中。

2. 递归爬取（数据接入）

内置 scripts/process_docs.py 支持递归爬取网站内容（基于 BeautifulSoup），自动处理 HTML、PDF、Markdown 等多种格式。

3. 元数据过滤（精准召回）

支持为文档添加元数据标签（来源、日期、作者等），检索时可根据元数据进行过滤，大幅提升召回精准度。

4. 插件标准接口（OpenAI 官方规范）

严格遵循 OpenAI Plugin 规范（/.well-known/ai-plugin.json、/openapi.yaml），可作为开发自定义 ChatGPT 插件的参考模板。

💡 典型使用场景

场景一：企业知识库问答

将公司内部文档（产品手册、API 文档、HR 政策）向量化后接入 ChatGPT，员工可以直接用自然语言查询，比如”我们公司的报销流程是什么？”，ChatGPT 会从知识库中精准召回答案。

价值：替代传统关键词搜索，问答准确率提升 60%+。

场景二：技术文档助手

开源项目维护者可以将项目文档（README、Wiki、Issue 解答）接入插件，用户在使用 ChatGPT 时可以直接获得项目相关的准确回答，而不用担心模型产生幻觉。

价值：降低开源项目的使用门槛，减少重复解答。

🌟 推荐理由

这个项目最大的价值不在于代码本身（实际上代码量并不大），而在于它 定义了 RAG 的标准范式：
1. 文档切片 → Embedding → 向量存储 → 检索召回 → 注入上下文 → 生成回答，这条链路现在是业界标配。
2. 如果你想做知识库问答、企业 AI 助手、文档 Copilot，这个项目是最好的起点。
3. 虽然 OpenAI 后来推出了 Assistants API 和 GPTs，底层逻辑依然和这个插件一脉相承。
值得一提的是，现在很多热门项目（RAGFlow、AnythingLLM、Dify 的知识库功能）都能看到这个项目的影子。可以说，它是 RAG 应用的”黄埔军校”。

📥 下载地址
- GitHub 仓库：openai/chatgpt-retrieval-plugin
- OpenAI Plugins 文档：官方文档
- Pinecone 向量数据库：pinecone.io
如果你正在做知识库问答或者企业 AI 助手，这个项目值得深入研究。它不仅是 RAG 的鼻祖，更是理解大模型如何”连接外部知识”的最佳教材。
2026年6月6日
CopilotKit：32.7K Stars！构建Agent原生应用的最佳SDK，让AI真正融入你的产品
项目简介

做AI应用开发的朋友，大概率都遇到过一个尴尬：

你接了LLM，写了Prompt，聊天窗口跑起来了。然后用户说”帮我查订单”，你的Agent调用了工具，返回一段文字——但用户真正想要的，是一个可以点击的订单卡片、一个可以筛选的表单、一张可以交互的图表。

CopilotKit 要解决的，就是这个问题。32.7K Stars，MIT协议，一句话说清楚：它是构建Agent原生应用的全栈SDK，让AI不仅能”说”，还能”做界面”。

安装要求和过程

环境要求
- Node.js 18+
- React 18+（React版本）；Angular/Vue也已支持
- TypeScript（推荐）
快速开始（新项目）
```
npx copilotkit@latest create -f nextjs
```
已有项目接入
```
npx copilotkit@latest init
```
执行后自动完成：核心包安装、Provider配置、Agent与UI连接、部署就绪配置。

安装React核心包
```
npm install @copilotkit/react-core @copilotkit/react-ui
```
核心功能

1. 生成式UI（Generative UI）

这是CopilotKit最招牌的能力。传统聊天AI返回的是文字，CopilotKit让Agent在运行时动态生成前端组件。比如用户说”画一个销售漏斗图”，Agent可以直接生成一个React组件渲染在聊天窗口里，而不是返回一段描述。

2. AG-UI协议的主导者

CopilotKit主导了AG-UI协议的制定，这个协议已经被Google、LangChain、AWS、Microsoft、Mastra、PydanticAI等主流AI厂商采纳。它的作用是实现Agent与用户界面的标准化通信——你可以理解为”AI界面的HTTP协议”。用了CopilotKit，你的Agent天然支持这个协议，未来对接其他厂商的生态会很顺畅。

3. 人机协同工作流

有些操作，AI不能自己拍板。CopilotKit支持Agent执行过程中主动暂停，请求人工确认后再继续。比如”我准备删除这三条数据，确认？”——用户点确认，Agent再执行。这个能力在金融、医疗、企业审批等场景里几乎是必需的。

4. 共享状态管理

Agent和UI组件之间有一层可实时读写同步的状态层。Agent更新了状态，UI立刻响应；用户在UI上操作，Agent也能立刻感知。这种双向实时交互，是”真正Agent原生应用”和”套壳聊天窗口”之间最本质的差别。

5. 自学习Agent（早期访问）

通过人类反馈持续学习（RLHF），Agent可以不用微调模型，就能通过用户反馈自动优化行为。而且支持按用户偏好做个性化适配——也就是说，同一个Agent，给不同用户用，会越来越”懂”那个用户。

典型使用场景

场景一：AI客服系统

用户在聊天窗口说”查我的订单”。传统方案：Agent返回一段文字”您的订单号是xxx，状态是已发货”。

用了CopilotKit：Agent动态生成一个可交互的订单卡片，用户可以直接在聊天窗口里点击”退款”、”查看物流”、”联系卖家”。整个过程不需要跳转页面，也不需要用户去别的地方操作。

场景二：企业知识库助手

结合RAG，用户问”帮我分析Q1各区域的销售趋势”。Agent不仅返回文字结论，还直接生成一张交互式图表，用户可以在聊天窗口里筛选区域、切换时间维度、导出数据。这种体验，是传统”一问一答”的AI客服完全给不了的。

推荐理由

我自己试CopilotKit最直接的原因是：受够了”AI聊天窗口”的局限。

接LLM很方便，但接完之后你会发现，用户真正想要的不是”聊天”，而是”完成任务”。查订单、填表单、看报表——这些事情，纯文字交互的效率是很低的。

CopilotKit的Generative UI把这个问题解决了。Agent可以动态生成界面，用户可以在聊天窗口里直接操作，整个体验是对话式+界面式的混合——这其实更像人跟人打交道的方式，而不是人跟搜索引擎打交道的方式。

另外一点是AG-UI协议。现在AI应用开发有个痛点：每接一个平台（Web、移动端、Slack、Teams），都要重新写一套UI逻辑。CopilotKit的AG-UI协议让同一套Agent逻辑可以同时驱动多个平台的UI——这个在多端部署的场景下，省的工作量是很可观的。

下载地址

GitHub仓库：https://github.com/CopilotKit/CopilotKit（32.7K+ Stars）

官方网站：https://www.copilotkit.ai/

开发文档：https://docs.copilotkit.ai/

npm安装：npm install @copilotkit/react-core @copilotkit/react-ui
2026年6月6日
LiteLLM：49.4K Stars！统一100+ LLM API网关，让多模型调用不再碎片化
📌 项目简介

LiteLLM 是 BerriAI 团队维护的开源 AI 网关，为 100+ 大语言模型提供统一访问接口，支持 OpenAI 格式调用，内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目，Stripe、Netflix、Google ADK 等大厂均在用。
🔧 安装要求和过程

环境要求

Python 3.8+ 环境

推荐使用 uv 包管理器（也可使用 pip）

本地开发额外依赖：docker-compose（用于启动数据库、Prometheus 等依赖服务）

快速安装步骤

# 1. 克隆仓库 git clone https://github.com/BerriAI/litellm.git && cd litellm # 2. 安装开发依赖 make install-dev # 3. 初始化虚拟环境 python -m venv .venv # Linux/Mac: source .venv/bin/activate # Windows: .venv\Scripts\activate uv sync --all-extras --group proxy-dev # 4. 生成 Prisma 客户端 uv run prisma generate && prisma generate # 5. 启动本地服务（后端） python litellm/proxy/proxy_cli.py # 6. 启动前端（另开终端） cd ui/litellm-dashboard && npm install && npm run dev

💡 Docker 快速启动：

docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest
🚀 核心功能

🌐 统一 LLM 调用

支持 100+ LLM 厂商（OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等），所有调用兼容 OpenAI API 格式，切换模型无需修改业务代码。

🛡️ AI 网关能力

虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志，并提供 管理后台 UI可视化监控。

🤖 智能体（A2A）支持

支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体，提供 A2A 协议适配，可统一接入各类智能体服务。

🔗 MCP 工具桥接

可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义，直接对接任意 LLM；支持通过网关统一代理 MCP 工具调用。

🏢 企业级特性

单点登录（SSO）、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能：1k RPS 场景下 P95 延迟仅 8ms。
💡 典型使用场景

场景一：多模型切换，代码零改动

开发阶段使用 GPT-4o 快速验证，生产环境切换到 Claude Sonnet，只需修改 model 参数，业务代码无需任何改动：

# 同一套代码，切换不同模型 from litellm import completion response = completion( model="openai/gpt-4o", messages=[{"role": "user", "content": "Hello!"}] ) response = completion( model="anthropic/claude-sonnet-4-20250514", messages=[{"role": "user", "content": "Hello!"}] )

场景二：企业 LLM 调用管理与成本跟踪

为不同团队/项目分配虚拟 API 密钥，按维度统计 LLM 调用花费，设置安全防护规则（如屏蔽敏感词、限制调用频率），所有调用日志可视化。

知名用户包括：Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

场景三：MCP 工具无缝对接 LLM

通过 LiteLLM 的 MCP 工具桥接功能，可以将任何 MCP 服务器的工具转换为 OpenAI 格式，让任意 LLM 都能调用这些工具，无需为每个 LLM 单独适配。
💬 推荐理由

LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码，现在只需一套 OpenAI 格式代码，通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

对于需要调用多个 LLM 的应用（比如 AI Agent 系统），LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用，说明其稳定性和性能已经过生产验证。

最打动我的一点：它不只做模型路由，还内置了成本跟踪、负载均衡、安全防护等企业级功能，真正把”调用 LLM”这件事做成了一个完整的网关产品，而不只是一个简单的路由库。

📦 下载地址

GitHub 仓库

github.com/BerriAI/litellm

⭐ 49.4k+ Stars | 8.6k+ Forks

官方文档

docs.litellm.ai

📚 完整使用指南

PyPI 安装

pip install litellm

📦 Python 包

企业版

Enterprise Edition

🏢 SSO / 专属支持

LiteLLM – 让100+ LLM 调用，从此只有一种方式。
2026年6月5日

Chroma：43.1K Stars！开源向量数据库，让AI应用拥有长期记忆

开源向量数据库 · 让AI拥有长期记忆

📦 项目简介

Chroma 是专为AI应用打造的开源嵌入式向量数据库，让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API，帮助你快速存储、查询和检索文本Embedding向量，是构建RAG（检索增强生成）应用的首选基础设施。

🔗 GitHub：chroma-core/chroma　⭐ Stars：43.1K+　📄 协议：Apache 2.0

🔧 安装要求和过程

环境要求

依赖	要求
Python	≥ 3.8（推荐 3.10+）
内存	≥ 4GB（生产环境建议 8GB+）
存储	≥ 1GB 可用空间
可选后端	SQLite（默认）、DuckDB（分析场景）

快速安装（3行代码搞定）

pip install chromadb

import chromadb
client = chromadb.Client()  # 开箱即用！

Docker 部署（生产推荐）

docker run -d --name chroma \
  -p 8000:8000 \
  ghcr.io/chroma-core/chroma:latest

部署后访问 http://localhost:8000 即可使用 HTTP API。

🔩 核心功能

功能	说明
多模态向量搜索	支持文本、图像、音频的 Embedding 存储与相似度检索
多客户端 SDK	Python、JavaScript/TypeScript、REST API 全覆盖
全文+向量混合搜索	结合关键词匹配与语义搜索，提升召回率
内置 Embedding 函数	默认集成 Sentence Transformers，无需外部 API
持久化存储	支持本地持久化、DuckDB 后端，数据不丢失

💡 典型使用场景

场景一：RAG（检索增强生成）应用

将企业文档、知识库存入 Chroma，用户提问时先检索相关片段，再送给 LLM 生成答案。相比直接问 LLM，准确率提升 40%+，幻觉大幅减少。

# RAG 核心代码（不到 20 行！）
collection = client.create_collection("docs")
collection.add(
    documents=["公司报销流程...", "年假申请..."],
    ids=["1", "2"]
)
results = collection.query(query_texts=["如何报销？"], n_results=1)
# results 包含最相关的文档片段

场景二：AI Agent 长期记忆

让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma，下次对话时自动检索上下文，实现”越用越懂你”。

场景三：语义推荐系统

电商、内容平台的”猜你喜欢”，用 Chroma 存储商品/内容向量，用户行为向量实时检索最相似物品，推荐相关度远超协同过滤。

🌟 推荐理由

Chroma 是我见过最易上手的向量数据库，没有之一。不需要学 SQL，不需要配置复杂集群，pip install 之后 3 行代码就能跑起来。

相比 Pinecone 等托管服务，Chroma 完全开源、可自托管，数据不出门，合规零风险。相比 Faiss，它提供了完整的 CRUD API 和持久化，不用每次重启都重新建索引。

如果你正在做 RAG、AI 搜索、推荐系统，或者想给 Agent 加上记忆，Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成，生态非常成熟。

📥 下载地址

渠道	链接 / 命令
GitHub 仓库	github.com/chroma-core/chroma
官网文档	docs.trychroma.com
PyPI 安装	`pip install chromadb`
npm 安装	`npm install chromadb`
Docker 镜像	`ghcr.io/chroma-core/chroma:latest`

— 开源项目第52期 | 夜野飞云 —

2026年6月5日

标签： 开源

📘 项目简介

💻 安装要求和过程

环境要求

硬件要求

软件要求

快速安装步骤

⚙️ 核心功能

1. 节点式工作流搭建

2. 多模态内容生成

3. 自定义扩展能力

4. 工作流管理与复用

5. API 与自动化对接

🎯 典型使用场景

场景一：AI 艺术创作者

场景二：AI 应用开发者

场景三：AI 研究与学习

🌟 推荐理由

为什么推荐 ComfyUI？

📥 下载地址

🎬 结语

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：开发者本地 AI 应用开发

场景二：企业私有化部署

推荐理由

下载地址

项目是什么

安装要求和过程

核心功能

典型使用场景

为什么推荐它

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：快速启动新项目

场景二：分析现有代码变更

场景三：非交互式脚本自动化

推荐理由

下载地址

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：企业级大模型API服务

场景二：本地开发与环境测试

推荐理由

下载地址

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

可选功能扩展

核心功能

🏢 模拟软件公司架构

📋 SOP 标准化流程

📄 自动化文档生成

💻 完整代码实现

📊 智能图表生成

典型使用场景

场景一：快速原型开发

场景二：竞品分析与调研

场景三：教学与学习辅助

推荐理由

为什么值得关注？

下载地址

📦 项目简介

⚙️ 安装要求和过程

标签：开源