标签： GitHub

Gemini CLI：105k Stars！Google官方终端AI Agent，让命令行拥有Gemini的超能力

项目简介

Gemini CLI 是 Google 官方开源的终端 AI Agent 工具，将 Gemini 的强大能力直接集成到你的命令行终端中。它是目前从提示词到模型调用最直接的路径，为开发者提供了轻量级的 Gemini 访问入口。

⭐ GitHub Stars: 105k+
🔗 项目地址: github.com/google-gemini/gemini-cli
📄 开源协议: Apache 2.0
🌐 官方网站: geminicli.com

安装要求和过程

环境要求

Node.js >= 18 (推荐 20+)
npm 或 Homebrew (macOS)
Google 账号 (免费使用 Gemini API)

快速安装步骤

方式一：npx 即时运行（推荐试用）

npx @google/gemini-cli

方式二：npm 全局安装

npm install -g @google/gemini-cli
gemini --version

方式三：Homebrew 安装（macOS/Linux）

brew install gemini-cli
gemini

首次启动认证：

# 启动后会自动打开浏览器进行 Google 账号 OAuth 认证
gemini

核心功能

功能	说明
🧠 代码理解与生成	支持查询、编辑大型代码库；可基于 PDF、图片、草图等多模态内容生成新应用；支持自然语言调试问题、排查故障
🤖 自动化与集成	支持自动化操作任务，比如查询拉取请求、处理复杂变基；可通过 MCP 服务器扩展能力，包括对接 Imagen、Veo、Lyria 等媒体生成工具
🔍 高级能力	内置 Google Search 搜索能力，支持实时信息检索；支持对话检查点，可保存、恢复复杂会话；支持自定义上下文文件 GEMINI.md
🚀 免费额度友好	个人 Google 账号即可享受免费 tier，支持 60 次请求/分钟、1000 次请求/天
🔧 内置工具丰富	自带 Google Search 搜索、文件操作、Shell 命令执行、网页抓取等能力；支持 MCP（模型上下文协议），可自定义集成第三方能力

典型使用场景

场景一：快速启动新项目

进入项目目录启动 gemini 后，直接用自然语言描述需求即可生成对应代码：

# 启动 Gemini CLI
cd my-new-project
gemini

# 在交互界面中输入：
> Write me a Discord bot that answers questions using a FAQ.md file I will provide

场景二：分析现有代码变更

克隆代码库后启动 gemini，可以快速获取代码变更总结：

# 克隆代码库
git clone https://github.com/some/repo.git
cd repo
gemini

# 在交互界面中输入：
> Give me a summary of all of the changes that went in yesterday

场景三：非交互式脚本自动化

使用 -p 参数可以在脚本中调用 Gemini CLI，实现工作流自动化：

# 获取简单文本响应
gemini -p "Explain the architecture of this codebase"

# 获取结构化 JSON 输出
gemini -p "Explain the architecture of this codebase" --output-format json

# 实时流式输出
gemini -p "Run tests and deploy" --output-format stream-json

下载地址

📦 GitHub 仓库：github.com/google-gemini/gemini-cli
🌐 官方网站：geminicli.com
📚 官方文档：geminicli.com/docs
📦 npm 包：@google/gemini-cli
💬 Discord 社区：discord.gg/gemini-cli

2026年6月7日

vLLM：82.1k Stars！高性能LLM推理引擎，让大模型部署又快又省
vLLM：82.1k Stars！高性能LLM推理引擎，让大模型部署又快又省

配图

项目简介

vLLM 是一个面向所有人的易用、快速、低成本的LLM服务引擎，提供高吞吐量、内存高效的推理能力，让大语言模型的生产部署变得简单高效。

安装要求和过程

环境要求
- 操作系统：Linux（推荐）或 macOS
- Python：3.8 – 3.12
- GPU：NVIDIA GPU（CUDA 7.0+）或 AMD GPU（ROCm 5.6+）
- CPU：x86、ARM 或 PowerPC（支持 CPU 推理）
快速安装步骤

方法一：使用 uv 安装（推荐）
```
uv pip install vllm
    
```
方法二：使用 pip 安装
```
pip install vllm
    
```
方法三：从源码构建
```
git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .
    
```
验证安装
```
python -c "import vllm; print(vllm.__version__)"
    
```
核心功能
1. 业界领先的推理吞吐量
  基于 PagedAttention 技术高效管理注意力键值内存，支持连续批处理、分块预填充、前缀缓存等优化技术，单GPU即可实现超高并发推理服务。
2. 丰富的量化方案支持
  原生支持 FP8、MXFP8/MXFP4、NVFP4、INT8、INT4、GPTQ/AWQ、GGUF 等多种量化格式，在保证模型质量的同时大幅降低显存占用和推理延迟。
3. 无缝的 Hugging Face 集成
  直接加载 Hugging Face 上 200+ 模型架构，包括 Llama、Qwen、Gemma、Mixtral、DeepSeek-V3 等热门模型，无需任何适配代码。
4. 分布式推理支持
  支持张量并行、流水线并行、数据并行、专家并行、上下文并行，可轻松扩展到大模型多卡、多机部署场景。
5. 多模态模型支持
  不仅支持纯文本LLM，还支持 LLaVA、Qwen-VL、Pixtral 等多模态模型，满足图文理解、视觉问答等复杂场景需求。
典型使用场景

场景一：企业级大模型API服务

某 AI 创业公司需要将 Qwen2.5-72B 模型部署为 OpenAI 兼容的 API 服务，供前端应用调用。

解决方案：使用 vLLM 启动兼容 OpenAI API 的服务器，仅需一行命令：
```
vllm serve Qwen/Qwen2.5-72B-Instruct --tensor-parallel-size 4
    
```
启动后自动提供与 OpenAI 完全兼容的 API，现有代码无需修改即可切换到底层模型，同时享受 vLLM 带来的 3-5倍吞吐量提升。

场景二：本地开发与环境测试

开发者需要在本地机器上快速测试不同 LLM 的能力，评估哪个模型最适合自己的应用场景。

解决方案：使用 vLLM 的 Python API 或 LLM 类，像使用 transformers 一样简单：
```
from vllm import LLM, SamplingParams
    
    # 初始化模型
    llm = LLM(model="meta-llama/Llama-3.1-8B-Instruct")
    
    # 设置生成参数
    params = SamplingParams(temperature=0.7, max_tokens=256)
    
    # 批量推理
    prompts = ["解释量子计算", "写一个快速排序"]
    outputs = llm.generate(prompts, params)
    
    for output in outputs:
        print(output.prompt, output.outputs[0].text)
    
```
推荐理由

作为一名经常需要部署和测试大模型的开发者，vLLM 已经成为我工具箱里不可或缺的利器。之前每次部署新模型都要折腾好几天，要么显存不够，要么吞吐量上不去，要么就是跟各种推理框架的适配问题。

vLLM 最大的价值在于它真的能做到开箱即用。你从 Hugging Face 上找到的模型，基本上扔给 vLLM 就能跑，不用自己写适配代码，不用深入研究模型架构。特别是它的 PagedAttention 技术，真的把显存利用率拉满了，同样一张 A100，用 vLLM 能服务的并发请求数是之前的好几倍。

另外很赞的一点是它的量化支持特别全面。现在模型越来越大，不量化根本跑不起来。vLLM 支持的量化格式特别多，AWQ、GPTQ、GGUF 这些主流的都有，而且量化后的精度损失控制得很好，实际业务里基本感觉不出来。

如果你正在做 LLM 相关的项目，不管是创业做 AI 产品，还是企业里搭私有化部署，vLLM 都值得一试。它现在基本上是业界标准了，82.1k 的 Stars 不是白来的。

下载地址
- 官方网站：https://vllm.ai
- GitHub 仓库：https://github.com/vllm-project/vllm（82.1k+ Stars）
- 官方文档：https://docs.vllm.ai
- PyPI 安装：pip install vllm
- 社区论坛：https://discuss.vllm.ai
如果你觉得这个项目有帮助，欢迎到 GitHub 上点个 Star，支持开源社区的发展！
2026年6月7日

MetaGPT：59.4k Stars！多智能体协作框架，让AI组成软件公司

配图

MetaGPT Logo

MetaGPT – 多智能体协作框架

项目简介

MetaGPT 是一款创新的多智能体协作框架，核心理念为 Code = SOP(Team)。通过模拟真实软件公司的组织架构（产品经理、架构师、工程师、测试员等角色）与标准化作业流程（SOP），实现复杂任务的自动化协作处理。

只需要输入一行自然语言需求，MetaGPT 就能自动生成产品需求文档（PRD）、技术设计方案、任务清单以及完整的代码实现。

安装要求和过程

环境要求

✅ Python 版本：3.9+
✅ 支持系统：macOS 13.x / Windows 11 / Ubuntu 22.04
✅ 依赖管理：pip 或 Docker

快速安装步骤

方式一：稳定版安装（推荐）

pip install metagpt

方式二：最新开发版

pip install git+https://github.com/geekan/MetaGPT

方式三：Docker 部署

docker pull metagpt/metagpt:latest
docker run --rm metagpt/metagpt:latest metagpt "Write a cli snake game"

可选功能扩展

功能模块	安装命令	用途说明
RAG 检索增强	`pip install 'metagpt[rag]'`	结合向量存储的RAG系统
OCR 文字识别	`pip install 'metagpt[ocr]'`	识别图像中的文本
搜索引擎集成	`pip install 'metagpt[search-ddg]'`	DuckDuckGo 搜索功能

核心功能

🏢 模拟软件公司架构

预设产品经理、架构师、工程师、测试员等角色，每个角色拥有独立的 LLM 实例和专业化 Prompt，协同完成软件开发生命周期全流程。

📋 SOP 标准化流程

将工业标准化作业程序（SOP）嵌入智能体协作流程，确保输出质量可控、可预期。每个角色按既定规范输出交付物。

📄 自动化文档生成

自动生成产品需求文档（PRD）、技术设计文档、API 接口文档、测试用例等完整软件工程文档。

💻 完整代码实现

基于需求自动编写、审查、迭代代码，支持多种编程语言，输出可直接运行的完整代码仓库。

📊 智能图表生成

集成 Mermaid 图表引擎，自动生成流程图、时序图、类图、架构图等多种技术图表（支持 PNG/SVG/PDF 格式）。

典型使用场景

场景一：快速原型开发

需求：创业者有一个 APP 想法，需要快速验证可行性并产出原型。

使用方式：执行 metagpt "开发一个任务管理APP，支持多人协作"，自动输出完整的需求分析、UI 设计建议、技术选型和示例代码。

场景二：竞品分析与调研

需求：产品经理需要快速了解某个领域的主流产品功能特性。

使用方式：MetaGPT 自动联网搜索、分析竞品、生成对比表格和策略建议，输出标准化竞品分析报告。

场景三：教学与学习辅助

需求：计算机专业学生学习软件工程流程，希望看到完整项目从需求到代码的实例。

使用方式：输入课程设计题目，MetaGPT 展示标准软件工程全流程输出，帮助学生理解各阶段交付物的规范与要求。

下载地址

🔗 GitHub 仓库：https://github.com/FoundationAgents/MetaGPT

🌐 官方文档：https://docs.deepwisdom.ai/

💬 Discord 社区：https://discord.gg/veseZ39udK

📦 PyPI 安装：pip install metagpt

项目持续更新中，欢迎 Star 支持开发者 🩵

2026年6月7日

ChatGPT Retrieval Plugin：20k+ Stars！RAG鼻祖项目，让ChatGPT拥有外部知识
📦 项目简介

chatgpt-retrieval-plugin 是 OpenAI 官方开源的 ChatGPT 检索插件模板，它是 RAG（检索增强生成） 领域的鼻祖级项目，让 ChatGPT 能够访问自定义数据源。

这个项目展示了如何让大模型动态访问外部知识库，而不是仅仅依赖训练数据。它是现在所有 RAG 应用的”祖师爷”。

⚙️ 安装要求和过程

环境要求
- Python：3.8+（推荐 3.10+）
- 向量数据库：Pinecone / Weaviate / Qdrant（任选其一）
- OpenAI API Key：必需（用于 Embedding 和 ChatGPT）
- 内存：建议 8GB+（本地测试可降级）
快速安装步骤
```
# 1. 克隆项目
git clone https://github.com/openai/chatgpt-retrieval-plugin.git
cd chatgpt-retrieval-plugin

# 2. 安装依赖
pip install -r requirements.txt

# 3. 配置环境变量
cp .env.example .env
# 编辑 .env，填入你的 OpenAI API Key 和向量数据库配置

# 4. 构建向量索引
python scripts/process_docs.py

# 5. 启动服务
uvicorn server.main:app --reload --port 8000
```
安装完成后，在 ChatGPT Plugins 模式中添加本地插件，指向 http://localhost:8000 即可。

🔥 核心功能

1. 向量检索（核心能力）

将文档切片后转化为向量，存储到 Pinecone 等向量数据库。用户提问时，系统自动检索最相关的文档片段，注入到 ChatGPT 的上下文中。

2. 递归爬取（数据接入）

内置 scripts/process_docs.py 支持递归爬取网站内容（基于 BeautifulSoup），自动处理 HTML、PDF、Markdown 等多种格式。

3. 元数据过滤（精准召回）

支持为文档添加元数据标签（来源、日期、作者等），检索时可根据元数据进行过滤，大幅提升召回精准度。

4. 插件标准接口（OpenAI 官方规范）

严格遵循 OpenAI Plugin 规范（/.well-known/ai-plugin.json、/openapi.yaml），可作为开发自定义 ChatGPT 插件的参考模板。

💡 典型使用场景

场景一：企业知识库问答

将公司内部文档（产品手册、API 文档、HR 政策）向量化后接入 ChatGPT，员工可以直接用自然语言查询，比如”我们公司的报销流程是什么？”，ChatGPT 会从知识库中精准召回答案。

价值：替代传统关键词搜索，问答准确率提升 60%+。

场景二：技术文档助手

开源项目维护者可以将项目文档（README、Wiki、Issue 解答）接入插件，用户在使用 ChatGPT 时可以直接获得项目相关的准确回答，而不用担心模型产生幻觉。

价值：降低开源项目的使用门槛，减少重复解答。

🌟 推荐理由

这个项目最大的价值不在于代码本身（实际上代码量并不大），而在于它 定义了 RAG 的标准范式：
1. 文档切片 → Embedding → 向量存储 → 检索召回 → 注入上下文 → 生成回答，这条链路现在是业界标配。
2. 如果你想做知识库问答、企业 AI 助手、文档 Copilot，这个项目是最好的起点。
3. 虽然 OpenAI 后来推出了 Assistants API 和 GPTs，底层逻辑依然和这个插件一脉相承。
值得一提的是，现在很多热门项目（RAGFlow、AnythingLLM、Dify 的知识库功能）都能看到这个项目的影子。可以说，它是 RAG 应用的”黄埔军校”。

📥 下载地址
- GitHub 仓库：openai/chatgpt-retrieval-plugin
- OpenAI Plugins 文档：官方文档
- Pinecone 向量数据库：pinecone.io
如果你正在做知识库问答或者企业 AI 助手，这个项目值得深入研究。它不仅是 RAG 的鼻祖，更是理解大模型如何”连接外部知识”的最佳教材。
2026年6月6日
CopilotKit：32.7K Stars！构建Agent原生应用的最佳SDK，让AI真正融入你的产品
项目简介

做AI应用开发的朋友，大概率都遇到过一个尴尬：

你接了LLM，写了Prompt，聊天窗口跑起来了。然后用户说”帮我查订单”，你的Agent调用了工具，返回一段文字——但用户真正想要的，是一个可以点击的订单卡片、一个可以筛选的表单、一张可以交互的图表。

CopilotKit 要解决的，就是这个问题。32.7K Stars，MIT协议，一句话说清楚：它是构建Agent原生应用的全栈SDK，让AI不仅能”说”，还能”做界面”。

安装要求和过程

环境要求
- Node.js 18+
- React 18+（React版本）；Angular/Vue也已支持
- TypeScript（推荐）
快速开始（新项目）
```
npx copilotkit@latest create -f nextjs
```
已有项目接入
```
npx copilotkit@latest init
```
执行后自动完成：核心包安装、Provider配置、Agent与UI连接、部署就绪配置。

安装React核心包
```
npm install @copilotkit/react-core @copilotkit/react-ui
```
核心功能

1. 生成式UI（Generative UI）

这是CopilotKit最招牌的能力。传统聊天AI返回的是文字，CopilotKit让Agent在运行时动态生成前端组件。比如用户说”画一个销售漏斗图”，Agent可以直接生成一个React组件渲染在聊天窗口里，而不是返回一段描述。

2. AG-UI协议的主导者

CopilotKit主导了AG-UI协议的制定，这个协议已经被Google、LangChain、AWS、Microsoft、Mastra、PydanticAI等主流AI厂商采纳。它的作用是实现Agent与用户界面的标准化通信——你可以理解为”AI界面的HTTP协议”。用了CopilotKit，你的Agent天然支持这个协议，未来对接其他厂商的生态会很顺畅。

3. 人机协同工作流

有些操作，AI不能自己拍板。CopilotKit支持Agent执行过程中主动暂停，请求人工确认后再继续。比如”我准备删除这三条数据，确认？”——用户点确认，Agent再执行。这个能力在金融、医疗、企业审批等场景里几乎是必需的。

4. 共享状态管理

Agent和UI组件之间有一层可实时读写同步的状态层。Agent更新了状态，UI立刻响应；用户在UI上操作，Agent也能立刻感知。这种双向实时交互，是”真正Agent原生应用”和”套壳聊天窗口”之间最本质的差别。

5. 自学习Agent（早期访问）

通过人类反馈持续学习（RLHF），Agent可以不用微调模型，就能通过用户反馈自动优化行为。而且支持按用户偏好做个性化适配——也就是说，同一个Agent，给不同用户用，会越来越”懂”那个用户。

典型使用场景

场景一：AI客服系统

用户在聊天窗口说”查我的订单”。传统方案：Agent返回一段文字”您的订单号是xxx，状态是已发货”。

用了CopilotKit：Agent动态生成一个可交互的订单卡片，用户可以直接在聊天窗口里点击”退款”、”查看物流”、”联系卖家”。整个过程不需要跳转页面，也不需要用户去别的地方操作。

场景二：企业知识库助手

结合RAG，用户问”帮我分析Q1各区域的销售趋势”。Agent不仅返回文字结论，还直接生成一张交互式图表，用户可以在聊天窗口里筛选区域、切换时间维度、导出数据。这种体验，是传统”一问一答”的AI客服完全给不了的。

推荐理由

我自己试CopilotKit最直接的原因是：受够了”AI聊天窗口”的局限。

接LLM很方便，但接完之后你会发现，用户真正想要的不是”聊天”，而是”完成任务”。查订单、填表单、看报表——这些事情，纯文字交互的效率是很低的。

CopilotKit的Generative UI把这个问题解决了。Agent可以动态生成界面，用户可以在聊天窗口里直接操作，整个体验是对话式+界面式的混合——这其实更像人跟人打交道的方式，而不是人跟搜索引擎打交道的方式。

另外一点是AG-UI协议。现在AI应用开发有个痛点：每接一个平台（Web、移动端、Slack、Teams），都要重新写一套UI逻辑。CopilotKit的AG-UI协议让同一套Agent逻辑可以同时驱动多个平台的UI——这个在多端部署的场景下，省的工作量是很可观的。

下载地址

GitHub仓库：https://github.com/CopilotKit/CopilotKit（32.7K+ Stars）

官方网站：https://www.copilotkit.ai/

开发文档：https://docs.copilotkit.ai/

npm安装：npm install @copilotkit/react-core @copilotkit/react-ui
2026年6月6日
LiteLLM：49.4K Stars！统一100+ LLM API网关，让多模型调用不再碎片化
📌 项目简介

LiteLLM 是 BerriAI 团队维护的开源 AI 网关，为 100+ 大语言模型提供统一访问接口，支持 OpenAI 格式调用，内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目，Stripe、Netflix、Google ADK 等大厂均在用。
🔧 安装要求和过程

环境要求

Python 3.8+ 环境

推荐使用 uv 包管理器（也可使用 pip）

本地开发额外依赖：docker-compose（用于启动数据库、Prometheus 等依赖服务）

快速安装步骤

# 1. 克隆仓库 git clone https://github.com/BerriAI/litellm.git && cd litellm # 2. 安装开发依赖 make install-dev # 3. 初始化虚拟环境 python -m venv .venv # Linux/Mac: source .venv/bin/activate # Windows: .venv\Scripts\activate uv sync --all-extras --group proxy-dev # 4. 生成 Prisma 客户端 uv run prisma generate && prisma generate # 5. 启动本地服务（后端） python litellm/proxy/proxy_cli.py # 6. 启动前端（另开终端） cd ui/litellm-dashboard && npm install && npm run dev

💡 Docker 快速启动：

docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest
🚀 核心功能

🌐 统一 LLM 调用

支持 100+ LLM 厂商（OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等），所有调用兼容 OpenAI API 格式，切换模型无需修改业务代码。

🛡️ AI 网关能力

虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志，并提供 管理后台 UI可视化监控。

🤖 智能体（A2A）支持

支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体，提供 A2A 协议适配，可统一接入各类智能体服务。

🔗 MCP 工具桥接

可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义，直接对接任意 LLM；支持通过网关统一代理 MCP 工具调用。

🏢 企业级特性

单点登录（SSO）、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能：1k RPS 场景下 P95 延迟仅 8ms。
💡 典型使用场景

场景一：多模型切换，代码零改动

开发阶段使用 GPT-4o 快速验证，生产环境切换到 Claude Sonnet，只需修改 model 参数，业务代码无需任何改动：

# 同一套代码，切换不同模型 from litellm import completion response = completion( model="openai/gpt-4o", messages=[{"role": "user", "content": "Hello!"}] ) response = completion( model="anthropic/claude-sonnet-4-20250514", messages=[{"role": "user", "content": "Hello!"}] )

场景二：企业 LLM 调用管理与成本跟踪

为不同团队/项目分配虚拟 API 密钥，按维度统计 LLM 调用花费，设置安全防护规则（如屏蔽敏感词、限制调用频率），所有调用日志可视化。

知名用户包括：Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

场景三：MCP 工具无缝对接 LLM

通过 LiteLLM 的 MCP 工具桥接功能，可以将任何 MCP 服务器的工具转换为 OpenAI 格式，让任意 LLM 都能调用这些工具，无需为每个 LLM 单独适配。
💬 推荐理由

LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码，现在只需一套 OpenAI 格式代码，通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

对于需要调用多个 LLM 的应用（比如 AI Agent 系统），LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用，说明其稳定性和性能已经过生产验证。

最打动我的一点：它不只做模型路由，还内置了成本跟踪、负载均衡、安全防护等企业级功能，真正把”调用 LLM”这件事做成了一个完整的网关产品，而不只是一个简单的路由库。

📦 下载地址

GitHub 仓库

github.com/BerriAI/litellm

⭐ 49.4k+ Stars | 8.6k+ Forks

官方文档

docs.litellm.ai

📚 完整使用指南

PyPI 安装

pip install litellm

📦 Python 包

企业版

Enterprise Edition

🏢 SSO / 专属支持

LiteLLM – 让100+ LLM 调用，从此只有一种方式。
2026年6月5日

supermemory：25.6K Stars！AI时代记忆引擎，让AI真正记住你

配图

项目简介

supermemory 是一个专为AI时代设计的记忆引擎，解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索（RAG+记忆），在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。

安装要求和过程

环境要求

环境	要求
Node.js	v18+
Python	3.9+
API Key	supermemory.ai 控制台获取

快速安装

方式一：MCP服务器（推荐，无需写代码）

# Claude/Cursor/Windsurf 一键安装
npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes

方式二：API调用（开发者）

# Node.js/TypeScript
npm install supermemory

# Python
pip install supermemory

方式三：官方应用（零代码）

访问 app.supermemory.ai 直接使用，支持浏览器扩展、Discord机器人等多种接入方式。

核心功能

功能	说明
自动记忆管理	从对话中自动提取事实，处理信息矛盾（如”搬到旧金山”覆盖”住在纽约”），自动遗忘过期内容，单次调用约50ms
用户画像维护	自动维护稳定事实（偏好、习惯）+ 近期活动上下文，两大维度合并，让AI真正”认识你”
混合搜索	单条查询同时支持RAG（知识库检索）+ 记忆检索，一次性返回文档结果和个性化上下文
多平台连接器	支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步，支持实时webhook更新
多模态内容提取	支持PDF、图片（OCR）、视频（转录）、代码（AST感知分块）等内容的上传和解析

典型使用场景

场景一：给Claude/Cursor加上”永久记忆”

通过MCP服务器接入后，AI助手会自动调用 memory 工具保存重要信息，调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”，AI下次写代码时会自动遵循这个偏好，不再需要每次重复背景。

场景二：为AI产品构建上下文栈

通过单个API调用获得完整的上下文能力，无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入，几行代码完成集成。

场景三：企业知识库+个人记忆融合

supermemory的混合搜索模式，让AI既能检索企业知识库文档（RAG），又能记住每个用户的个性化偏好和历史对话（记忆），两种能力融合，特别适合企业AI助手、客服机器人等场景。

下载地址

来源	链接
GitHub仓库	github.com/supermemoryai/supermemory（25.6K ⭐）
官方网站	supermemory.ai
文档中心	supermemory.ai/docs
控制台	console.supermemory.ai
npm包	npmjs.com/package/supermemory
PyPI包	pypi.org/project/supermemory

开源协议：MIT | 主要语言：TypeScript | 最后更新：2026年6月

2026年6月5日

Chroma：43.1K Stars！开源向量数据库，让AI应用拥有长期记忆

开源向量数据库 · 让AI拥有长期记忆

📦 项目简介

Chroma 是专为AI应用打造的开源嵌入式向量数据库，让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API，帮助你快速存储、查询和检索文本Embedding向量，是构建RAG（检索增强生成）应用的首选基础设施。

🔗 GitHub：chroma-core/chroma　⭐ Stars：43.1K+　📄 协议：Apache 2.0

🔧 安装要求和过程

环境要求

依赖	要求
Python	≥ 3.8（推荐 3.10+）
内存	≥ 4GB（生产环境建议 8GB+）
存储	≥ 1GB 可用空间
可选后端	SQLite（默认）、DuckDB（分析场景）

快速安装（3行代码搞定）

pip install chromadb

import chromadb
client = chromadb.Client()  # 开箱即用！

Docker 部署（生产推荐）

docker run -d --name chroma \
  -p 8000:8000 \
  ghcr.io/chroma-core/chroma:latest

部署后访问 http://localhost:8000 即可使用 HTTP API。

🔩 核心功能

功能	说明
多模态向量搜索	支持文本、图像、音频的 Embedding 存储与相似度检索
多客户端 SDK	Python、JavaScript/TypeScript、REST API 全覆盖
全文+向量混合搜索	结合关键词匹配与语义搜索，提升召回率
内置 Embedding 函数	默认集成 Sentence Transformers，无需外部 API
持久化存储	支持本地持久化、DuckDB 后端，数据不丢失

💡 典型使用场景

场景一：RAG（检索增强生成）应用

将企业文档、知识库存入 Chroma，用户提问时先检索相关片段，再送给 LLM 生成答案。相比直接问 LLM，准确率提升 40%+，幻觉大幅减少。

# RAG 核心代码（不到 20 行！）
collection = client.create_collection("docs")
collection.add(
    documents=["公司报销流程...", "年假申请..."],
    ids=["1", "2"]
)
results = collection.query(query_texts=["如何报销？"], n_results=1)
# results 包含最相关的文档片段

场景二：AI Agent 长期记忆

让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma，下次对话时自动检索上下文，实现”越用越懂你”。

场景三：语义推荐系统

电商、内容平台的”猜你喜欢”，用 Chroma 存储商品/内容向量，用户行为向量实时检索最相似物品，推荐相关度远超协同过滤。

🌟 推荐理由

Chroma 是我见过最易上手的向量数据库，没有之一。不需要学 SQL，不需要配置复杂集群，pip install 之后 3 行代码就能跑起来。

相比 Pinecone 等托管服务，Chroma 完全开源、可自托管，数据不出门，合规零风险。相比 Faiss，它提供了完整的 CRUD API 和持久化，不用每次重启都重新建索引。

如果你正在做 RAG、AI 搜索、推荐系统，或者想给 Agent 加上记忆，Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成，生态非常成熟。

📥 下载地址

渠道	链接 / 命令
GitHub 仓库	github.com/chroma-core/chroma
官网文档	docs.trychroma.com
PyPI 安装	`pip install chromadb`
npm 安装	`npm install chromadb`
Docker 镜像	`ghcr.io/chroma-core/chroma:latest`

— 开源项目第52期 | 夜野飞云 —

2026年6月5日

Chroma：43.1K Stars！开源向量数据库，让AI应用拥有长期记忆

开源向量数据库 · 让AI拥有长期记忆

📦 项目简介

🔗 GitHub：chroma-core/chroma　⭐ Stars：43.1K+　📄 协议：Apache 2.0

🔧 安装要求和过程

环境要求

依赖	要求
Python	≥ 3.8（推荐 3.10+）
内存	≥ 4GB（生产环境建议 8GB+）
存储	≥ 1GB 可用空间
可选后端	SQLite（默认）、DuckDB（分析场景）

快速安装（3行代码搞定）

pip install chromadb

import chromadb
client = chromadb.Client()  # 开箱即用！

Docker 部署（生产推荐）

docker run -d --name chroma \
  -p 8000:8000 \
  ghcr.io/chroma-core/chroma:latest

部署后访问 http://localhost:8000 即可使用 HTTP API。

🔩 核心功能

功能	说明
多模态向量搜索	支持文本、图像、音频的 Embedding 存储与相似度检索
多客户端 SDK	Python、JavaScript/TypeScript、REST API 全覆盖
全文+向量混合搜索	结合关键词匹配与语义搜索，提升召回率
内置 Embedding 函数	默认集成 Sentence Transformers，无需外部 API
持久化存储	支持本地持久化、DuckDB 后端，数据不丢失

💡 典型使用场景

场景一：RAG（检索增强生成）应用

将企业文档、知识库存入 Chroma，用户提问时先检索相关片段，再送给 LLM 生成答案。相比直接问 LLM，准确率提升 40%+，幻觉大幅减少。

# RAG 核心代码（不到 20 行！）
collection = client.create_collection("docs")
collection.add(
    documents=["公司报销流程...", "年假申请..."],
    ids=["1", "2"]
)
results = collection.query(query_texts=["如何报销？"], n_results=1)
# results 包含最相关的文档片段

场景二：AI Agent 长期记忆

让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma，下次对话时自动检索上下文，实现”越用越懂你”。

场景三：语义推荐系统

电商、内容平台的”猜你喜欢”，用 Chroma 存储商品/内容向量，用户行为向量实时检索最相似物品，推荐相关度远超协同过滤。

🌟 推荐理由

Chroma 是我见过最易上手的向量数据库，没有之一。不需要学 SQL，不需要配置复杂集群，pip install 之后 3 行代码就能跑起来。

📥 下载地址

渠道	链接 / 命令
GitHub 仓库	github.com/chroma-core/chroma
官网文档	docs.trychroma.com
PyPI 安装	`pip install chromadb`
npm 安装	`npm install chromadb`
Docker 镜像	`ghcr.io/chroma-core/chroma:latest`

— 开源项目第52期 | 夜野飞云 —

2026年6月5日

agency-agents：107K Stars！203个即插即用AI专家角色，让一人公司成为现实
🤖 项目简介

agency-agents 是一个开源的AI智能体集合项目，本质上是一套即插即用的AI专家角色库。每个智能体都有明确的身份定义、关键规则、工作流程和交付标准，安装到Claude Code、Cursor、Aider等AI编程工具后，用自然语言即可激活对应专家角色。

项目包含203个覆盖14个专业领域的AI智能体，从前端开发、UI设计到营销运营、游戏开发，几乎涵盖了数字产品构建的全链路。它不是一个Agent框架，而是一套经过实战验证的”岗位说明书”集合。

⚙️ 安装要求和过程

环境要求：
- 已安装任意支持的AI编程工具（Claude Code、Cursor、Aider、Windsurf等）
- 本地有Git环境（用于克隆项目）
- Shell环境（Bash/PowerShell）用于运行安装脚本
快速安装步骤：
1. 克隆项目到本地：git clone https://github.com/msitarzewski/agency-agents.git
2. 进入项目目录：cd agency-agents
3. 一键安装到Claude Code（推荐）：./scripts/install.sh --tool claude-code
4. 或生成多工具适配格式：./scripts/convert.sh && ./scripts/install.sh
5. 在AI工具中直接激活：激活前端开发专家模式，帮我开发一个React组件
中文用户可使用汉化版：git clone https://github.com/blackpinkman/agency-agents-zh.git

✨ 核心功能
- 高度专业化：每个智能体深耕单一领域，不是通用Prompt模板。比如”前端开发专家”知道如何做组件拆解、类型安全、无障碍访问，”Reddit社区运营专家”知道如何自然植入、避免营销感。
- 人格化设计：每个智能体都有独特沟通风格。比如”证据收集员”默认会找出3-5个代码问题、要求所有结论提供视觉证明；”趣味注入者”会在UI设计中加入符合产品调性的趣味交互。
- 交付物明确：每个智能体都有标准化的输出要求——代码、方案文档、测试报告、运营策略，而非模糊的建议。这让AI的输出真正可落地。
- 多工具兼容：原生支持Claude Code，同时提供转换脚本，可适配Cursor、Aider、Windsurf、GitHub Copilot、Gemini CLI等12种主流AI编程工具，无需重新编写智能体规则。
- 可定制扩展：支持用户修改现有智能体的性格、工作流程，也可以按照模板新增自定义智能体，提交PR贡献到社区。目前已有超过200个专业智能体。
🚀 典型使用场景

场景一：一人公司MVP开发

组合调用”前端开发专家”+”后端架构师”+”增长黑客”+”快速原型开发师”+”质量校验员”，全链路覆盖从架构设计、代码开发、用户增长到上线质量校验的流程。一个开发者配上这套智能体团队，可以在极短时间内完成过去需要5-8人的工作量。

场景二：全渠道营销活动上线

组合调用”内容创作者”+”Twitter运营专家”+”Instagram内容策划”+”Reddit社区运营”+”数据报表分析师”，多平台协同运营，每个平台都有对应的专业策略。避免了用一套话术通发所有平台导致的效果不佳问题。

场景三：企业级功能迭代

组合调用”高级项目经理”+”资深开发工程师”+”UI设计师”+”A/B测试跟踪员”+”质量校验员”，符合企业级交付标准，有完整的流程管控和质量门禁，保证交付稳定性。

💡 推荐理由

这个项目最打动我的一点是：它把”如何让AI更好地工作”这个问题，转化成了”如何给AI写一份好的岗位说明书”。我们平时用AI编程工具，最大的痛点不是模型能力不足，而是不知道怎么让AI按照专业标准交付。

agency-agents 的价值在于，它把各个领域专家的工作方式、思考逻辑、交付标准都结构化了，然后打包成可以直接给AI读取的Markdown文件。你不需要懂Prompt工程，只需要”激活前端开发专家”，AI就会自动按照前端专家的工作流来帮你。

另一个亮点是它的人格化设计。很多AI角色定义都是冷冰冰的指令，但这里的每个智能体都有独特的性格。比如”证据收集员”会主动找茬，”趣味注入者”会在合适的地方加彩蛋。这让AI的回复不再是机器式的套话，而是有个人风格的专业输出。

对于独立开发者或者小团队来说，这个项目基本上等于免费雇了一整个专家团队。前端、后端、设计、营销、项目管理——只要你能想到的角色，这里都有。而且因为是开源的，你还可以根据自己的需求定制每个角色的性格和工作方式。

📥 下载地址
- 原版GitHub：github.com/msitarzewski/agency-agents（107k+ Stars）
- 中文汉化版：github.com/blackpinkman/agency-agents-zh（211个角色，持续更新）
- 官方网站：agency-agents.com
- 使用文档：项目README包含完整安装指南和所有智能体列表
支持Claude Code、Cursor、Aider、Windsurf、GitHub Copilot、Gemini CLI等17种AI工具，开箱即用。
2026年6月5日

标签： GitHub

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：快速启动新项目

场景二：分析现有代码变更

场景三：非交互式脚本自动化

推荐理由

下载地址

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：企业级大模型API服务

场景二：本地开发与环境测试

推荐理由

下载地址

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

可选功能扩展

核心功能

🏢 模拟软件公司架构

📋 SOP 标准化流程

📄 自动化文档生成

💻 完整代码实现

📊 智能图表生成

典型使用场景

场景一：快速原型开发

场景二：竞品分析与调研

场景三：教学与学习辅助

推荐理由

为什么值得关注？

下载地址

📦 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

🔥 核心功能

1. 向量检索（核心能力）

2. 递归爬取（数据接入）

3. 元数据过滤（精准召回）

4. 插件标准接口（OpenAI 官方规范）

💡 典型使用场景

场景一：企业知识库问答

场景二：技术文档助手

🌟 推荐理由

📥 下载地址

项目简介

安装要求和过程

核心功能

1. 生成式UI（Generative UI）

2. AG-UI协议的主导者

3. 人机协同工作流

4. 共享状态管理

5. 自学习Agent（早期访问）

典型使用场景

场景一：AI客服系统

场景二：企业知识库助手

推荐理由

下载地址

📌 项目简介

🔧 安装要求和过程

环境要求

快速安装步骤

🚀 核心功能

🌐 统一 LLM 调用

🛡️ AI 网关能力

🤖 智能体（A2A）支持

🔗 MCP 工具桥接

🏢 企业级特性

💡 典型使用场景