标签： LLM

LobeChat —— 72K+ Stars 开源 AI 聊天框架，比 ChatGPT 更自由的选择
🤯 LobeChat

开源 AI 聊天框架，72K+ Stars，比 ChatGPT 更自由的 AI 客户端

⭐ GitHub 72K+ Stars |
🌐 在线体验 |
MIT 开源

📌 项目简介

LobeChat 是 LobeHub 团队开发的开源 AI 聊天框架，也是 GitHub 上 Star 数最多的开源 AI 客户端之一（72K+ Stars）。它支持 Web 和桌面两种形式，在一个界面里同时接入 GPT、Claude、Gemini、DeepSeek、Ollama 等 80+ 模型，还内置插件市场、RAG 知识库、多模型对比等实用功能。最重要的是——完全免费开源，数据可完全本地化。

⭐

72K+

GitHub Stars

🤖

80+

支持模型

🔌

40+

内置插件

💻

3 平台

Web/桌面/Docker

1
安装要求和过程

环境要求

部署方式环境要求

Web 版 浏览器访问，无需安装

桌面版 Windows/macOS/Linux，下载安装包

Docker Docker + Docker Compose

本地开发 Node.js 18+, pnpm, Git

快速安装（桌面版）

# 1. 从 GitHub Releases 下载对应平台安装包

https://github.com/lobehub/lobe-chat/releases

# Windows: LobeChat-win.exe

# macOS: LobeChat-mac.dmg

# Linux: LobeChat-linux.AppImage

Docker 部署（自托管推荐）

# 拉取镜像并启动

docker run -d -p 3210:3210 \

-e OPENAI_API_KEY=your-key \

–name lobechat lobehub/lobe-chat

2
核心功能

🤖 多模型统一接入

支持 OpenAI、Claude、Gemini、DeepSeek、Kimi、智谱、Ollama 等 80+ 模型，一个界面随意切换。自定义 Base URL，可接入任何兼容 OpenAI 协议的 API。

🔌 插件市场 + MCP 集成

内置 40+ 插件，联网搜索、代码执行、图片生成开箱即用。支持 MCP 协议，可一键接入 AI Agent 工具链，扩展能力无上限。

📚 RAG 知识库

上传 PDF、Word、网页，自动建立向量索引。基于个人知识库问答，适合企业文档、技术手册、合同条款等场景。本地向量数据库，数据不出门。

⚡ 多模型对比 + 语音对话

同一问题多模型同时回答，横向对比 Claude/GPT/Gemini 差异。内置 TTS/STT，支持语音对话。还有「助手市场」，几百个预设专业助手直接可用。

🏠 完全自托管 + 隐私优先

Docker 一键部署，数据全留本地。MIT 开源，可自由修改分发。对比 ChatGPT Plus $20/月，LobeChat 客户端免费，只需按 API 用量付费。

3
典型使用场景

🎯 场景一：多模型对比选型

在模型选型阶段，同一个 Prompt 同时发给 Claude Opus、GPT-5.4、Gemini 2.5 Pro，直接对比输出质量，不再靠猜。LobeChat 的多模型对比功能让选型决策有数据支撑。

📚 场景二：企业知识库问答

将公司技术文档、产品手册、合同模板上传到 LobeChat 知识库，基于 RAG 检索增强生成，精准回答内部问题。支持 Docker 私有化部署，数据完全不出企业内网。

💻 场景三：开发者日常助手

配置 DeepSeek V3（中文代码能力强，价格低）+ Claude Sonnet（复杂逻辑）+ GPT-5.4（多模态），不同任务自动切换最合适模型。助手市场里的「代码审查」「SQL 优化」等预设助手，开箱即用。
💡 推荐理由

我用过不少 AI 客户端，LobeChat 是最顺手的选择之一，原因如下：

✅ 真的免费：客户端 MIT 开源，桌面版零成本，只需付 API 费用（比 ChatGPT Plus 灵活太多）

✅ 真的开放：不绑定任何厂商，自定义 Base URL 接入任何兼容 API，甚至支持本地 Ollama

✅ 真的好用：界面现代美观，多模型对比、知识库、插件市场一应俱全，功能深度足够

✅ 真的私密：Docker 一键自托管，数据 100% 本地，适合对隐私有要求的企业和个人

如果你同时用多个 AI 模型，或者不想把数据交给 OpenAI，LobeChat 是目前最好的开源替代方案。
📥 下载地址

⭐ GitHub 仓库
 🌐 Web 版体验
 📦 桌面版下载
 📖 官方文档

许可协议：MIT License | 语言：TypeScript | 支持平台：Web / Windows / macOS / Linux / Docker

⚠️ 本文基于公开资料整理，项目数据截至 2026 年 6 月。LobeChat 与 LobeHub 为同一团队产品，功能持续迭代中。
2026年6月19日
Kilo Code – 22K+ Stars，开源AI编程智能体，支持VS Code/JetBrains/CLI三大平台
Kilo Code – 开源AI编程智能体

📦 项目简介

Kilo Code 是一款开源AI编程智能体，支持在 VS Code、JetBrains 和 CLI 中使用。它提供500+模型选择、多智能体协作、MCP市场扩展等强大功能，采用开源定价模式——你只需支付模型提供商的价格，零加价。

22K+

GitHub Stars

500+

AI模型

3

IDE支持

MIT

开源协议
⚙️ 安装要求和过程

环境要求

VS Code: 1.80.0+

JetBrains: IntelliJ IDEA, PyCharm, WebStorm 等 (2023.2+)

CLI: Node.js 18+ (for npm install) 或直接使用二进制文件

网络: 需要访问AI模型API（支持500+模型）

快速安装

方式一：VS Code 扩展

在 VS Code 扩展市场搜索 “Kilo Code”

点击安装

创建账户后即可使用（支持500+模型，包括GPT-5.5、Claude Opus 4.7、Gemini 3.1等）

方式二：命令行工具（CLI）

# npm 安装 npm install -g @kilocode/cli # curl 一键安装 curl -fsSL https://kilo.ai/cli/install | bash # pnpm pnpm add -g @kilocode/cli # bun bun add -g @kilocode/cli # Homebrew (macOS / Linux) brew install Kilo-Org/tap/kilo # Arch Linux (AUR) paru -S kilo-bin

安装后，在项目目录中运行 kilo 即可启动。

方式三：JetBrains 插件

在 JetBrains Marketplace 搜索 “Kilo Code”

或在 IDE 中打开 Settings → Plugins 搜索安装
✨ 核心功能

🤖 1. 多智能体协作

Kilo 内置多个专业智能体，可根据任务切换：

Code: 默认智能体，从自然语言生成和编辑代码

Plan: 在设计阶段先规划架构和实现方案，再写代码

Ask: 回答代码库相关问题，不修改文件

Debug: 排查和追踪问题

Review: 审查代码变更，发现性能、安全、风格和测试覆盖问题

你还可以创建自定义智能体，满足特定需求。

🧠 2. 500+ 模型支持

支持中途切换模型，根据任务需求匹配延迟、成本和推理能力。支持的顶级模型包括：

GPT-5.5

Claude Opus 4.7

Claude Sonnet 4.6

Gemini 3.1 Pro Preview

采用开源定价，支付模型提供商的价格，零加价，且不需要API密钥即可开始。

💻 3. 多IDE支持

Kilo Code 真正实现了全场景覆盖：

VS Code: 原生扩展，完整功能支持

JetBrains: 原生插件，支持 IntelliJ IDEA、PyCharm、WebStorm 等

CLI: 命令行工具，适合远程服务器和自动化场景

Cloud Agent: 网页版，无需本地机器

🔧 4. MCP 市场

通过 MCP (Model Context Protocol) 市场，可以发现和接入各种MCP服务器，扩展智能体的能力边界。让AI智能体能够连接数据库、API、文件系统等外部工具。

🚀 5. 自主模式 (CI/CD)

支持在 CI/CD 管道中运行自主模式：

kilo run --auto "run tests and fix any failures"

--auto 参数禁用所有权限提示，让智能体在无人工干预的情况下执行操作（仅在可信环境中使用）。
🎯 典型使用场景

场景一：日常编程助手

在 VS Code 或 JetBrains 中，通过自然语言描述需求，Kilo Code 自动生成代码。支持多文件编辑、代码重构、单元测试生成等任务。内置的行内自动补全功能提供”幽灵文本”建议，按Tab键即可接受。

场景二：代码审查自动化

在 Pull Request 中设置自动AI代码审查。Kilo Code 会检查性能问题、安全漏洞、代码风格不一致和测试覆盖率不足等问题，并直接在PR中给出反馈。

场景三：CI/CD 集成

在自动化管道中使用 kilo run --auto 命令，让AI智能体自动运行测试、修复失败、更新文档等。特别适合需要持续集成的大型项目。
💡 推荐理由

真正开源：MIT协议，代码完全开放，可自由使用、修改和分发（包括商业用途）

公平定价：零加价模式，你只需支付模型提供商的价格，不像其他AI编程工具那样收取高额订阅费

生态完整：支持VS Code、JetBrains、CLI三大平台，还提供Cloud Agent和代码审查服务

灵活扩展：MCP市场让智能体能力可无限扩展，自定义智能体满足个性化需求

活跃维护：22K+ Stars，2.7K+ Forks，801个开放Issue（说明社区活跃），持续更新中

如果你在寻找一个不绑定特定模型、不收取高额费用、真正开源可定制的AI编程助手，Kilo Code 是目前的最佳选择。
🖼️ 项目截图

Kilo Code 在 VS Code 和 CLI 中的运行效果

📥 下载地址

🌐 官方网站

https://kilo.ai/

💻 GitHub 仓库

Kilo-Org/kilocode

⭐ 22,150+ Stars | 🍴 2,706+ Forks

📥 VS Code 扩展

VS Code Marketplace

🔌 JetBrains 插件

JetBrains Marketplace

📚 官方文档

https://kilo.ai/docs

💬 社区

Discord | X (Twitter) | Reddit

📌 本文由自动化任务采集整理，数据截至 2026年6月19日

🔗 项目GitHub: https://github.com/Kilo-Org/kilocode
2026年6月19日
AnythingLLM — 61.7K Stars，全栈本地优先AI应用，私有知识库与AI代理一站式解决方案
Mintplex Labs 官方 Logo

📦 项目简介

AnythingLLM 是一款全功能本地优先 AI 应用，集 RAG（检索增强生成）、AI 代理、无代码代理构建器于一体。口号是「停止租用你的智能，用 AnythingLLM 拥有它」。支持连接本地或云端 LLM，导入文档后即可快速开始对话，内置代理、多用户支持、向量数据库和文档管道，无需额外配置。

⭐ 61.7K+ Stars
🍴 6.74K+ Forks
📜 MIT 许可
🏢 Mintplex Labs
⚙️ 安装要求和过程

环境要求

Docker（推荐，最简单方式）

或：Node.js 18+、Yarn、LM Studio / Ollama（裸金属部署）

支持系统：macOS、Windows、Linux

向量数据库：默认 LanceDB（内置，无需额外安装）

快速安装 — 桌面版（最简单）

# 访问官网下载对应系统安装包

https://anythingllm.com/download

# macOS

下载 .dmg → 拖入 Applications

# Windows

下载 .exe → 一路 Next

# Linux

下载 .AppImage → chmod +x → 运行

Docker 部署（推荐服务器）

# 拉取最新镜像

docker pull mintplexlabs/anythingllm

# 运行容器

docker run -p 3001:3001 mintplexlabs/anythingllm

# 浏览器访问

http://localhost:3001
✨ 核心功能

🤖 无代码 AI 代理构建器

可视化构建 AI 代理，支持网页浏览、RAG 文档查询、API 调用等技能，无需写代码即可打造专属 AI 助手。

🧠 动态模型路由 + 智能记忆

根据自定义规则自动将对话路由到最合适的模型和提供商；AI 可记住你和工作区的重要信息，实现跨会话持久化上下文。

📚 强大的 RAG 文档处理

支持 PDF、TXT、DOCX、CSV 等多种格式，内置针对大型文档集的优化，比其他聊天 UI 成本更低、响应更快。

👥 多用户与权限管理

Docker 版本支持多用户实例与权限管控，适合团队协作；不会泄露实例安全或知识产权，企业级安全设计。

🔌 MCP 兼容 + 完整开发者 API

支持 Model Context Protocol (MCP)，可无缝接入外部工具；提供完整 REST API，支持自定义集成与二次开发。

🎯 典型使用场景

① 私有知识库问答

将公司文档、技术手册、研究报告导入 AnythingLLM，打造私有化部署的 ChatGPT。员工可直接提问，AI 基于内部文档给出准确答案，数据不出企业内网。

② 个人 AI 研究助手

结合本地 Ollama 运行开源模型，导入论文 PDF 和研究笔记，AI 代理可自动联网搜索、整理资料、定时执行研究任务，是研究人员的全能助手。

③ 网站智能客服嵌入

利用可嵌入聊天组件（Docker 版），将定制化的 AI 客服挂到企业官网，基于私有知识库自动回答客户问题，无需人工值守。

💡 推荐理由

作为一款本地优先的全栈 AI 应用，AnythingLLM 最大的优势在于开箱即用——下载桌面版，连接本地 Ollama，导入文档，三步搞定私有知识库。无需 Docker、无需配置向量数据库、无需写代码。

对比同类产品：Dify 偏向可视化工作流编排，AnythingLLM 更聚焦于个人/小团队的文档对话场景，界面更简洁，部署更轻松。MIT 许可意味着你可以自由修改和分发，真正「拥有你的智能」。

特别推荐给：重视数据隐私的开发者、需要内部知识库的中小团队、以及想体验本地 LLM + RAG 完整链路的 AI 爱好者。

📥 下载地址

🖥️ 官网下载桌面版
 ⭐ GitHub 仓库
 📚 官方文档

支持 macOS / Windows / Linux | Docker 镜像可用 | 自托管部署指南完备

🛠️ 技术栈

前端: ViteJS + React ｜后端: NodeJS + Express ｜ 向量数据库: LanceDB（内置）
支持模型: OpenAI / Anthropic / Ollama / LM Studio / Bedrock 等｜许可: MIT
2026年6月19日
Firecrawl — 134K+ Stars，为 AI Agent 量身打造的网页数据 API，搜索/爬取/交互一体化
🔥 Firecrawl

The API to search, scrape, and interact with the web at scale

⭐ 134K+ Stars
📦 TypeScript
📜 AGPL-3.0

📌 项目简介

Firecrawl 是专为 AI Agent 设计的网页数据 API，能将任意网页（含 JS 渲染）转换成 AI 友好的 Markdown/JSON 格式。它覆盖 96% 的网页，P95 延迟仅 3.4 秒，原生支持 MCP 协议，是 AI 应用获取实时网页数据的首选基础设施。
⚙️ 安装要求和过程

环境要求

Python
3.8+ (SDK 支持)

Node.js
16+ (SDK 支持)

API Key
firecrawl.dev 注册

自托管
Docker / Redis / Playwright

快速安装（Python SDK）

# 安装 Python SDK pip install firecrawl-py # 基础使用示例 from firecrawl import Firecrawl app = Firecrawl(api_key="fc-YOUR_API_KEY") # 搜索网页 result = app.search("Firecrawl tutorial", limit=5) # 爬取单个 URL result = app.scrape('https://example.com', formats=["markdown"]) print(result.markdown)

快速安装（Node.js SDK）

# 安装 Node.js SDK npm install firecrawl # 基础使用示例 import { Firecrawl } from 'firecrawl'; const app = new Firecrawl({ apiKey: 'fc-YOUR_API_KEY' }); const result = await app.scrape('https://example.com', { formats: ['markdown'] }); console.log(result.markdown);

MCP 集成（AI Agent 一键接入）

# 一键安装 MCP Skill（支持 Claude Code、OpenClaw 等） npx -y firecrawl-cli@latest init --all --browser # 或手动配置 MCP 客户端 { "mcpServers": { "firecrawl-mcp": { "command": "npx", "args": ["-y", "firecrawl-mcp"], "env": { "FIRECRAWL_API_KEY": "fc-YOUR_API_KEY" } } } }

自托管部署（Docker）

# 克隆仓库 git clone https://github.com/firecrawl/firecrawl.git cd firecrawl # 启动自托管服务（需要 Docker、Redis、Playwright） docker-compose up -d # 访问本地服务 # API: http://localhost:3002 # Playground: http://localhost:3002/playground
⚡ 核心功能

🔍 Search（智能搜索）

全网搜索并返回结果页的完整 Markdown 内容，不再只是返回标题和 URL。支持关键词搜索、URL 搜索、智能过滤，返回结果可直接供 AI Agent 使用，无需二次处理。

🕷️ Scrape（智能爬取）

将任意 URL 转换为 Markdown、HTML、截图或结构化 JSON。自动处理 JS 渲染、代理轮换、速率限制、反爬虫策略，覆盖 96% 的网页，P95 延迟仅 3.4 秒。

🤖 Agent（智能代理）

无需指定 URL，用自然语言描述需求即可自动完成数据收集。支持结构化输出（Pydantic Schema），可自动提取创始人信息、产品定价、竞品对比等复杂数据，返回类型安全的 Python 对象。

🗺️ Crawl + Map（全站爬取与 URL 发现）

Crawl 支持单次请求爬取整个网站的所有页面内容；Map 快速发现网站所有 URL，支持关键词筛选。支持异步批量爬取数千个 URL，适合大规模数据采集场景。

🖱️ Interact（交互式爬取）

爬取页面后可执行点击、滚动、输入、等待、按键等交互操作，应对需要登录、搜索、翻页等动态场景。AI 提示驱动，无需编写复杂的选择器代码。
💡 典型使用场景

场景一：AI Agent 实时联网搜索

通过 Firecrawl 的 Search API，AI Agent 可以实时搜索网页并获取完整内容，不再受训练数据时效限制。结合 MCP 协议，Claude Code、OpenClaw 等 AI 工具可以一键调用 Firecrawl 获取最新信息。

# AI Agent 使用 Firecrawl 搜索最新信息 result = app.search( query="2026年 AI 开源项目趋势", limit=10, scrape_options={"formats": ["markdown"]} ) # result 包含搜索结果 + 每个结果的完整 Markdown 内容

场景二：RAG 应用网页数据注入

RAG（检索增强生成）应用需要大量外部数据，Firecrawl 可以批量爬取指定网站内容并转换为 Markdown，直接注入向量数据库。支持智能等待、JS 渲染、反爬虫绕过，大幅提升 RAG 应用的数据质量。

# 批量爬取文档网站，用于 RAG docs = app.crawl( url="https://docs.example.com", limit=1000, scrape_options={"formats": ["markdown", "html"]} ) # 将 docs 存入向量数据库（如 Milvus、Pinecone）

场景三：竞品价格监控与数据分析

使用 Agent API 自动收集竞品定价、功能对比、用户评价等数据，无需手动指定 URL，只需用自然语言描述需求。支持结构化输出，直接返回类型安全的 JSON 数据，可接入自动化分析流程。

# 使用 Agent 自动收集竞品定价 result = app.agent( prompt="Compare pricing of Firecrawl, ScrapingBee, and Apify", schema=PricingComparisonSchema ) print(result.data) # 结构化 JSON 输出
❤️ 推荐理由

在 AI Agent 和 RAG 应用爆发式增长的今天，如何获取实时、高质量的网页数据成为了一个核心痛点。传统爬虫工具要么太底层（需要自己处理代理、JS 渲染、反爬虫），要么不够 AI 友好（返回脏 HTML，需要额外清洗）。

Firecrawl 完美解决了这个问题：

🌟 AI 原生设计：输出直接是 Markdown/JSON，无需额外清洗，降低 token 消耗

🌟 高可靠性：覆盖 96% 的网页，自动处理 JS 渲染、代理轮换、速率限制

🌟 高速度：百万级页面爬取 P95 延迟仅 3.4 秒，适合实时 AI 应用

🌟 MCP 原生支持：一键接入主流 AI Agent 工具，无需复杂配置

🌟 多语言 SDK：Python、Node.js、Java、Rust、Elixir 全覆盖

🌟 开源可自托管：AGPL-3.0 许可，数据隐私完全自主可控

💡 个人使用心得：Firecrawl 已成为我构建 AI Agent 的标配工具。以前需要组合使用 requests + BeautifulSoup + Playwright + 代理池才能完成的任务，现在一行代码就能解决。特别是它的 Agent API，用自然语言描述需求即可自动收集数据，大大降低了数据采集的门槛。如果你正在构建需要实时网页数据的 AI 应用，Firecrawl 绝对值得一试！
📊 项目数据

⭐

134K+

GitHub Stars

🍴

7.8K+

Forks

👥

375+

Contributors

📦

5+

官方 SDK

📥 下载地址

🔗 GitHub 仓库
 🌐 官方网站
 📚 官方文档
 🎮 在线试用

支持 Python、Node.js、Java、Rust、Elixir 等多语言 SDK • 开源 AGPL-3.0 许可 • 支持自托管部署
2026年6月18日
RAGFlow：83K+ Stars 的开源 RAG 引擎，为 LLM 打造卓越上下文层
📌 项目简介

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，由 InfiniFlow 团队（Milvus 向量数据库原班人马）开发，将前沿 RAG 技术与 Agent 能力深度融合，为大语言模型提供卓越的上下文理解层。

RAGFlow 系统架构概览

⚙️ 安装要求和过程

环境要求（自托管）

配置项最低要求

CPU ≥ 4 核

内存 ≥ 16 GB

磁盘 ≥ 50 GB

Docker ≥ 24.0.0

Docker Compose ≥ v2.26.1

🐳 Docker 快速部署（推荐）
```
# 1. 调整系统内核参数（避免 Elasticsearch 启动失败）
sudo sysctl -w vm.max_map_count=262144

# 2. 克隆项目代码
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker

# 3. 切换到稳定版本
git checkout v0.26.1

# 4. 启动服务（仅CPU）
docker compose -f docker-compose.yml up -d

# （可选）如需GPU加速，先执行：
# sed -i '1i DEVICE=gpu' .env
# docker compose -f docker-compose.yml up -d

# 5. 验证服务状态
docker logs -f docker-ragflow-cpu-1
```
启动成功后，浏览器访问服务器 IP 地址（默认 HTTP 端口 80）即可进入 RAGFlow 登录页面。

💻 源码启动（开发用途）
```
# 安装依赖工具
pipx install uv pre-commit

# 克隆代码
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
uv sync --python 3.13
uv run python3 download_deps.py

# 启动基础依赖服务
docker compose -f docker/docker-compose-base.yml up -d

# 启动后端
source .venv/bin/activate
export PYTHONPATH=$(pwd)
bash docker/launch_backend_service.sh

# 启动前端（新终端）
cd web && npm install && npm run dev
```
✨ 核心功能

1. 深度文档理解，输入即精准

基于先进的文档解析技术，可从格式复杂的非结构化数据（PDF、Word、PPT、Excel、扫描件、图片等）中精准提取知识，真正做到”Quality in, Quality out”。

2. 可视化模板化分块，答案可追溯

分块逻辑智能可解释，提供大量预置分块模板；支持文本分块可视化，允许人工干预调整；最终答案附带可追溯的引用来源，有效降低 LLM 幻觉问题。

3. 多源数据兼容，异构数据统一管理

支持解析 Word、PPT、Excel、TXT、图片、扫描件、结构化数据、网页等各类异构数据源，一站式完成企业知识库构建。

4. Agentic 工作流 + MCP 协议支持

内置丰富 Agent 能力，支持 Agentic 工作流编排、MCP 协议接入；内置 Python/JavaScript 代码执行器组件；支持 AI Agent 记忆功能。

5. 高精度混合检索，多路召回+融合重排

结合向量搜索、BM25 关键词搜索和自定义评分机制，配合先进重排序算法，提供无与伦比的回答准确性和上下文相关性。

🚀 典型使用场景

📈 股权投资研究

自动化收集公司数据，整合财务指标与研究洞察。通过自主规划和多智能体编排，实现高级股票分析。自动从用户查询中识别股票代码，聚合外部权威来源和内部记录中的洞察，最终结合定性洞察和财务指标生成完整投资报告。

⚖️ 法律判例分析

通过检查公共来源和内部数据集中的类似法律案例，提供结构化判例分析。自动提取关键属性（如司法管辖区和法律问题）以制定搜索查询并检索可比较的先例，最终整合成结构化分析报告。

🏭 制造业维护支持

通过从内部手册中准确获取内容，提供结构化维护指导（外部参考作为补充支持）。输入任务后，工作流首先验证输入充分性，然后从内部维护手册中提取标准协议，整合补充外部技术数据，生成清晰的执行指令。

💡 推荐理由

RAGFlow 是我用过的最”务实”的 RAG 产品，没有之一。

第一，它真正解决了 RAG 的底层痛点——文档解析。很多 RAG 框架只关注向量检索和生成，却忽略了最关键的”输入质量”问题。RAGFlow 的 DeepDoc 技术能精准解析复杂格式的 PDF、扫描件，真正做到”Garbage in, garbage out”的反面——Quality in, quality out。

第二，可视化分块 + 可追溯引用，让 AI 回答有章可循。这是企业场景的刚需。你可以清楚看到每个答案是从哪个文档的哪个位置来的，大幅降低了 LLM 幻觉带来的风险。

第三，Agentic 能力的融合非常自然。不是简单地在 RAG 上面套一个 Agent 外壳，而是将 Agent 能力（MCP 协议、代码执行、记忆管理）深度集成到 RAG 工作流中，真正实现了”RAG + Agent”的一体化编排。

最后，InfiniFlow 团队是 Milvus 的原班人马，技术底蕴深厚。83K+ Stars 和 9600+ Forks 的社区活跃度也证明了产品的成熟度。如果你正在构建企业级知识库或 RAG 应用，RAGFlow 绝对值得一试。

📥 下载地址

🌐 官方网站：https://ragflow.io

📦 GitHub 开源地址：https://github.com/infiniflow/ragflow ⭐ 83K+ Stars

☁️ 云服务（快速体验）：https://cloud.ragflow.io

📚 官方文档：https://ragflow.io/docs/dev/

💡 小贴士：RAGFlow 支持飞书、Discord、Telegram、Line 等多聊天渠道接入（2026年6月更新），可快速将企业知识库接入到日常沟通工具中！
2026年6月18日
claude-mem —— 82.9K+ Stars，让 AI 智能体拥有跨会话持久记忆的开源工具
🔥 GitHub 热门 AI 开源项目 · 第 21 期

📌 项目简介

claude-mem 是为所有 AI 智能体提供跨会话持久化记忆的开源工具。它能自动捕获 AI 代理在会话中的所有操作行为，通过 AI 压缩生成结构化记忆条目，并在后续会话中自动注入相关历史上下文。支持 Claude Code、OpenClaw、Codex、Gemini、Copilot 等主流 AI 编程工具，让无状态的 AI 代理拥有真正的”长期记忆”。

🖼️ 项目预览

claude-mem – AI 智能体跨会话记忆引擎
⚙️ 安装要求与过程

环境要求
- ✅ Node.js ≥ 18.0.0（核心运行环境）
- ✅ 支持的操作系统：macOS、Linux、Windows（WSL2 推荐）
- ✅ 已安装任意支持的 AI 工具：Claude Code / OpenClaw / Codex / Gemini CLI / Copilot 等
- ✅ 网络畅通（需访问 AI 供应商 API）
快速安装
```
# 交互式安装（推荐）
npx claude-mem install

# 指定参数安装
npx claude-mem install --provider gemini --model gemini-pro

# 安装后修复（如遇问题）
npx claude-mem repair

# 查看版本
npx claude-mem --version
```
Server Beta 模式（团队协作）
```
# 配置环境变量
export CLAUDE_MEM_RUNTIME=server-beta
export CLAUDE_MEM_SERVER_DATABASE_URL=postgres://user:pass@localhost:5432/claudemem

# 启动 API 服务
claude-mem server start

# 启动生成 Worker
claude-mem server worker start
```
✨ 核心功能

1. 全自动上下文捕获与注入

无需任何手动标注，claude-mem 自动捕获会话中的所有工具调用、文件读写、代码编辑等行为，通过 AI 压缩生成结构化记忆条目。新会话启动时，自动注入最相关的历史上下文，让 AI 代理”记得”之前做过的工作。

2. 多工具统一支持

原生支持 Claude Code、OpenClaw、Codex、Gemini、Hermes、GitHub Copilot、OpenCode 等主流 AI 编程工具。同时支持通过 MCP 协议接入 Cursor、Windsurf 等更多 IDE，真正实现”一次安装，处处可用”。

3. 可视化记忆管理

内置 Web 查看器（默认 localhost），可实时查看 AI 代理的操作记录、生成的记忆条目、会话统计等信息。支持按项目筛选记忆内容，可手动触发项目全量学习（/learn-codebase），帮助 AI 快速理解代码库。

4. 企业级多租户支持（Server Beta）

支持基于 Postgres 的独立服务端部署，无需依赖本地 Worker 进程。提供团队/项目级别的权限隔离、API Key 管理、操作审计链路，支持 Docker 容器化部署和水平扩展，满足企业协作场景需求。

5. 成本优化遥测

采用 5 分钟滚动窗口聚合遥测事件，可降低 99.9% 的 PostHog 使用成本。支持历史遥测数据匿名化回填，AI 生成任务幂等性设计避免重复计费，用户可自主选择是否开启遥测。

💡 典型使用场景

场景一：多日开发项目的上下文延续

你正在用 Claude Code 开发一个复杂功能，工作日结束时会话上下文已达到上限。第二天开始新会话时，claude-mem 自动注入昨天的设计决策、修改的文件、遇到的问题等关键上下文，让你无需重新解释项目背景，直接继续开发。

场景二：团队协作中的知识共享

在团队项目中，开发者 A 用 Claude Code 完成了某个模块的开发。通过 claude-mem 的 Server Beta 模式，团队成员 B 在新会话中也能获取到 A 的开发上下文，包括设计思路、踩过的坑、未完成的 TODO 等，实现 AI 辅助开发的”知识传承”。

场景三：跨工具开发体验统一

你白天用 Claude Code 开发，晚上用 Gemini CLI 做代码 Review。claude-mem 作为统一的记忆层，让不同 AI 工具之间共享上下文，无论在哪个工具中操作，AI 都能”记得”你之前做过什么。

🌟 推荐理由

AI 编程工具的最大痛点之一就是会话结束后上下文丢失——你花了半小时给 AI 解释项目背景，新会话又要重新来一遍。claude-mem 从根本上解决了这个问题。

我特别欣赏它的零摩擦设计：安装后无需任何手动操作，AI 代理的所有行为都会被自动捕获和压缩。当你开始新会话时，相关记忆会自动注入，就像 AI “自然记得”之前的工作一样。

另一个亮点是多工具统一支持。如果你像我一样同时使用多个 AI 编程工具，claude-mem 提供了一个统一的记忆层，让不同工具之间可以共享上下文。这比每个工具各自维护记忆要高效得多。

项目的活跃度也很高，截至目前已有 82,991 个 Stars，最近更新在 2026 年 6 月，说明维护团队在持续迭代。Apache-2.0 许可也让它可以放心用于商业项目。
📥 下载地址
- 🌐 官方网站：https://claude-mem.ai
- 🐙 GitHub 仓库：https://github.com/thedotmack/claude-mem（82.9K+ Stars）
- 📦 npm 安装：npx claude-mem install
- 📄 开源协议：Apache-2.0
- 💬 Discord 社区：https://discord.gg/claudemem
💡 小贴士：安装完成后，在 AI 工具中输入 /learn-codebase 可触发项目全量学习，让 AI 更快理解你的代码库。查看记忆内容可访问安装时显示的 Web 查看器地址（默认 http://localhost:<端口>）。
2026年6月18日
vLLM —— 83K+ Stars 的 LLM 高性能推理引擎，PagedAttention 颠覆内存管理
vLLM — 高性能 LLM 推理与服务引擎

⚡ vLLM

83K+ Stars · 面向大模型的高吞吐量、内存高效推理与服务引擎

📌 项目简介

vLLM 是由加州大学伯克利分校 Sky Computing Lab 发起、现由 2800+ 贡献者共同维护的开源 LLM 推理与服务引擎。其核心竞争力在于首创的 PagedAttention 技术，通过智能管理注意力键值内存，大幅降低内存碎片，将 GPU 利用率推向极限。无论是本地开发调试，还是生产级大规模部署，vLLM 都是当前最热门的推理加速选择。

83K+

GitHub Stars

2.8K+

贡献者

200+

支持模型架构
🛠️ 安装要求与过程

环境要求：

Python 3.10+（推荐 3.12+）

NVIDIA GPU（CUDA 12.9/13.x）或 AMD GPU（ROCm）

也支持 CPU、Google TPU、Apple Silicon 等多种硬件

# 推荐用 uv 安装（更快更可靠）

uv pip install vllm

# 或用 pip

pip install vllm

# 快速启动 OpenAI 兼容 API 服务

python -m vllm.entrypoints.openai.api_server \
–model Qwen/Qwen3-8B –port 8000
🚀 核心功能

⚡ PagedAttention 内存管理

将注意力键值内存分页管理，类似操作系统的虚拟内存机制，大幅减少内存碎片和冗余复制，内存利用率提升 2-4 倍。

🔄 持续批处理 + 前缀缓存

动态合并正在处理的请求，并复用相同前缀（如 system prompt）的计算结果，吞吐量提升 3-5 倍。

🧩 200+ 模型架构原生支持

无缝兼容 Hugging Face 主流模型，涵盖 Llama、Qwen、DeepSeek-V3、Gemma、Mixtral、LLaVA 等，开箱即用。

🔧 丰富量化方案

支持 FP8、INT8、INT4、AWQ、GPTQ、GGUF 等主流量化格式，在保持精度的同时大幅降低显存占用和推理延迟。

🌐 OpenAI 兼容 API

提供与 OpenAI API 完全兼容的接口，只需改一行代码即可从 OpenAI 切换到自托管 vLLM，零迁移成本。

💡 典型使用场景

场景一：私有化部署大模型 API 服务

企业希望在内部环境部署 Qwen 或 Llama 大模型，提供类似 OpenAI 的 API 供业务系统调用。vLLM 可在单张 H100 上实现远超传统方案的吞吐量，显著降低推理成本。

场景二：本地开发与环境调试

开发者在本地机器上调试 Prompt 或测试 Agent 工作流，需要快速启动一个兼容 OpenAI SDK 的本地服务。vLLM 一条命令即可启动，支持流式输出和工具调用。

场景三：多模态模型推理服务

需要部署 LLaVA、Qwen-VL 等多模态模型，同时处理文本和图像输入。vLLM 对多模态模型提供原生支持，统一的 API 接口让多模态应用开发更加便捷。

✨ 推荐理由

vLLM 是目前 LLM 推理领域最炙手可热的开源项目，没有之一。它的核心竞争力在于 PagedAttention——这项技术直接解决了 LLM 推理中内存管理效率低下的痛点，是业界首个将操作系统虚拟内存思想引入注意力机制的工作，还发表了 SOSP 2023 学术论文。

实际使用下来，vLLM 最让人省心的是「开箱即用」——Hugging Face 模型直接加载，OpenAI API 直接兼容，量化方案直接配置。对于想把大模型「跑起来」的团队，vLLM 是目前最成熟、社区最活跃的选择。

值得一提的是，vLLM 的社区生态极其繁荣，AWS、NVIDIA、AMD、Google Cloud 等巨头均在赞助其开发。这意味着 vLLM 不仅是一个开源项目，更正在成为 AI 推理层的事实标准。

📥 下载地址

GitHub 仓库
 官方网站
 官方文档
 Media Kit

License: Apache 2.0 | 语言: Python | 最初开发: UC Berkeley Sky Computing Lab
2026年6月18日
Ollama — 本地大模型运行首选工具，165K+ Stars 的本地 LLM 神器
⚡ GitHub 热门 AI 开源项目

Ollama

在本地一键运行 Llama 3、DeepSeek、Qwen、Gemma 等开源大语言模型，无需云端，隐私优先

⭐ 165K+ Stars
📥 40K+ 社区集成
🦙 Go + C++
📜 MIT 开源协议

📌 项目简介

Ollama 是一款开源的本地大语言模型运行工具，让你在 macOS、Windows、Linux 上轻松下载、运行和管理各类开源 LLM。它内置了 llama.cpp 推理引擎，支持量化模型的高效运行，同时提供简洁的 CLI、REST API 以及 Python / JavaScript SDK，是本地 AI 开发的首选入口。
🔧 安装要求和过程

环境要求

支持 macOS 11+、Windows 10+、Linux（x86_64 / ARM64）

建议 8GB+ 内存（7B 模型）；16GB+（13B 模型）；32GB+（33B+ 模型）

磁盘空间：每个模型约 4GB~20GB

🍎 macOS

brew install ollama

或下载 Ollama.dmg 手动安装

🪟 Windows

下载 OllamaSetup.exe

官网 ollama.com 直接下载安装包

🐧 Linux

curl -fsSL https://ollama.com/install.sh | sh

🐳 Docker

docker run ollama/ollama

⚡ 快速开始

安装完成后，终端运行 ollama serve 启动服务（默认 11434 端口）

运行 ollama run deepseek-r1 拉取并启动 DeepSeek-R1 模型

直接在终端对话，或访问 http://localhost:11434 调用 REST API
🚀 核心功能

① 一键运行海量开源模型

内置模型库（ollama.com/library）涵盖 Llama 3、DeepSeek-R1、Qwen2.5、Gemma、Mistral、Phi-3 等数百个模型，一条命令即可拉取运行。支持自定义 Modelfile 导入 GGML / GGUF 格式模型。

② 完整的 REST API 与 SDK

默认在 11434 端口提供 OpenAI 兼容的 REST API，官方提供 Python 和 JavaScript SDK。可以无缝接入 LangChain、Lobe Chat、Open WebUI 等生态，开发者集成成本极低。

③ 多模型并行与 GPU 加速

支持同时加载多个模型，自动检测并利用 NVIDIA / AMD GPU 进行推理加速。macOS 上原生支持 Metal GPU 加速，Linux 支持 CUDA 和 ROCm，推理速度大幅提升。

④ 丰富的生态集成

社区已推出 40,000+ 个集成工具，涵盖桌面应用（Open WebUI、Enchanted）、IDE 插件（Continue、CopilotKit）、Agent 框架（LangChain、AutoGen）、RAG 工具（AnythingLLM）等，几乎覆盖所有 AI 开发场景。

⑤ 隐私优先，完全离线

所有推理在本地执行，数据不出本机。无需注册、无需联网、无需付费 API Key，特别适合对数据隐私有严格要求的企业内网和个人开发者。

💡 典型使用场景

场景一：本地 AI 编程助手

搭配 Continue.dev 或 VS Code Ollama 插件，在断网环境下也能使用本地 LLM 辅助代码补全、解释和重构。使用 DeepSeek-Coder 或 CodeLlama 模型，响应速度毫秒级，代码质量媲美云端模型。

实战示例：运行 ollama run deepseek-coder:6.7b，然后在 Continue.dev 中配置 Ollama 为默认 Provider，即可在 VS Code 侧边栏直接对话编程。

场景二：私有知识库 RAG 系统

结合 AnythingLLM 或 Open WebUI，将企业内网文档、PDF、Markdown 文件作为知识库，通过 Ollama 本地推理实现零数据外泄的智能问答系统。金融、医疗、法律等敏感行业尤为适用。

实战示例：Docker 部署 AnythingLLM，在设置中选择 Ollama 作为 LLM Provider，指定本地模型（如 Llama3:8b），然后上传内部文档即可开始私有问答。

场景三：AI 应用本地开发测试

在开发 AI 应用时，使用 Ollama 替代 OpenAI API 进行本地测试和迭代，无需消耗云端配额，也避免了敏感测试数据外传的风险。Ollama 的 API 与 OpenAI 高度兼容，切换成本极低。

实战示例：在 .env 中设置 OPENAI_BASE_URL=http://localhost:11434/v1 和 OPENAI_API_KEY=ollama，现有基于 OpenAI SDK 的代码几乎不用改动即可切换至本地模型。

✨ 推荐理由

作为本地 LLM 领域的”Docker”，Ollama 几乎是所有 AI 开发者入门本地模型的第一站。它把复杂的模型量化、推理引擎配置、GPU 驱动适配等底层细节全部封装，真正做到了”一行命令运行大模型”。

我个人最常用的场景是在无网环境下做代码审查和文档撰写——启动 DeepSeek-R1 本地模型，响应速度非常快，且完全不担心代码泄露。相比云端 API，本地运行的成本优势在长期使用中极为明显：一次性下载模型，后续零费用无限调用。

另外值得一提的是 Ollama 的 REST API 与 OpenAI 高度兼容，这意味着你可以用同一套代码同时支持云端和本地模型，在开发阶段用本地模型省成本，上线时切换到 GPT-4 保质量，这种灵活性是其他本地 LLM 工具难以提供的。

如果你还没试过在本地运行 LLM，Ollama 是最好的起点。165K Stars 和 40K+ 社区集成不是偶然——它真的好用。

📥 下载地址

🌐 官网下载
 ⭐ GitHub 仓库
 📖 官方文档
 🦙 模型库

GitHub 热门 AI 开源项目系列
2026年6月17日

部署方式	环境要求
Web 版	浏览器访问，无需安装
桌面版	Windows/macOS/Linux，下载安装包
Docker	Docker + Docker Compose
本地开发	Node.js 18+, pnpm, Git

配置项	最低要求
CPU	≥ 4 核
内存	≥ 16 GB
磁盘	≥ 50 GB
Docker	≥ 24.0.0
Docker Compose	≥ v2.26.1

CrewAI — 53.7K+ Stars，让多个AI智能体像团队一样协作的Python框架

🚀 CrewAI — 让多个 AI 智能体像团队一样协作

Star 数: 53.7K+ | 语言: Python | 协议: MIT | 更新: 2026-06-17

📌 项目简介

CrewAI 是一个完全独立、轻量、高性能的 Python 多智能体编排框架，专门用于协调角色扮演型自主 AI 智能体。它从零构建，不依赖 LangChain 或其他智能体框架，兼顾高层级开发的简洁性和底层控制的精准性，让多个 AI Agent 像真实团队一样分工协作，高效完成复杂任务。

目前已有超过 10 万名开发者通过官方学习平台完成认证，CrewAI 正快速成为企业级 AI 自动化的标准框架。

CrewAI 核心能力架构示意图

⚙️ 安装要求和过程

环境要求

Python: ≥ 3.10 且 < 3.14
依赖管理: 推荐使用 UV（极速 Python 包管理器）
LLM 接入: 需配置 OpenAI API Key 或兼容接口（支持 Ollama 本地模型）

快速安装

# 安装基础版本
uv pip install crewai

# 安装带常用工具的完整版本
uv pip install 'crewai[tools]'

# 创建新项目（推荐）
crewai create crew my_project

常见问题排查

报错信息	解决方案
`ModuleNotFoundError: No module named 'tiktoken'`	显式安装: `uv pip install 'crewai[embeddings]'`
`Failed building wheel for tiktoken`	安装 Rust 编译器 + Visual C++ Build Tools，或使用预编译包

✨ 核心功能

1. 完全独立的轻量框架

CrewAI 从零开始构建，完全不依赖 LangChain 等第三方智能体框架。执行速度比 LangGraph 快 5.76 倍（QA 任务场景），资源占用更低，定制更灵活。你可以在任意层级深度自定义 —— 从整体工作流到智能体内部提示词，全部开放。

2. 双模式编排：Crew + Flow

CrewAI 提供两种互补的核心编排能力：

Crew（智能体组）：支持智能体自主协作和动态决策，适合需要灵活交互的任务
Flow（工作流）：企业级生产架构，提供细粒度、事件驱动的流程控制，支持单 LLM 调用精准编排，原生兼容 Crew

两者可无缝结合，兼顾灵活性与可控性。

3. YAML 配置驱动开发

通过 agents.yaml 和 tasks.yaml 声明式配置智能体角色、目标和任务描述，将业务逻辑与代码逻辑完全解耦。@CrewBase 装饰器自动加载配置，开发体验极佳：

# config/agents.yaml
researcher:
  role: "{topic} Senior Data Researcher"
  goal: "Uncover cutting-edge developments in {topic}"
  backstory: "You're a seasoned researcher with a knack for ..."

# config/tasks.yaml
research_task:
  description: "Conduct a thorough research about {topic}"
  expected_output: "A list with 10 bullet points ..."
  agent: researcher

4. 丰富的工具生态与集成

内置 crewai_tools 工具包，包含 SerperDevTool（Google 搜索）、ScrapeWebsiteTool、PDFSearchTool 等常用工具。同时支持：

对接 Ollama / LM Studio 本地模型
对接 OpenAI / Anthropic / Gemini 等主流 LLM
自定义 Tool 类，轻松扩展能力边界
与企业现有系统、数据源和云基础设施无缝集成

5. 企业级可观测性与安全

CrewAI AMP Suite 提供企业级综合解决方案：

追踪与可观测性：实时监控 AI 智能体和 Workflows，提供指标、日志、调用链路追踪
统一控制平面：集中管理、监控、扩缩 AI 智能体和自动化流程
高级安全能力：内置安全与合规机制，支持本地/云端灵活部署
7×24 小时企业支持：专属支持团队保障业务无中断运行

💡 典型使用场景

场景一：AI 行业动态自动研究报告

配置一个「资深研究员」智能体和「报告分析师」智能体，前者利用搜索工具搜集最新资料，后者将分析结果整理为结构化 Markdown 报告。全程自动化，每天早上收到一份行业动态简报。

inputs = {'topic': 'AI Agents'}
LatestAiDevelopmentCrew().crew().kickoff(inputs=inputs)
# 输出: report.md — 完整的研究报告

适用：市场调研、竞品分析、技术趋势跟踪

场景二：股票分析自动化流水线

结合 SerperDevTool 获取实时财经新闻，多个分析智能体分别负责基本面分析、技术面分析、风险评估，最终由汇总智能体输出投资建议报告。CrewAI 官方示例仓库中提供了完整的 Stock Analysis 案例。

适用：量化投研、财经内容自动生成、投资决策辅助

场景三：旅行规划智能体组

「目的地推荐师」「酒店比价员」「行程安排师」三个智能体协同工作：推荐师根据预算和偏好输出目的地清单，比价员自动抓取酒店价格，安排师生成逐日行程表。CrewAI 官方 Trip Planner 示例可直接运行。

适用：个性化推荐系统、旅行/餐饮/购物助手、智能客服

🌟 推荐理由

在多智能体框架的选型上，我曾对比过 LangGraph、AutoGen 和 CrewAI，最终选择深入使用 CrewAI，原因主要有三点：

学习曲线最平缓。YAML 配置 + Python 代码的分离设计让业务逻辑一目了然，官方 learn.crewai.com 学习平台提供从入门到精通的系统课程，还有 DeepLearning.AI 的免费短课程，上手速度远超同类框架。
生产就绪。很多多智能体框架停留在 Demo 阶段，CrewAI 在设计之初就考虑了生产环境需求 —— Memory（记忆）、Delegation（任务委托）、Human-in-the-loop（人工介入）等生产必备功能一应俱全，且有企业级 AMP Suite 提供运维保障。
性能优势明显。官方基准测试显示 CrewAI 比 LangGraph 快 5.76 倍，在实际项目中我也感受到明显差异，尤其是多智能体并行执行场景下，响应速度和稳定性表现出色。

如果你正在考虑引入多智能体架构，CrewAI 是目前最成熟、最易上手的选项之一。建议从官方示例仓库 crewAI-examples 挑一个最接近你需求的案例跑起来，15 分钟就能感受到它的威力。

📥 下载地址

🔗 官方网站: https://crewai.com
🔗 GitHub 仓库: https://github.com/crewAIInc/crewAI （Star 53.7K+）
🔗 官方文档: https://docs.crewai.com
🔗 在线试用: https://app.crewai.com （免费试用 Control Plane）
🔗 示例仓库: crewAI-examples
🔗 社区论坛: https://community.crewai.com

本文由 AI 辅助撰写，技术细节请参考官方文档。如有错误，欢迎在评论区指正。

2026年6月17日

LangChain — 135K+ Stars 的 AI 智能体工程平台，构建 LLM 应用的首选框架
🔗 LangChain

The Agent Engineering Platform — 135K+ Stars

📦 langchain-ai/langchain · MIT License · Python

📝 项目简介

LangChain 是一个智能体工程平台，为构建 LLM 驱动的应用提供标准化接口与丰富的第三方集成，帮助开发者快速构建、调试和部署生产级 AI 智能体应用。

135K+

GitHub Stars

279K+

依赖项目

600+

集成组件

v1.x

最新稳定版
⚙️ 安装要求与过程

环境要求

Python ≥ 3.9

推荐使用 uv 作为包管理工具

需要有效的 LLM API Key（OpenAI / Anthropic / 国内模型等）

# 快速安装

# 使用 uv 安装（推荐） uv add langchain # 使用 pip 安装 pip install langchain # 安装特定模型集成 pip install langchain-openai pip install langchain-anthropic

# 快速开始 — Hello World

from langchain.chat_models import init_chat_model # 初始化模型（支持任意提供商） model = init_chat_model("openai:gpt-4o") # model = init_chat_model("anthropic:claude-sonnet-4-20250514") result = model.invoke("用一句话解释什么是 LangChain") print(result.content)
⭐ 核心功能

1

标准化模型接口

为模型、嵌入、向量存储等核心组件提供统一接口，切换底层模型无需重构业务代码，彻底告别厂商锁定。

2

丰富的第三方集成

内置 600+ 集成组件，覆盖主流 LLM 提供商、向量数据库、检索工具、API 工具等，即插即用。

3

灵活的抽象层次

从高层级链式调用（快速原型）到底层组件细粒度控制（复杂生产场景），支持不同复杂度的应用需求。

4

LangGraph 智能体编排

配套 LangGraph 提供低层级智能体编排框架，支持复杂可控的多智能体工作流，适合生产级应用场景。

5

LangSmith 可观测性

无缝对接 LangSmith 进行智能体评估、调试与监控，支持生产环境部署与长时状态工作流扩缩容。

🚀 典型使用场景

场景一：RAG（检索增强生成）问答系统

将企业知识库文档向量化存储，结合 LangChain 的 Retriever 组件与 LLM，实现基于私有数据的精准问答。支持对接 Chroma、Pinecone、FAISS 等主流向量数据库，是构建企业 AI 知识助手的首选方案。

场景二：智能客服 / AI Agent 工作流

利用 LangChain 的 Agent 与 Tools 机制，让 LLM 自主调用搜索引擎、数据库查询、API 接口等工具，构建能完成多步骤复杂任务的智能助手。结合 LangGraph 可实现包含人工审批节点的复杂业务流程自动化。

场景三：结构化数据抽取与处理

利用 LangChain 的 OutputParser 与 Structured Output 功能，从非结构化文本中抽取结构化信息（如提取简历关键信息、解析合同要素），并输出为 JSON / Pydantic 模型，方便后续业务系统处理。

💡 推荐理由

LangChain 是 AI 应用开发领域当之无愧的”基础设施”。如果你正在构建任何与 LLM 相关的应用，LangChain 几乎是你绕不开的选择。

它的核心价值在于标准化：无论你用 OpenAI、Anthropic 还是国产模型，接口一致；无论你用 PostgreSQL、Pinecone 还是 FAISS 存向量，接口一致。这种抽象让你可以随时切换底层技术，而不用重写应用逻辑。

2026 年 LangChain 已迭代至 v1.x 稳定版，配套生态（LangGraph 智能体编排、LangSmith 可观测性、Deep Agents 低代码智能体）日趋完善，从快速原型到生产部署的全流程都有成熟方案支撑。

当然，LangChain 的抽象层较厚，对于追求极致性能的场景可能需要权衡。但对于绝大多数 AI 应用开发者而言，它依然是目前最成熟、社区最活跃、学习资源最丰富的不二之选。

📥 下载地址

🐙

GitHub 仓库

github.com/langchain-ai/langchain

📚

官方文档

docs.langchain.com

🎓

LangChain Academy 免费课程

academy.langchain.com

📦

PyPI 安装包

pypi.org/project/langchain

⋯⋯

AI
开源
LangChain
LLM
AI Agent
2026年6月17日

标签： LLM

🤯 LobeChat

📌 项目简介

1 安装要求和过程

环境要求

快速安装（桌面版）

Docker 部署（自托管推荐）

2 核心功能

🤖 多模型统一接入

🔌 插件市场 + MCP 集成

📚 RAG 知识库

⚡ 多模型对比 + 语音对话

🏠 完全自托管 + 隐私优先

3 典型使用场景

🎯 场景一：多模型对比选型

📚 场景二：企业知识库问答

💻 场景三：开发者日常助手

💡 推荐理由

📥 下载地址

📦 项目简介

⚙️ 安装要求和过程

环境要求

快速安装

✨ 核心功能

🤖 1. 多智能体协作

🧠 2. 500+ 模型支持

💻 3. 多IDE支持

🔧 4. MCP 市场

🚀 5. 自主模式 (CI/CD)

🎯 典型使用场景

场景一：日常编程助手

场景二：代码审查自动化

场景三：CI/CD 集成

💡 推荐理由

🖼️ 项目截图

📥 下载地址

🌐 官方网站

💻 GitHub 仓库

📥 VS Code 扩展

🔌 JetBrains 插件

📚 官方文档

💬 社区

📦 项目简介

⚙️ 安装要求和过程

环境要求

快速安装 — 桌面版（最简单）

Docker 部署（推荐服务器）

✨ 核心功能

🤖 无代码 AI 代理构建器

🧠 动态模型路由 + 智能记忆

📚 强大的 RAG 文档处理

👥 多用户与权限管理

🔌 MCP 兼容 + 完整开发者 API

🎯 典型使用场景

① 私有知识库问答

② 个人 AI 研究助手

③ 网站智能客服嵌入

💡 推荐理由

📥 下载地址

🛠️ 技术栈

🔥 Firecrawl

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装（Python SDK）

快速安装（Node.js SDK）

MCP 集成（AI Agent 一键接入）

自托管部署（Docker）

⚡ 核心功能

🔍 Search（智能搜索）

🕷️ Scrape（智能爬取）

🤖 Agent（智能代理）

🗺️ Crawl + Map（全站爬取与 URL 发现）

🖱️ Interact（交互式爬取）

💡 典型使用场景

场景一：AI Agent 实时联网搜索

场景二：RAG 应用网页数据注入

场景三：竞品价格监控与数据分析

❤️ 推荐理由

📊 项目数据

1
安装要求和过程

2
核心功能

3
典型使用场景