标签: LLM

  • LobeChat —— 72K+ Stars 开源 AI 聊天框架,比 ChatGPT 更自由的选择

    LobeChat —— 72K+ Stars 开源 AI 聊天框架,比 ChatGPT 更自由的选择

    🤯 LobeChat

    开源 AI 聊天框架,72K+ Stars,比 ChatGPT 更自由的 AI 客户端

    ⭐ GitHub 72K+ Stars  | 
    🌐 在线体验  | 
    MIT 开源

    📌 项目简介

    LobeChat 是 LobeHub 团队开发的开源 AI 聊天框架,也是 GitHub 上 Star 数最多的开源 AI 客户端之一(72K+ Stars)。它支持 Web 和桌面两种形式,在一个界面里同时接入 GPT、Claude、Gemini、DeepSeek、Ollama 等 80+ 模型,还内置插件市场、RAG 知识库、多模型对比等实用功能。最重要的是——完全免费开源,数据可完全本地化

    72K+
    GitHub Stars

    🤖
    80+
    支持模型

    🔌
    40+
    内置插件

    💻
    3 平台
    Web/桌面/Docker

    1
    安装要求和过程

    环境要求

    部署方式 环境要求
    Web 版 浏览器访问,无需安装
    桌面版 Windows/macOS/Linux,下载安装包
    Docker Docker + Docker Compose
    本地开发 Node.js 18+, pnpm, Git

    快速安装(桌面版)

    # 1. 从 GitHub Releases 下载对应平台安装包

    https://github.com/lobehub/lobe-chat/releases

    # Windows: LobeChat-win.exe

    # macOS: LobeChat-mac.dmg

    # Linux: LobeChat-linux.AppImage

    Docker 部署(自托管推荐)

    # 拉取镜像并启动

    docker run -d -p 3210:3210 \

    -e OPENAI_API_KEY=your-key \

    –name lobechat lobehub/lobe-chat

    2
    核心功能

    🤖 多模型统一接入

    支持 OpenAI、Claude、Gemini、DeepSeek、Kimi、智谱、Ollama 等 80+ 模型,一个界面随意切换。自定义 Base URL,可接入任何兼容 OpenAI 协议的 API。

    🔌 插件市场 + MCP 集成

    内置 40+ 插件,联网搜索、代码执行、图片生成开箱即用。支持 MCP 协议,可一键接入 AI Agent 工具链,扩展能力无上限。

    📚 RAG 知识库

    上传 PDF、Word、网页,自动建立向量索引。基于个人知识库问答,适合企业文档、技术手册、合同条款等场景。本地向量数据库,数据不出门。

    ⚡ 多模型对比 + 语音对话

    同一问题多模型同时回答,横向对比 Claude/GPT/Gemini 差异。内置 TTS/STT,支持语音对话。还有「助手市场」,几百个预设专业助手直接可用。

    🏠 完全自托管 + 隐私优先

    Docker 一键部署,数据全留本地。MIT 开源,可自由修改分发。对比 ChatGPT Plus $20/月,LobeChat 客户端免费,只需按 API 用量付费。

    3
    典型使用场景

    🎯 场景一:多模型对比选型

    在模型选型阶段,同一个 Prompt 同时发给 Claude Opus、GPT-5.4、Gemini 2.5 Pro,直接对比输出质量,不再靠猜。LobeChat 的多模型对比功能让选型决策有数据支撑。

    📚 场景二:企业知识库问答

    将公司技术文档、产品手册、合同模板上传到 LobeChat 知识库,基于 RAG 检索增强生成,精准回答内部问题。支持 Docker 私有化部署,数据完全不出企业内网。

    💻 场景三:开发者日常助手

    配置 DeepSeek V3(中文代码能力强,价格低)+ Claude Sonnet(复杂逻辑)+ GPT-5.4(多模态),不同任务自动切换最合适模型。助手市场里的「代码审查」「SQL 优化」等预设助手,开箱即用。

    💡 推荐理由

    我用过不少 AI 客户端,LobeChat 是最顺手的选择之一,原因如下:

    • 真的免费:客户端 MIT 开源,桌面版零成本,只需付 API 费用(比 ChatGPT Plus 灵活太多)
    • 真的开放:不绑定任何厂商,自定义 Base URL 接入任何兼容 API,甚至支持本地 Ollama
    • 真的好用:界面现代美观,多模型对比、知识库、插件市场一应俱全,功能深度足够
    • 真的私密:Docker 一键自托管,数据 100% 本地,适合对隐私有要求的企业和个人

    如果你同时用多个 AI 模型,或者不想把数据交给 OpenAI,LobeChat 是目前最好的开源替代方案

    📥 下载地址

    许可协议:MIT License  |  语言:TypeScript  |  支持平台:Web / Windows / macOS / Linux / Docker

    ⚠️ 本文基于公开资料整理,项目数据截至 2026 年 6 月。LobeChat 与 LobeHub 为同一团队产品,功能持续迭代中。

  • Kilo Code – 22K+ Stars,开源AI编程智能体,支持VS Code/JetBrains/CLI三大平台

    Kilo Code – 22K+ Stars,开源AI编程智能体,支持VS Code/JetBrains/CLI三大平台

    Kilo Code Logo

    Kilo Code – 开源AI编程智能体

    📦 项目简介

    Kilo Code 是一款开源AI编程智能体,支持在 VS Code、JetBrains 和 CLI 中使用。它提供500+模型选择、多智能体协作、MCP市场扩展等强大功能,采用开源定价模式——你只需支付模型提供商的价格,零加价。

    22K+
    GitHub Stars
    500+
    AI模型
    3
    IDE支持
    MIT
    开源协议

    ⚙️ 安装要求和过程

    环境要求

    • VS Code: 1.80.0+
    • JetBrains: IntelliJ IDEA, PyCharm, WebStorm 等 (2023.2+)
    • CLI: Node.js 18+ (for npm install) 或直接使用二进制文件
    • 网络: 需要访问AI模型API(支持500+模型)

    快速安装

    方式一:VS Code 扩展

    1. 在 VS Code 扩展市场搜索 “Kilo Code”
    2. 点击安装
    3. 创建账户后即可使用(支持500+模型,包括GPT-5.5、Claude Opus 4.7、Gemini 3.1等)

    方式二:命令行工具(CLI)

    # npm 安装
    npm install -g @kilocode/cli
    
    # curl 一键安装
    curl -fsSL https://kilo.ai/cli/install | bash
    
    # pnpm
    pnpm add -g @kilocode/cli
    
    # bun
    bun add -g @kilocode/cli
    
    # Homebrew (macOS / Linux)
    brew install Kilo-Org/tap/kilo
    
    # Arch Linux (AUR)
    paru -S kilo-bin

    安装后,在项目目录中运行 kilo 即可启动。

    方式三:JetBrains 插件

    1. 在 JetBrains Marketplace 搜索 “Kilo Code”
    2. 或在 IDE 中打开 Settings → Plugins 搜索安装

    ✨ 核心功能

    🤖 1. 多智能体协作

    Kilo 内置多个专业智能体,可根据任务切换:

    • Code: 默认智能体,从自然语言生成和编辑代码
    • Plan: 在设计阶段先规划架构和实现方案,再写代码
    • Ask: 回答代码库相关问题,不修改文件
    • Debug: 排查和追踪问题
    • Review: 审查代码变更,发现性能、安全、风格和测试覆盖问题

    你还可以创建自定义智能体,满足特定需求。

    🧠 2. 500+ 模型支持

    支持中途切换模型,根据任务需求匹配延迟、成本和推理能力。支持的顶级模型包括:

    • GPT-5.5
    • Claude Opus 4.7
    • Claude Sonnet 4.6
    • Gemini 3.1 Pro Preview

    采用开源定价,支付模型提供商的价格,零加价,且不需要API密钥即可开始。

    💻 3. 多IDE支持

    Kilo Code 真正实现了全场景覆盖:

    • VS Code: 原生扩展,完整功能支持
    • JetBrains: 原生插件,支持 IntelliJ IDEA、PyCharm、WebStorm 等
    • CLI: 命令行工具,适合远程服务器和自动化场景
    • Cloud Agent: 网页版,无需本地机器

    🔧 4. MCP 市场

    通过 MCP (Model Context Protocol) 市场,可以发现和接入各种MCP服务器,扩展智能体的能力边界。让AI智能体能够连接数据库、API、文件系统等外部工具。

    🚀 5. 自主模式 (CI/CD)

    支持在 CI/CD 管道中运行自主模式:

    kilo run --auto "run tests and fix any failures"

    --auto 参数禁用所有权限提示,让智能体在无人工干预的情况下执行操作(仅在可信环境中使用)。

    🎯 典型使用场景

    场景一:日常编程助手

    在 VS Code 或 JetBrains 中,通过自然语言描述需求,Kilo Code 自动生成代码。支持多文件编辑、代码重构、单元测试生成等任务。内置的行内自动补全功能提供”幽灵文本”建议,按Tab键即可接受。

    场景二:代码审查自动化

    在 Pull Request 中设置自动AI代码审查。Kilo Code 会检查性能问题、安全漏洞、代码风格不一致和测试覆盖率不足等问题,并直接在PR中给出反馈。

    场景三:CI/CD 集成

    在自动化管道中使用 kilo run --auto 命令,让AI智能体自动运行测试、修复失败、更新文档等。特别适合需要持续集成的大型项目。

    💡 推荐理由

    • 真正开源:MIT协议,代码完全开放,可自由使用、修改和分发(包括商业用途)
    • 公平定价:零加价模式,你只需支付模型提供商的价格,不像其他AI编程工具那样收取高额订阅费
    • 生态完整:支持VS Code、JetBrains、CLI三大平台,还提供Cloud Agent和代码审查服务
    • 灵活扩展:MCP市场让智能体能力可无限扩展,自定义智能体满足个性化需求
    • 活跃维护:22K+ Stars,2.7K+ Forks,801个开放Issue(说明社区活跃),持续更新中

    如果你在寻找一个不绑定特定模型、不收取高额费用、真正开源可定制的AI编程助手,Kilo Code 是目前的最佳选择。

    🖼️ 项目截图

    Kilo in VS Code and CLI

    Kilo Code 在 VS Code 和 CLI 中的运行效果

    📥 下载地址

    🌐 官方网站

    https://kilo.ai/

    💻 GitHub 仓库

    Kilo-Org/kilocode

    ⭐ 22,150+ Stars | 🍴 2,706+ Forks

    📥 VS Code 扩展

    VS Code Marketplace

    🔌 JetBrains 插件

    JetBrains Marketplace

    📚 官方文档

    https://kilo.ai/docs

    💬 社区

    Discord | X (Twitter) | Reddit


    📌 本文由自动化任务采集整理,数据截至 2026年6月19日

    🔗 项目GitHub: https://github.com/Kilo-Org/kilocode

  • AnythingLLM — 61.7K Stars,全栈本地优先AI应用,私有知识库与AI代理一站式解决方案

    AnythingLLM

    Mintplex Labs 官方 Logo

    📦 项目简介

    AnythingLLM 是一款全功能本地优先 AI 应用,集 RAG(检索增强生成)、AI 代理、无代码代理构建器于一体。口号是「停止租用你的智能,用 AnythingLLM 拥有它」。支持连接本地或云端 LLM,导入文档后即可快速开始对话,内置代理、多用户支持、向量数据库和文档管道,无需额外配置。

    ⭐ 61.7K+ Stars
    🍴 6.74K+ Forks
    📜 MIT 许可
    🏢 Mintplex Labs

    ⚙️ 安装要求和过程

    环境要求

    • Docker(推荐,最简单方式)
    • 或:Node.js 18+、Yarn、LM Studio / Ollama(裸金属部署)
    • 支持系统:macOS、Windows、Linux
    • 向量数据库:默认 LanceDB(内置,无需额外安装)

    快速安装 — 桌面版(最简单)

    # 访问官网下载对应系统安装包

    https://anythingllm.com/download

    # macOS

    下载 .dmg → 拖入 Applications

    # Windows

    下载 .exe → 一路 Next

    # Linux

    下载 .AppImage → chmod +x → 运行

    Docker 部署(推荐服务器)

    # 拉取最新镜像

    docker pull mintplexlabs/anythingllm

    # 运行容器

    docker run -p 3001:3001 mintplexlabs/anythingllm

    # 浏览器访问

    http://localhost:3001

    ✨ 核心功能

    🤖 无代码 AI 代理构建器

    可视化构建 AI 代理,支持网页浏览、RAG 文档查询、API 调用等技能,无需写代码即可打造专属 AI 助手。

    🧠 动态模型路由 + 智能记忆

    根据自定义规则自动将对话路由到最合适的模型和提供商;AI 可记住你和工作区的重要信息,实现跨会话持久化上下文。

    📚 强大的 RAG 文档处理

    支持 PDF、TXT、DOCX、CSV 等多种格式,内置针对大型文档集的优化,比其他聊天 UI 成本更低、响应更快。

    👥 多用户与权限管理

    Docker 版本支持多用户实例与权限管控,适合团队协作;不会泄露实例安全或知识产权,企业级安全设计。

    🔌 MCP 兼容 + 完整开发者 API

    支持 Model Context Protocol (MCP),可无缝接入外部工具;提供完整 REST API,支持自定义集成与二次开发。

    🎯 典型使用场景

    ① 私有知识库问答

    将公司文档、技术手册、研究报告导入 AnythingLLM,打造私有化部署的 ChatGPT。员工可直接提问,AI 基于内部文档给出准确答案,数据不出企业内网。

    ② 个人 AI 研究助手

    结合本地 Ollama 运行开源模型,导入论文 PDF 和研究笔记,AI 代理可自动联网搜索、整理资料、定时执行研究任务,是研究人员的全能助手。

    ③ 网站智能客服嵌入

    利用可嵌入聊天组件(Docker 版),将定制化的 AI 客服挂到企业官网,基于私有知识库自动回答客户问题,无需人工值守。

    💡 推荐理由

    作为一款本地优先的全栈 AI 应用,AnythingLLM 最大的优势在于开箱即用——下载桌面版,连接本地 Ollama,导入文档,三步搞定私有知识库。无需 Docker、无需配置向量数据库、无需写代码。

    对比同类产品:Dify 偏向可视化工作流编排,AnythingLLM 更聚焦于个人/小团队的文档对话场景,界面更简洁,部署更轻松。MIT 许可意味着你可以自由修改和分发,真正「拥有你的智能」。

    特别推荐给:重视数据隐私的开发者、需要内部知识库的中小团队、以及想体验本地 LLM + RAG 完整链路的 AI 爱好者。

    📥 下载地址

    支持 macOS / Windows / Linux | Docker 镜像可用 | 自托管部署指南完备

    🛠️ 技术栈

    前端: ViteJS + React | 后端: NodeJS + Express | 向量数据库: LanceDB(内置)
    支持模型: OpenAI / Anthropic / Ollama / LM Studio / Bedrock 等 | 许可: MIT

  • Firecrawl — 134K+ Stars,为 AI Agent 量身打造的网页数据 API,搜索/爬取/交互一体化

    Firecrawl — 134K+ Stars,为 AI Agent 量身打造的网页数据 API,搜索/爬取/交互一体化

    Firecrawl Logo

    🔥 Firecrawl

    The API to search, scrape, and interact with the web at scale

    ⭐ 134K+ Stars
    📦 TypeScript
    📜 AGPL-3.0

    📌 项目简介

    Firecrawl 是专为 AI Agent 设计的网页数据 API,能将任意网页(含 JS 渲染)转换成 AI 友好的 Markdown/JSON 格式。它覆盖 96% 的网页,P95 延迟仅 3.4 秒,原生支持 MCP 协议,是 AI 应用获取实时网页数据的首选基础设施。

    ⚙️ 安装要求和过程

    环境要求

    Python
    3.8+ (SDK 支持)
    Node.js
    16+ (SDK 支持)
    API Key
    firecrawl.dev 注册
    自托管
    Docker / Redis / Playwright

    快速安装(Python SDK)

    # 安装 Python SDK
    pip install firecrawl-py
    
    # 基础使用示例
    from firecrawl import Firecrawl
    
    app = Firecrawl(api_key="fc-YOUR_API_KEY")
    
    # 搜索网页
    result = app.search("Firecrawl tutorial", limit=5)
    
    # 爬取单个 URL
    result = app.scrape('https://example.com', formats=["markdown"])
    print(result.markdown)

    快速安装(Node.js SDK)

    # 安装 Node.js SDK
    npm install firecrawl
    
    # 基础使用示例
    import { Firecrawl } from 'firecrawl';
    
    const app = new Firecrawl({ apiKey: 'fc-YOUR_API_KEY' });
    
    const result = await app.scrape('https://example.com', {
      formats: ['markdown']
    });
    console.log(result.markdown);

    MCP 集成(AI Agent 一键接入)

    # 一键安装 MCP Skill(支持 Claude Code、OpenClaw 等)
    npx -y firecrawl-cli@latest init --all --browser
    
    # 或手动配置 MCP 客户端
    {
      "mcpServers": {
        "firecrawl-mcp": {
          "command": "npx",
          "args": ["-y", "firecrawl-mcp"],
          "env": {
            "FIRECRAWL_API_KEY": "fc-YOUR_API_KEY"
          }
        }
      }
    }

    自托管部署(Docker)

    # 克隆仓库
    git clone https://github.com/firecrawl/firecrawl.git
    cd firecrawl
    
    # 启动自托管服务(需要 Docker、Redis、Playwright)
    docker-compose up -d
    
    # 访问本地服务
    # API: http://localhost:3002
    # Playground: http://localhost:3002/playground

    核心功能

    🔍 Search(智能搜索)

    全网搜索并返回结果页的完整 Markdown 内容,不再只是返回标题和 URL。支持关键词搜索、URL 搜索、智能过滤,返回结果可直接供 AI Agent 使用,无需二次处理。

    🕷️ Scrape(智能爬取)

    将任意 URL 转换为 Markdown、HTML、截图或结构化 JSON。自动处理 JS 渲染、代理轮换、速率限制、反爬虫策略,覆盖 96% 的网页,P95 延迟仅 3.4 秒。

    🤖 Agent(智能代理)

    无需指定 URL,用自然语言描述需求即可自动完成数据收集。支持结构化输出(Pydantic Schema),可自动提取创始人信息、产品定价、竞品对比等复杂数据,返回类型安全的 Python 对象。

    🗺️ Crawl + Map(全站爬取与 URL 发现)

    Crawl 支持单次请求爬取整个网站的所有页面内容;Map 快速发现网站所有 URL,支持关键词筛选。支持异步批量爬取数千个 URL,适合大规模数据采集场景。

    🖱️ Interact(交互式爬取)

    爬取页面后可执行点击、滚动、输入、等待、按键等交互操作,应对需要登录、搜索、翻页等动态场景。AI 提示驱动,无需编写复杂的选择器代码。

    💡 典型使用场景

    场景一:AI Agent 实时联网搜索

    通过 Firecrawl 的 Search API,AI Agent 可以实时搜索网页并获取完整内容,不再受训练数据时效限制。结合 MCP 协议,Claude Code、OpenClaw 等 AI 工具可以一键调用 Firecrawl 获取最新信息。

    # AI Agent 使用 Firecrawl 搜索最新信息
    result = app.search(
        query="2026年 AI 开源项目趋势",
        limit=10,
        scrape_options={"formats": ["markdown"]}
    )
    # result 包含搜索结果 + 每个结果的完整 Markdown 内容

    场景二:RAG 应用网页数据注入

    RAG(检索增强生成)应用需要大量外部数据,Firecrawl 可以批量爬取指定网站内容并转换为 Markdown,直接注入向量数据库。支持智能等待、JS 渲染、反爬虫绕过,大幅提升 RAG 应用的数据质量。

    # 批量爬取文档网站,用于 RAG
    docs = app.crawl(
        url="https://docs.example.com",
        limit=1000,
        scrape_options={"formats": ["markdown", "html"]}
    )
    # 将 docs 存入向量数据库(如 Milvus、Pinecone)

    场景三:竞品价格监控与数据分析

    使用 Agent API 自动收集竞品定价、功能对比、用户评价等数据,无需手动指定 URL,只需用自然语言描述需求。支持结构化输出,直接返回类型安全的 JSON 数据,可接入自动化分析流程。

    # 使用 Agent 自动收集竞品定价
    result = app.agent(
        prompt="Compare pricing of Firecrawl, ScrapingBee, and Apify",
        schema=PricingComparisonSchema
    )
    print(result.data)  # 结构化 JSON 输出

    ❤️ 推荐理由

    在 AI Agent 和 RAG 应用爆发式增长的今天,如何获取实时、高质量的网页数据成为了一个核心痛点。传统爬虫工具要么太底层(需要自己处理代理、JS 渲染、反爬虫),要么不够 AI 友好(返回脏 HTML,需要额外清洗)。

    Firecrawl 完美解决了这个问题:

    • 🌟 AI 原生设计:输出直接是 Markdown/JSON,无需额外清洗,降低 token 消耗
    • 🌟 高可靠性:覆盖 96% 的网页,自动处理 JS 渲染、代理轮换、速率限制
    • 🌟 高速度:百万级页面爬取 P95 延迟仅 3.4 秒,适合实时 AI 应用
    • 🌟 MCP 原生支持:一键接入主流 AI Agent 工具,无需复杂配置
    • 🌟 多语言 SDK:Python、Node.js、Java、Rust、Elixir 全覆盖
    • 🌟 开源可自托管:AGPL-3.0 许可,数据隐私完全自主可控

    💡 个人使用心得:Firecrawl 已成为我构建 AI Agent 的标配工具。以前需要组合使用 requests + BeautifulSoup + Playwright + 代理池才能完成的任务,现在一行代码就能解决。特别是它的 Agent API,用自然语言描述需求即可自动收集数据,大大降低了数据采集的门槛。如果你正在构建需要实时网页数据的 AI 应用,Firecrawl 绝对值得一试!

    📊 项目数据

    134K+
    GitHub Stars

    🍴
    7.8K+
    Forks

    👥
    375+
    Contributors

    📦
    5+
    官方 SDK

    📥 下载地址

    支持 Python、Node.js、Java、Rust、Elixir 等多语言 SDK • 开源 AGPL-3.0 许可 • 支持自托管部署

  • RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    📌 项目简介

    RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,由 InfiniFlow 团队(Milvus 向量数据库原班人马)开发,将前沿 RAG 技术与 Agent 能力深度融合,为大语言模型提供卓越的上下文理解层。

    RAGFlow 架构图

    RAGFlow 系统架构概览


    ⚙️ 安装要求和过程

    环境要求(自托管)

    配置项 最低要求
    CPU ≥ 4 核
    内存 ≥ 16 GB
    磁盘 ≥ 50 GB
    Docker ≥ 24.0.0
    Docker Compose ≥ v2.26.1

    🐳 Docker 快速部署(推荐)

    # 1. 调整系统内核参数(避免 Elasticsearch 启动失败)
    sudo sysctl -w vm.max_map_count=262144
    
    # 2. 克隆项目代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/docker
    
    # 3. 切换到稳定版本
    git checkout v0.26.1
    
    # 4. 启动服务(仅CPU)
    docker compose -f docker-compose.yml up -d
    
    # (可选)如需GPU加速,先执行:
    # sed -i '1i DEVICE=gpu' .env
    # docker compose -f docker-compose.yml up -d
    
    # 5. 验证服务状态
    docker logs -f docker-ragflow-cpu-1

    启动成功后,浏览器访问服务器 IP 地址(默认 HTTP 端口 80)即可进入 RAGFlow 登录页面。

    💻 源码启动(开发用途)

    # 安装依赖工具
    pipx install uv pre-commit
    
    # 克隆代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/
    uv sync --python 3.13
    uv run python3 download_deps.py
    
    # 启动基础依赖服务
    docker compose -f docker/docker-compose-base.yml up -d
    
    # 启动后端
    source .venv/bin/activate
    export PYTHONPATH=$(pwd)
    bash docker/launch_backend_service.sh
    
    # 启动前端(新终端)
    cd web && npm install && npm run dev

    ✨ 核心功能

    1. 深度文档理解,输入即精准

    基于先进的文档解析技术,可从格式复杂的非结构化数据(PDF、Word、PPT、Excel、扫描件、图片等)中精准提取知识,真正做到”Quality in, Quality out”。

    2. 可视化模板化分块,答案可追溯

    分块逻辑智能可解释,提供大量预置分块模板;支持文本分块可视化,允许人工干预调整;最终答案附带可追溯的引用来源,有效降低 LLM 幻觉问题。

    3. 多源数据兼容,异构数据统一管理

    支持解析 Word、PPT、Excel、TXT、图片、扫描件、结构化数据、网页等各类异构数据源,一站式完成企业知识库构建。

    4. Agentic 工作流 + MCP 协议支持

    内置丰富 Agent 能力,支持 Agentic 工作流编排、MCP 协议接入;内置 Python/JavaScript 代码执行器组件;支持 AI Agent 记忆功能。

    5. 高精度混合检索,多路召回+融合重排

    结合向量搜索、BM25 关键词搜索和自定义评分机制,配合先进重排序算法,提供无与伦比的回答准确性和上下文相关性。


    🚀 典型使用场景

    📈 股权投资研究

    自动化收集公司数据,整合财务指标与研究洞察。通过自主规划和多智能体编排,实现高级股票分析。自动从用户查询中识别股票代码,聚合外部权威来源和内部记录中的洞察,最终结合定性洞察和财务指标生成完整投资报告。

    ⚖️ 法律判例分析

    通过检查公共来源和内部数据集中的类似法律案例,提供结构化判例分析。自动提取关键属性(如司法管辖区和法律问题)以制定搜索查询并检索可比较的先例,最终整合成结构化分析报告。

    🏭 制造业维护支持

    通过从内部手册中准确获取内容,提供结构化维护指导(外部参考作为补充支持)。输入任务后,工作流首先验证输入充分性,然后从内部维护手册中提取标准协议,整合补充外部技术数据,生成清晰的执行指令。


    💡 推荐理由

    RAGFlow 是我用过的最”务实”的 RAG 产品,没有之一。

    第一,它真正解决了 RAG 的底层痛点——文档解析。很多 RAG 框架只关注向量检索和生成,却忽略了最关键的”输入质量”问题。RAGFlow 的 DeepDoc 技术能精准解析复杂格式的 PDF、扫描件,真正做到”Garbage in, garbage out”的反面——Quality in, quality out

    第二,可视化分块 + 可追溯引用,让 AI 回答有章可循。这是企业场景的刚需。你可以清楚看到每个答案是从哪个文档的哪个位置来的,大幅降低了 LLM 幻觉带来的风险。

    第三,Agentic 能力的融合非常自然。不是简单地在 RAG 上面套一个 Agent 外壳,而是将 Agent 能力(MCP 协议、代码执行、记忆管理)深度集成到 RAG 工作流中,真正实现了”RAG + Agent”的一体化编排。

    最后,InfiniFlow 团队是 Milvus 的原班人马,技术底蕴深厚。83K+ Stars 和 9600+ Forks 的社区活跃度也证明了产品的成熟度。如果你正在构建企业级知识库或 RAG 应用,RAGFlow 绝对值得一试。


    📥 下载地址

    🌐 官方网站:https://ragflow.io

    📦 GitHub 开源地址:https://github.com/infiniflow/ragflow ⭐ 83K+ Stars

    ☁️ 云服务(快速体验):https://cloud.ragflow.io

    📚 官方文档:https://ragflow.io/docs/dev/

    💡 小贴士:RAGFlow 支持飞书、Discord、Telegram、Line 等多聊天渠道接入(2026年6月更新),可快速将企业知识库接入到日常沟通工具中!

  • claude-mem —— 82.9K+ Stars,让 AI 智能体拥有跨会话持久记忆的开源工具

    🔥 GitHub 热门 AI 开源项目 · 第 21 期

    📌 项目简介

    claude-mem 是为所有 AI 智能体提供跨会话持久化记忆的开源工具。它能自动捕获 AI 代理在会话中的所有操作行为,通过 AI 压缩生成结构化记忆条目,并在后续会话中自动注入相关历史上下文。支持 Claude Code、OpenClaw、Codex、Gemini、Copilot 等主流 AI 编程工具,让无状态的 AI 代理拥有真正的”长期记忆”。

    🖼️ 项目预览

    claude-mem 项目预览
    claude-mem – AI 智能体跨会话记忆引擎

    ⚙️ 安装要求与过程

    环境要求

    • Node.js ≥ 18.0.0(核心运行环境)
    • ✅ 支持的操作系统:macOSLinuxWindows(WSL2 推荐)
    • ✅ 已安装任意支持的 AI 工具:Claude Code / OpenClaw / Codex / Gemini CLI / Copilot 等
    • ✅ 网络畅通(需访问 AI 供应商 API)

    快速安装

    # 交互式安装(推荐)
    npx claude-mem install
    
    # 指定参数安装
    npx claude-mem install --provider gemini --model gemini-pro
    
    # 安装后修复(如遇问题)
    npx claude-mem repair
    
    # 查看版本
    npx claude-mem --version

    Server Beta 模式(团队协作)

    # 配置环境变量
    export CLAUDE_MEM_RUNTIME=server-beta
    export CLAUDE_MEM_SERVER_DATABASE_URL=postgres://user:pass@localhost:5432/claudemem
    
    # 启动 API 服务
    claude-mem server start
    
    # 启动生成 Worker
    claude-mem server worker start

    ✨ 核心功能

    1. 全自动上下文捕获与注入

    无需任何手动标注,claude-mem 自动捕获会话中的所有工具调用、文件读写、代码编辑等行为,通过 AI 压缩生成结构化记忆条目。新会话启动时,自动注入最相关的历史上下文,让 AI 代理”记得”之前做过的工作。

    2. 多工具统一支持

    原生支持 Claude CodeOpenClawCodexGeminiHermesGitHub CopilotOpenCode 等主流 AI 编程工具。同时支持通过 MCP 协议接入 Cursor、Windsurf 等更多 IDE,真正实现”一次安装,处处可用”。

    3. 可视化记忆管理

    内置 Web 查看器(默认 localhost),可实时查看 AI 代理的操作记录、生成的记忆条目、会话统计等信息。支持按项目筛选记忆内容,可手动触发项目全量学习(/learn-codebase),帮助 AI 快速理解代码库。

    4. 企业级多租户支持(Server Beta)

    支持基于 Postgres 的独立服务端部署,无需依赖本地 Worker 进程。提供团队/项目级别的权限隔离、API Key 管理、操作审计链路,支持 Docker 容器化部署和水平扩展,满足企业协作场景需求。

    5. 成本优化遥测

    采用 5 分钟滚动窗口聚合遥测事件,可降低 99.9% 的 PostHog 使用成本。支持历史遥测数据匿名化回填,AI 生成任务幂等性设计避免重复计费,用户可自主选择是否开启遥测。

    💡 典型使用场景

    场景一:多日开发项目的上下文延续

    你正在用 Claude Code 开发一个复杂功能,工作日结束时会话上下文已达到上限。第二天开始新会话时,claude-mem 自动注入昨天的设计决策、修改的文件、遇到的问题等关键上下文,让你无需重新解释项目背景,直接继续开发。

    场景二:团队协作中的知识共享

    在团队项目中,开发者 A 用 Claude Code 完成了某个模块的开发。通过 claude-mem 的 Server Beta 模式,团队成员 B 在新会话中也能获取到 A 的开发上下文,包括设计思路、踩过的坑、未完成的 TODO 等,实现 AI 辅助开发的”知识传承”。

    场景三:跨工具开发体验统一

    你白天用 Claude Code 开发,晚上用 Gemini CLI 做代码 Review。claude-mem 作为统一的记忆层,让不同 AI 工具之间共享上下文,无论在哪个工具中操作,AI 都能”记得”你之前做过什么。

    🌟 推荐理由

    AI 编程工具的最大痛点之一就是会话结束后上下文丢失——你花了半小时给 AI 解释项目背景,新会话又要重新来一遍。claude-mem 从根本上解决了这个问题。

    我特别欣赏它的零摩擦设计:安装后无需任何手动操作,AI 代理的所有行为都会被自动捕获和压缩。当你开始新会话时,相关记忆会自动注入,就像 AI “自然记得”之前的工作一样。

    另一个亮点是多工具统一支持。如果你像我一样同时使用多个 AI 编程工具,claude-mem 提供了一个统一的记忆层,让不同工具之间可以共享上下文。这比每个工具各自维护记忆要高效得多。

    项目的活跃度也很高,截至目前已有 82,991 个 Stars,最近更新在 2026 年 6 月,说明维护团队在持续迭代。Apache-2.0 许可也让它可以放心用于商业项目。


    📥 下载地址

    💡 小贴士:安装完成后,在 AI 工具中输入 /learn-codebase 可触发项目全量学习,让 AI 更快理解你的代码库。查看记忆内容可访问安装时显示的 Web 查看器地址(默认 http://localhost:<端口>)。

  • vLLM —— 83K+ Stars 的 LLM 高性能推理引擎,PagedAttention 颠覆内存管理

    vLLM Logo

    vLLM — 高性能 LLM 推理与服务引擎

    ⚡ vLLM

    83K+ Stars · 面向大模型的高吞吐量、内存高效推理与服务引擎

    📌 项目简介

    vLLM 是由加州大学伯克利分校 Sky Computing Lab 发起、现由 2800+ 贡献者共同维护的开源 LLM 推理与服务引擎。其核心竞争力在于首创的 PagedAttention 技术,通过智能管理注意力键值内存,大幅降低内存碎片,将 GPU 利用率推向极限。无论是本地开发调试,还是生产级大规模部署,vLLM 都是当前最热门的推理加速选择。

    83K+
    GitHub Stars

    2.8K+
    贡献者

    200+
    支持模型架构

    🛠️ 安装要求与过程

    环境要求:

    • Python 3.10+(推荐 3.12+)
    • NVIDIA GPU(CUDA 12.9/13.x)或 AMD GPU(ROCm)
    • 也支持 CPU、Google TPU、Apple Silicon 等多种硬件
    # 推荐用 uv 安装(更快更可靠)

    uv pip install vllm

    # 或用 pip

    pip install vllm

    # 快速启动 OpenAI 兼容 API 服务

    python -m vllm.entrypoints.openai.api_server \
    –model Qwen/Qwen3-8B –port 8000

    🚀 核心功能

    ⚡ PagedAttention 内存管理

    将注意力键值内存分页管理,类似操作系统的虚拟内存机制,大幅减少内存碎片和冗余复制,内存利用率提升 2-4 倍。

    🔄 持续批处理 + 前缀缓存

    动态合并正在处理的请求,并复用相同前缀(如 system prompt)的计算结果,吞吐量提升 3-5 倍。

    🧩 200+ 模型架构原生支持

    无缝兼容 Hugging Face 主流模型,涵盖 Llama、Qwen、DeepSeek-V3、Gemma、Mixtral、LLaVA 等,开箱即用。

    🔧 丰富量化方案

    支持 FP8、INT8、INT4、AWQ、GPTQ、GGUF 等主流量化格式,在保持精度的同时大幅降低显存占用和推理延迟。

    🌐 OpenAI 兼容 API

    提供与 OpenAI API 完全兼容的接口,只需改一行代码即可从 OpenAI 切换到自托管 vLLM,零迁移成本。

    💡 典型使用场景

    场景一:私有化部署大模型 API 服务

    企业希望在内部环境部署 Qwen 或 Llama 大模型,提供类似 OpenAI 的 API 供业务系统调用。vLLM 可在单张 H100 上实现远超传统方案的吞吐量,显著降低推理成本。

    场景二:本地开发与环境调试

    开发者在本地机器上调试 Prompt 或测试 Agent 工作流,需要快速启动一个兼容 OpenAI SDK 的本地服务。vLLM 一条命令即可启动,支持流式输出和工具调用。

    场景三:多模态模型推理服务

    需要部署 LLaVA、Qwen-VL 等多模态模型,同时处理文本和图像输入。vLLM 对多模态模型提供原生支持,统一的 API 接口让多模态应用开发更加便捷。

    ✨ 推荐理由

    vLLM 是目前 LLM 推理领域最炙手可热的开源项目,没有之一。它的核心竞争力在于 PagedAttention——这项技术直接解决了 LLM 推理中内存管理效率低下的痛点,是业界首个将操作系统虚拟内存思想引入注意力机制的工作,还发表了 SOSP 2023 学术论文。

    实际使用下来,vLLM 最让人省心的是「开箱即用」——Hugging Face 模型直接加载,OpenAI API 直接兼容,量化方案直接配置。对于想把大模型「跑起来」的团队,vLLM 是目前最成熟、社区最活跃的选择。

    值得一提的是,vLLM 的社区生态极其繁荣,AWS、NVIDIA、AMD、Google Cloud 等巨头均在赞助其开发。这意味着 vLLM 不仅是一个开源项目,更正在成为 AI 推理层的事实标准

    📥 下载地址

    License: Apache 2.0 | 语言: Python | 最初开发: UC Berkeley Sky Computing Lab

  • Ollama — 本地大模型运行首选工具,165K+ Stars 的本地 LLM 神器

    Ollama — 本地大模型运行首选工具,165K+ Stars 的本地 LLM 神器

    Ollama - Get up and running with LLMs

    ⚡ GitHub 热门 AI 开源项目

    Ollama

    在本地一键运行 Llama 3、DeepSeek、Qwen、Gemma 等开源大语言模型,无需云端,隐私优先

    165K+ Stars
    📥 40K+ 社区集成
    🦙 Go + C++
    📜 MIT 开源协议

    📌 项目简介

    Ollama 是一款开源的本地大语言模型运行工具,让你在 macOS、Windows、Linux 上轻松下载、运行和管理各类开源 LLM。它内置了 llama.cpp 推理引擎,支持量化模型的高效运行,同时提供简洁的 CLI、REST API 以及 Python / JavaScript SDK,是本地 AI 开发的首选入口。

    🔧 安装要求和过程

    环境要求

    • 支持 macOS 11+、Windows 10+、Linux(x86_64 / ARM64)
    • 建议 8GB+ 内存(7B 模型);16GB+(13B 模型);32GB+(33B+ 模型)
    • 磁盘空间:每个模型约 4GB~20GB
    🍎 macOS

    brew install ollama

    或下载 Ollama.dmg 手动安装

    🪟 Windows
    下载 OllamaSetup.exe
    官网 ollama.com 直接下载安装包

    🐧 Linux

    curl -fsSL https://ollama.com/install.sh | sh

    🐳 Docker

    docker run ollama/ollama

    ⚡ 快速开始

    1. 安装完成后,终端运行 ollama serve 启动服务(默认 11434 端口)
    2. 运行 ollama run deepseek-r1 拉取并启动 DeepSeek-R1 模型
    3. 直接在终端对话,或访问 http://localhost:11434 调用 REST API

    🚀 核心功能

    ① 一键运行海量开源模型

    内置模型库(ollama.com/library)涵盖 Llama 3、DeepSeek-R1、Qwen2.5、Gemma、Mistral、Phi-3 等数百个模型,一条命令即可拉取运行。支持自定义 Modelfile 导入 GGML / GGUF 格式模型。

    ② 完整的 REST API 与 SDK

    默认在 11434 端口提供 OpenAI 兼容的 REST API,官方提供 Python 和 JavaScript SDK。可以无缝接入 LangChain、Lobe Chat、Open WebUI 等生态,开发者集成成本极低。

    ③ 多模型并行与 GPU 加速

    支持同时加载多个模型,自动检测并利用 NVIDIA / AMD GPU 进行推理加速。macOS 上原生支持 Metal GPU 加速,Linux 支持 CUDA 和 ROCm,推理速度大幅提升。

    ④ 丰富的生态集成

    社区已推出 40,000+ 个集成工具,涵盖桌面应用(Open WebUI、Enchanted)、IDE 插件(Continue、CopilotKit)、Agent 框架(LangChain、AutoGen)、RAG 工具(AnythingLLM)等,几乎覆盖所有 AI 开发场景。

    ⑤ 隐私优先,完全离线

    所有推理在本地执行,数据不出本机。无需注册、无需联网、无需付费 API Key,特别适合对数据隐私有严格要求的企业内网和个人开发者。

    💡 典型使用场景

    场景一:本地 AI 编程助手

    搭配 Continue.devVS Code Ollama 插件,在断网环境下也能使用本地 LLM 辅助代码补全、解释和重构。使用 DeepSeek-Coder 或 CodeLlama 模型,响应速度毫秒级,代码质量媲美云端模型。

    实战示例:运行 ollama run deepseek-coder:6.7b,然后在 Continue.dev 中配置 Ollama 为默认 Provider,即可在 VS Code 侧边栏直接对话编程。

    场景二:私有知识库 RAG 系统

    结合 AnythingLLMOpen WebUI,将企业内网文档、PDF、Markdown 文件作为知识库,通过 Ollama 本地推理实现零数据外泄的智能问答系统。金融、医疗、法律等敏感行业尤为适用。

    实战示例:Docker 部署 AnythingLLM,在设置中选择 Ollama 作为 LLM Provider,指定本地模型(如 Llama3:8b),然后上传内部文档即可开始私有问答。

    场景三:AI 应用本地开发测试

    在开发 AI 应用时,使用 Ollama 替代 OpenAI API 进行本地测试和迭代,无需消耗云端配额,也避免了敏感测试数据外传的风险。Ollama 的 API 与 OpenAI 高度兼容,切换成本极低。

    实战示例:在 .env 中设置 OPENAI_BASE_URL=http://localhost:11434/v1OPENAI_API_KEY=ollama,现有基于 OpenAI SDK 的代码几乎不用改动即可切换至本地模型。

    ✨ 推荐理由

    作为本地 LLM 领域的”Docker”,Ollama 几乎是所有 AI 开发者入门本地模型的第一站。它把复杂的模型量化、推理引擎配置、GPU 驱动适配等底层细节全部封装,真正做到了”一行命令运行大模型”。

    我个人最常用的场景是在无网环境下做代码审查和文档撰写——启动 DeepSeek-R1 本地模型,响应速度非常快,且完全不担心代码泄露。相比云端 API,本地运行的成本优势在长期使用中极为明显:一次性下载模型,后续零费用无限调用。

    另外值得一提的是 Ollama 的 REST API 与 OpenAI 高度兼容,这意味着你可以用同一套代码同时支持云端和本地模型,在开发阶段用本地模型省成本,上线时切换到 GPT-4 保质量,这种灵活性是其他本地 LLM 工具难以提供的。

    如果你还没试过在本地运行 LLM,Ollama 是最好的起点。165K Stars 和 40K+ 社区集成不是偶然——它真的好用。


      GitHub 热门 AI 开源项目系列  
  • CrewAI — 53.7K+ Stars,让多个AI智能体像团队一样协作的Python框架

    CrewAI — 53.7K+ Stars,让多个AI智能体像团队一样协作的Python框架

    🚀 CrewAI — 让多个 AI 智能体像团队一样协作

    📌 项目简介

    CrewAI 是一个完全独立、轻量、高性能的 Python 多智能体编排框架,专门用于协调角色扮演型自主 AI 智能体。它从零构建,不依赖 LangChain 或其他智能体框架,兼顾高层级开发的简洁性和底层控制的精准性,让多个 AI Agent 像真实团队一样分工协作,高效完成复杂任务。

    目前已有超过 10 万名开发者通过官方学习平台完成认证,CrewAI 正快速成为企业级 AI 自动化的标准框架。

    ⚙️ 安装要求和过程

    环境要求

    • Python: ≥ 3.10 且 < 3.14
    • 依赖管理: 推荐使用 UV(极速 Python 包管理器)
    • LLM 接入: 需配置 OpenAI API Key 或兼容接口(支持 Ollama 本地模型)

    快速安装

    # 安装基础版本
    uv pip install crewai
    
    # 安装带常用工具的完整版本
    uv pip install 'crewai[tools]'
    
    # 创建新项目(推荐)
    crewai create crew my_project
    

    常见问题排查

    报错信息 解决方案
    ModuleNotFoundError: No module named 'tiktoken' 显式安装: uv pip install 'crewai[embeddings]'
    Failed building wheel for tiktoken 安装 Rust 编译器 + Visual C++ Build Tools,或使用预编译包

    ✨ 核心功能

    1. 完全独立的轻量框架

    CrewAI 从零开始构建,完全不依赖 LangChain 等第三方智能体框架。执行速度比 LangGraph 快 5.76 倍(QA 任务场景),资源占用更低,定制更灵活。你可以在任意层级深度自定义 —— 从整体工作流到智能体内部提示词,全部开放。

    2. 双模式编排:Crew + Flow

    CrewAI 提供两种互补的核心编排能力:

    • Crew(智能体组):支持智能体自主协作和动态决策,适合需要灵活交互的任务
    • Flow(工作流):企业级生产架构,提供细粒度、事件驱动的流程控制,支持单 LLM 调用精准编排,原生兼容 Crew

    两者可无缝结合,兼顾灵活性与可控性。

    3. YAML 配置驱动开发

    通过 agents.yamltasks.yaml 声明式配置智能体角色、目标和任务描述,将业务逻辑与代码逻辑完全解耦。@CrewBase 装饰器自动加载配置,开发体验极佳:

    # config/agents.yaml
    researcher:
      role: "{topic} Senior Data Researcher"
      goal: "Uncover cutting-edge developments in {topic}"
      backstory: "You're a seasoned researcher with a knack for ..."
    
    # config/tasks.yaml
    research_task:
      description: "Conduct a thorough research about {topic}"
      expected_output: "A list with 10 bullet points ..."
      agent: researcher
    

    4. 丰富的工具生态与集成

    内置 crewai_tools 工具包,包含 SerperDevTool(Google 搜索)、ScrapeWebsiteToolPDFSearchTool 等常用工具。同时支持:

    • 对接 Ollama / LM Studio 本地模型
    • 对接 OpenAI / Anthropic / Gemini 等主流 LLM
    • 自定义 Tool 类,轻松扩展能力边界
    • 与企业现有系统、数据源和云基础设施无缝集成

    5. 企业级可观测性与安全

    CrewAI AMP Suite 提供企业级综合解决方案:

    • 追踪与可观测性:实时监控 AI 智能体和 Workflows,提供指标、日志、调用链路追踪
    • 统一控制平面:集中管理、监控、扩缩 AI 智能体和自动化流程
    • 高级安全能力:内置安全与合规机制,支持本地/云端灵活部署
    • 7×24 小时企业支持:专属支持团队保障业务无中断运行

    💡 典型使用场景

    场景一:AI 行业动态自动研究报告

    配置一个「资深研究员」智能体和「报告分析师」智能体,前者利用搜索工具搜集最新资料,后者将分析结果整理为结构化 Markdown 报告。全程自动化,每天早上收到一份行业动态简报。

    inputs = {'topic': 'AI Agents'}
    LatestAiDevelopmentCrew().crew().kickoff(inputs=inputs)
    # 输出: report.md — 完整的研究报告
    

    适用:市场调研、竞品分析、技术趋势跟踪

    场景二:股票分析自动化流水线

    结合 SerperDevTool 获取实时财经新闻,多个分析智能体分别负责基本面分析、技术面分析、风险评估,最终由汇总智能体输出投资建议报告。CrewAI 官方示例仓库中提供了完整的 Stock Analysis 案例。

    适用:量化投研、财经内容自动生成、投资决策辅助

    场景三:旅行规划智能体组

    「目的地推荐师」「酒店比价员」「行程安排师」三个智能体协同工作:推荐师根据预算和偏好输出目的地清单,比价员自动抓取酒店价格,安排师生成逐日行程表。CrewAI 官方 Trip Planner 示例可直接运行。

    适用:个性化推荐系统、旅行/餐饮/购物助手、智能客服

    🌟 推荐理由

    在多智能体框架的选型上,我曾对比过 LangGraph、AutoGen 和 CrewAI,最终选择深入使用 CrewAI,原因主要有三点:

    1. 学习曲线最平缓。YAML 配置 + Python 代码的分离设计让业务逻辑一目了然,官方 learn.crewai.com 学习平台提供从入门到精通的系统课程,还有 DeepLearning.AI 的 免费短课程,上手速度远超同类框架。
    2. 生产就绪。很多多智能体框架停留在 Demo 阶段,CrewAI 在设计之初就考虑了生产环境需求 —— Memory(记忆)、Delegation(任务委托)、Human-in-the-loop(人工介入)等生产必备功能一应俱全,且有企业级 AMP Suite 提供运维保障。
    3. 性能优势明显。官方基准测试显示 CrewAI 比 LangGraph 快 5.76 倍,在实际项目中我也感受到明显差异,尤其是多智能体并行执行场景下,响应速度和稳定性表现出色。

    如果你正在考虑引入多智能体架构,CrewAI 是目前最成熟、最易上手的选项之一。建议从官方示例仓库 crewAI-examples 挑一个最接近你需求的案例跑起来,15 分钟就能感受到它的威力。

    📥 下载地址

  • LangChain — 135K+ Stars 的 AI 智能体工程平台,构建 LLM 应用的首选框架

    LangChain Logo

    🔗 LangChain

    The Agent Engineering Platform — 135K+ Stars

    📦 langchain-ai/langchain · MIT License · Python

    📝 项目简介

    LangChain 是一个智能体工程平台,为构建 LLM 驱动的应用提供标准化接口与丰富的第三方集成,帮助开发者快速构建、调试和部署生产级 AI 智能体应用。

    135K+
    GitHub Stars

    279K+
    依赖项目

    600+
    集成组件

    v1.x
    最新稳定版

    ⚙️ 安装要求与过程

    环境要求
    • Python ≥ 3.9
    • 推荐使用 uv 作为包管理工具
    • 需要有效的 LLM API Key(OpenAI / Anthropic / 国内模型等)
    # 快速安装
    # 使用 uv 安装(推荐)
    uv add langchain
    
    # 使用 pip 安装
    pip install langchain
    
    # 安装特定模型集成
    pip install langchain-openai
    pip install langchain-anthropic

    # 快速开始 — Hello World
    from langchain.chat_models import init_chat_model
    
    # 初始化模型(支持任意提供商)
    model = init_chat_model("openai:gpt-4o")
    # model = init_chat_model("anthropic:claude-sonnet-4-20250514")
    
    result = model.invoke("用一句话解释什么是 LangChain")
    print(result.content)

    ⭐ 核心功能

    1
    标准化模型接口
    为模型、嵌入、向量存储等核心组件提供统一接口,切换底层模型无需重构业务代码,彻底告别厂商锁定。

    2
    丰富的第三方集成
    内置 600+ 集成组件,覆盖主流 LLM 提供商、向量数据库、检索工具、API 工具等,即插即用。

    3
    灵活的抽象层次
    从高层级链式调用(快速原型)到底层组件细粒度控制(复杂生产场景),支持不同复杂度的应用需求。

    4
    LangGraph 智能体编排
    配套 LangGraph 提供低层级智能体编排框架,支持复杂可控的多智能体工作流,适合生产级应用场景。

    5
    LangSmith 可观测性
    无缝对接 LangSmith 进行智能体评估、调试与监控,支持生产环境部署与长时状态工作流扩缩容。

    🚀 典型使用场景

    场景一:RAG(检索增强生成)问答系统
    将企业知识库文档向量化存储,结合 LangChain 的 Retriever 组件与 LLM,实现基于私有数据的精准问答。支持对接 Chroma、Pinecone、FAISS 等主流向量数据库,是构建企业 AI 知识助手的首选方案。

    场景二:智能客服 / AI Agent 工作流
    利用 LangChain 的 Agent 与 Tools 机制,让 LLM 自主调用搜索引擎、数据库查询、API 接口等工具,构建能完成多步骤复杂任务的智能助手。结合 LangGraph 可实现包含人工审批节点的复杂业务流程自动化。

    场景三:结构化数据抽取与处理
    利用 LangChain 的 OutputParser 与 Structured Output 功能,从非结构化文本中抽取结构化信息(如提取简历关键信息、解析合同要素),并输出为 JSON / Pydantic 模型,方便后续业务系统处理。

    💡 推荐理由

    LangChain 是 AI 应用开发领域当之无愧的”基础设施”。如果你正在构建任何与 LLM 相关的应用,LangChain 几乎是你绕不开的选择。

    它的核心价值在于标准化:无论你用 OpenAI、Anthropic 还是国产模型,接口一致;无论你用 PostgreSQL、Pinecone 还是 FAISS 存向量,接口一致。这种抽象让你可以随时切换底层技术,而不用重写应用逻辑。

    2026 年 LangChain 已迭代至 v1.x 稳定版,配套生态(LangGraph 智能体编排、LangSmith 可观测性、Deep Agents 低代码智能体)日趋完善,从快速原型到生产部署的全流程都有成熟方案支撑。

    当然,LangChain 的抽象层较厚,对于追求极致性能的场景可能需要权衡。但对于绝大多数 AI 应用开发者而言,它依然是目前最成熟、社区最活跃、学习资源最丰富的不二之选。

    ⋯⋯

    AI
    开源
    LangChain
    LLM
    AI Agent