标签: LLM

  • Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    📦 项目简介

    Weaviate 是一款开源、云原生的向量数据库,同时存储对象和向量,支持大规模语义搜索。它将向量相似度搜索、关键词过滤、检索增强生成(RAG)和重排序功能整合到单个查询接口中,是构建 AI 应用的理想数据底座。

    Weaviate Logo

    Weaviate —— AI 开发者最爱的开源向量数据库

    ⚙️ 安装要求和过程

    环境要求

    • Docker 20.10+(推荐方式)
    • 内存:最低 4GB RAM,生产环境建议 8GB+
    • 存储:持久化卷(可选,用于数据持久化)
    • 客户端:Python 3.8+、Node.js 16+、Java 11+、Go 1.18+ 可选

    快速安装(Docker 本地部署)

    第一步:创建 docker-compose.yml 配置文件:

    services:
      weaviate:
        image: cr.weaviate.io/semitechnologies/weaviate:1.36.0
        ports:
          - "8080:8080"
          - "50051:50051"
        environment:
          ENABLE_MODULES: text2vec-model2vec
          MODEL2VEC_INFERENCE_API: http://text2vec-model2vec:8080
    
      # 轻量级嵌入模型,导入数据时会自动生成向量
      text2vec-model2vec:
        image: cr.weaviate.io/semitechnologies/model2vec-inference:minishlab-potion-base-32M
    

    第二步:启动服务

    docker compose up -d
    

    第三步:安装 Python 客户端

    pip install -U weaviate-client
    

    也可以使用 Weaviate Cloud 托管服务(免费试用),或部署到 Kubernetes、AWS、GCP 等云平台。

    🚀 核心功能

    ⚡ 毫秒级十亿向量搜索

    基于 Go 构建,高负载下响应稳定。采用 HNSW(Hierarchical Navigable Small World)索引算法,支持 ANN 基准测试领先性能,十亿级向量复杂语义搜索毫秒级返回。

    🔀 混合检索(向量 + 关键词 + 过滤)

    单接口同时支持语义搜索传统关键词(BM25)搜索图像搜索,支持高级过滤,可灵活组合获得最优结果。内置 hybrid 查询类型,自动融合向量相似度与关键词相关性分数。

    🤖 内置 RAG & 重排序

    无需额外工具,直接支持生成式搜索(RAG)重排序(Reranking)能力。可快速构建 Q&A 系统、聊天机器人、摘要工具。集成 Cohere、OpenAI、Voyage 等主流 Reranker 模型。

    📈 生产级可扩展性

    支持水平扩展多租户隔离副本细粒度 RBAC 权限控制,适配从原型到大规模生产场景。存储计算分离架构,支持 Kubernetes 原生编排。

    💾 低成本运维 & 向量压缩

    内置向量压缩能力(标量量化、二进制量化、产品量化),通过向量量化、多向量编码降低内存占用,对搜索性能影响极小。支持对象 TTL 机制,按集合配置数据过期时间,自动清理过期数据。

    💡 典型使用场景

    场景一:RAG(检索增强生成)系统

    将企业文档、知识库导入 Weaviate,结合 LLM 构建精准问答系统。Weaviate 负责语义检索召回相关段落,LLM 负责生成最终答案,大幅降低幻觉率。

    import weaviate
    from weaviate.classes.query import Filter
    
    client = weaviate.connect_to_local()
    
    # 语义搜索 + 元数据过滤
    results = client.collections.get("Document").query.near_text(
        query="如何申请退款?",
        limit=5,
        filters=Filter.by_property("category").equal("help")
    )
    for obj in results.objects:
        print(obj.properties["content"])
    

    场景二:语义搜索 & 推荐引擎

    电商、内容平台可用 Weaviate 实现”理解意图”的搜索体验。用户输入自然语言查询,系统返回语义最匹配的商品或内容,而非简单的关键词匹配。

    Weaviate 也支持多模态搜索(文本 + 图像),用户可用图片搜索相似商品,或用文本描述搜索相关图片。

    📦 Python 快速上手

    import weaviate
    from weaviate.classes.config import Configure, DataType, Property
    
    # 连接本地 Weaviate 服务
    client = weaviate.connect_to_local()
    
    # 创建集合(类似关系数据库的表)
    client.collections.create(
        name="Article",
        properties=[Property(name="content", data_type=DataType.TEXT)],
        # 使用 Model2Vec 向量化器,导入时自动生成向量
        vector_config=Configure.Vectors.text2vec_model2vec(),
    )
    
    # 插入数据并自动生成向量
    articles = client.collections.get("Article")
    articles.data.insert_many([
        {"content": "Vector databases enable semantic search"},
        {"content": "Machine learning models generate embeddings"},
        {"content": "Weaviate supports hybrid search capabilities"},
    ])
    
    # 执行语义搜索
    results = articles.query.near_text(query="Search objects by meaning", limit=1)
    print(results.objects[0].properties["content"])
    
    client.close()
    

    📌 推荐理由

    Weaviate 是我推荐的向量数据库首选之一,尤其适合以下场景:

    • 与已发布的同类项目对比:Qdrant(Rust,极致性能)、Milvus(分布式,大规模)、Chroma(轻量,快速上手)—— Weaviate 则胜在生态最完整集成最丰富
    • AI Agent 生态集成:Weaviate 积极拥抱 AI Agent 生态,官方提供 Agent Skills,支持 Claude Code、Cursor 等 AI 编码工具直接操作
    • 多语言 SDK 覆盖最全:Python、JavaScript/TypeScript、Java、Go、C#/.NET 五大官方 SDK,社区还有 Rust、PHP、Ruby 等扩展
    • BSD-3-Clause 许可:商业友好,可自由修改和分发,适合企业内嵌使用

    如果你正在构建 RAG 系统、语义搜索功能,或任何需要”理解语义”的 AI 应用,Weaviate 值得作为向量数据库的第一选择进行评估。

    📥 下载地址 & 相关链接

    ✝️ 开源协议:BSD 3-Clause License | 开发语言:Go | 2016年发布,持续维护至今

  • Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢(44.9K Stars)

    Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢(44.9K Stars)

    Milvus Logo

    Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢

    44,934+ ⭐ · Go + C++ · Apache 2.0 · LF AI & Data 基金会托管

    📌 项目简介

    Milvus 是由 Zilliz 开发、LF AI & Data 基金会托管的开源向量数据库,专为 AI 应用的大规模非结构化数据检索而设计。底层使用 Go 和 C++ 编写,支持 CPU/GPU 硬件加速,可在十亿级向量规模下实现毫秒级检索延迟,是 RAG、推荐系统、多模态搜索等 AI 应用的首选向量存储引擎。最新稳定版:v2.5.13(2026年6月)。

    44.9K
    GitHub Stars

    4,089
    Forks

    10亿+
    向量规模

    5种
    SDK语言

    ⚙️ 安装要求和过程

    💻 环境要求
    • CPU:4核以上(生产推荐16核+)
    • 内存:16GB以上(十亿级向量推荐128GB+)
    • 存储:SSD推荐,冷数据可归档至S3/GCS(成本降低10倍)
    • Docker:Standalone模式需Docker 19.03+(最简方式)
    • Kubernetes:分布式部署需K8s 1.20+
    • Python:3.8~3.12(pymilvus SDK支持)
    🐳 快速安装(Docker Standalone,生产推荐
    # 下载 docker-compose.yml(含 etcd + MinIO 依赖)
    wget https://github.com/milvus-io/milvus/releases/download/v2.5.13/milvus-standalone-docker-compose.yml -O docker-compose.yml
    
    # 启动 Milvus
    docker compose up -d
    
    # 验证(看到三个容器均为 healthy 即成功)
    docker compose ps

    🐍 Python SDK 安装(最常用
    # 标准安装(连接远程Milvus服务)
    pip install -U pymilvus
    
    # 包含 Milvus Lite(嵌入式,pip install即可运行,无需Docker)
    pip install "pymilvus[milvus-lite]"
    
    # 验证
    python -c "from pymilvus import MilvusClient; print('Milvus OK')"

    ☁️ 零配置托管(Zilliz Cloud)

    不想自建服务?试用 Zilliz Cloud,提供 Serverless(按量付费)、Dedicated(专属集群)、BYOC(自带云)三种模式,免费额度足够个人开发使用。与 AWS Bedrock、Azure OpenAI 深度集成。

    ✨ 核心功能

    ⚡ 十亿级高性能检索

    存储计算分离架构,支持 HNSW / IVF / SCANN / DiskANN 等全部主流索引。GPU 加速兼容 NVIDIA CAGRA,十亿级向量下毫秒级延迟,QPS 可达数万次/秒。在 官方性能基准中处于行业第一梯队。

    🔀 混合检索(稠密+稀疏向量)

    原生支持 BM25 全文检索和学习的稀疏嵌入(SPLADE、BGE-M3),同一集合可同时存储稠密和稀疏向量,自定义重排策略合并多路结果,RAG 召回率提升 30%+。这是 Milvus 相比其他向量数据库的显著优势。

    🏢 企业级多租户与安全

    支持数据库/集合/分区/分区键四级隔离,单集群可承载数百万租户。强制用户认证、TLS 加密、RBAC 细粒度权限控制,满足 SOC 2 合规要求。适合 SaaS 平台多客户场景。

    💾 冷热存储分离

    热数据存内存/SSD,冷数据自动归档至 S3/GCS,存储成本降低 10 倍。支持对象存储原生架构,无需额外 ETL 即可直接读取云存储中的向量数据。Collection 级别的 Fork(写时复制)功能,大幅提升实验迭代效率。

    🌐 多语言 SDK + 丰富 AI 生态集成

    官方 SDK 覆盖 Python(pymilvus)、Java、Go、Node.js、Restful API 五种语言。原生集成 LangChain、LlamaIndex、OpenAI、HuggingFace、AutoGPT 等主流 AI 框架,可作为 RAG 应用的即插即用向量存储。Attu 提供图形化管理界面,Prometheus/Grafana 支持监控告警。

    🏗️ 架构设计

    Milvus 采用存储与计算分离、无状态微服务的分布式架构,所有组件以容器化方式部署,可充分利用 Kubernetes 的调度和自愈能力。

    ┌───────────────────────────────────────────────┐
    │            API Service Layer                 │
    │    gRPC / REST / Python / Java / Go SDK   │
    └──────────────┬──────────────────────────────┘
                    │
    ┌───────────────▼──────────────────────────────┐
    │         Coordinator Service (元数据)            │
    │   Root Coord  │  Query Coord  │  Data Coord  │
    └────┬──────────┴─────────────┴──────────────┘
          │          │              │
          ▼          ▼              ▼
    ┌──────────┐┌──────────┐  ┌──────────┐
    │ Query    ││ Data     │  │ Index    │  ← 可独立扩缩容
    │ Node     ││ Node     │  │ Node     │
    │(读密集) ││(写密集) │  │(索引构建)│
    └───┬──────┘└───┬──────┘  └───┬──────┘
         │          │            │
    ┌─────▼──────────▼────────────▼─────────┐
    │      Object Storage (S3 / GCS / MinIO)  │
    │       + Hot Cache (内存 / SSD)           │
    └──────────────────────────────────────────┘

    所有协调服务支持多副本部署,单节点故障秒级恢复。存储与计算解耦,可按业务特征独立调整查询/写入容量。

    🎯 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业知识库文档向量化存入 Milvus,用户提问时检索最相关的 Top-K 片段,注入 LLM 上下文窗口,显著提升回答准确性并减少幻觉。混合检索(向量+全文)可进一步提升召回率。官方 RAG 教程 30分钟可跑通 Demo。

    场景二:多模态语义搜索引擎

    利用 CLIP 等多模态模型将图片、音频、视频转为向量存入 Milvus,实现”以文搜图”、”以图搜图”、”视频片段检索”等功能。支持动态字段存储原始元数据,检索结果可直接返回图片 URL 或视频时间戳。图像检索实战教程 可直接参考。

    场景三:实时推荐系统

    将用户行为特征和物品特征向量化后存入 Milvus,通过近似最近邻搜索实时找相似用户或相似物品,实现个性化推荐。支持流式数据实时更新,新用户行为可在秒级反映到推荐结果中。官方电影推荐系统教程 可直接参考。

    💡 推荐理由

    在向量数据库赛道中,Milvus 是最成熟、生产案例最多的开源选择之一。与 Chroma(轻量级,适合原型)和 Qdrant(Rust 性能优异)相比,Milvus 的独特优势在于:

    • 云原生分布式架构:K8s 原生支持,可独立扩展查询/数据/索引节点,真正适合生产环境大规模部署(Chroma 无分布式,Qdrant 分布式为企业版功能)
    • 混合检索能力:稠密+稀疏向量一体化,RAG 场景召回率显著优于单一向量检索(多数竞品仅支持稠密向量)
    • LF AI & Data 基金会托管:开源治理规范,Apache 2.0 永久开源,不会突然变更许可协议
    • Milvus Lite 零配置:pip install 即可运行嵌入式版本,本地开发、单元测试、CI/CD 均无需 Docker

    如果你正在构建 RAG 应用或语义搜索功能,Milvus 值得作为向量存储的首选方案进行评估。根据 官方性能基准,Milvus 在十亿级向量场景下的检索性能处于行业第一梯队。

    LF AI & Data 基金会托管 · Apache 2.0 开源协议 · Zilliz 主导开发

    最后更新:2026年6月25日 · 数据来源:GitHub API + milvus.io

  • deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    2026年2月,ByteDance(科技公司)开源了其内部打磨多时的超级智能体框架 deer-flow 2.0,发布当天即登顶 GitHub Trending 榜首,目前已收获 74,000+ Stars。这不仅仅是一个”AI聊天机器人”,而是一个能够处理分钟级到小时级复杂任务的长周期智能体框架——从深度研究、代码编写,到内容创作、幻灯片制作,deer-flow 都能自主规划并执行。

    🦌 项目简介

    deer-flow(鹿流)是 ByteDance 开源的长周期超级智能体框架(Super Agent Harness),由初代 Deep Research 框架完全重构而来。它支持研究、编码、内容创作等复杂任务,通过沙箱隔离、持久化记忆、工具调用、子智能体协作等能力,处理从几分钟到数小时的各类任务。2.0 版本为完全重构版本,架构更清晰、扩展性更强。

    deer-flow GitHub OpenGraph 图片
    deer-flow 2.0 – ByteDance 开源超级智能体框架

    🛠 安装要求和过程

    环境要求

    • Python:3.12+(推荐使用 uv 管理依赖)
    • Node.js:22+(前端界面需要)
    • pnpm:前端包管理工具
    • Docker:推荐部署方式(可选,用于沙箱隔离)
    • 操作系统:macOS / Linux / Windows(WSL2)

    快速安装(3分钟上手)

    # 1. 克隆仓库
    git clone https://github.com/bytedance/deer-flow.git
    cd deer-flow
    
    # 2. 运行交互式配置向导(2分钟完成,生成 config.yaml 和 .env)
    make setup
    
    # 3. 安装依赖(本地开发模式)
    make install
    
    # 4. 启动本地服务
    make dev
    # 访问地址:http://localhost:2026
    

    配置向导会引导你设置 LLM 提供商(支持 OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM 等)、网页搜索提供商(Tavily / Brave / Exa 等),无需手动编辑配置文件。配置完成后可随时运行 make doctor 验证配置是否正确。

    Docker 部署(推荐生产环境)

    # 开发模式(支持热重载)
    make docker-init    # 仅首次或沙箱镜像更新时运行
    make docker-start   # 启动服务
    
    # 生产模式
    make up             # 构建镜像并启动所有生产服务
    make down            # 停止并删除容器
    

    🎯 核心功能

    • 🧠 子智能体调度:主智能体可按需创建子智能体,每个子智能体拥有独立上下文、工具和终止条件;子智能体支持并行执行,执行结果结构化返回,主智能体最终汇总输出。长任务可拆分为多个子步骤,支持分钟到小时级别的复杂任务处理。
    • 📦 沙箱与文件系统隔离:每个任务拥有独立执行环境,支持文件读写、编辑、图像查看;支持多种沙箱模式:本地执行、Docker 隔离容器执行、Kubernetes Pod 执行。沙箱内文件路径 /mnt/user-data/ 下包含 uploads/(用户上传文件)、workspace/(智能体工作目录)、outputs/(最终交付物)。
    • 🧩 技能与工具扩展:内置研究、报告生成、幻灯片制作、网页生成、图像/视频生成等开箱即用技能;支持自定义技能、MCP 服务器扩展、Python 函数自定义工具;技能按需加载,避免上下文窗口过度占用;支持通过 /skill-name 前缀手动激活单轮技能。
    • 💾 长期记忆:跨会话持久化存储用户偏好、技术栈、常用工作流等信息;自动跳过重复记忆条目,避免记忆无限膨胀;记忆本地存储,用户完全可控。让智能体”记得”你之前的项目背景和编码习惯。
    • 🔌 IM 渠道集成:支持接入 Telegram、Slack、飞书、企业微信、钉钉、微信等 IM 渠道,无需公网 IP 即可接收任务。在聊天工具中直接使用 /new/status/models/memory 等命令管理对话和智能体。
    • 📊 可观测性:内置 LangSmith、Langfuse 可观测性集成,支持全链路 LLM 调用、智能体运行、工具执行追踪。生产和调试时都能清晰了解智能体的决策过程。

    💡 典型使用场景

    场景一:深度研究报告自动生成

    输入”研究 Transformer 架构的演进历程,输出一份 5000 字的技术报告,包含关键论文引用和架构对比图”,deer-flow 会自动规划研究步骤:搜索相关资料 → 阅读并提取关键信息 → 对比不同架构差异 → 生成结构化报告 → 输出为 PDF/Markdown。整个过程无需人工干预,耗时约 10-30 分钟。

    场景二:代码项目从零搭建

    输入”帮我搭建一个基于 FastAPI + Redis 的短链接服务,包含单元测试和 Docker 部署配置”,deer-flow 会创建子智能体分别处理:API 路由设计、Redis 缓存逻辑、测试用例编写、Dockerfile 生成。最终在 outputs/ 目录下产出完整项目代码,可直接运行。

    场景三:内容创作与多语言本地化

    deer-flow 内置内容创作技能,支持文章撰写、幻灯片制作、网页生成。结合 IM 渠道集成,可以将已有视频/文章自动翻译为多种语言并生成配音版本,实现内容的多语言分发。适合自媒体运营者和内容创作者使用。

    🌟 推荐理由

    deer-flow 2.0 是目前开源超级智能体框架中最接近”生产可用”的项目之一。与 LangChain、CrewAI 等框架相比,deer-flow 的最大特点是长周期任务处理能力——通过子智能体调度和上下文管理,它可以处理耗时数小时的复杂任务而不超出上下文窗口。这是很多同类框架做不到的。

    几个让我印象深刻的细节:

  • 上下文工程做得很到位:子智能体上下文隔离 + 自动摘要已完成子任务 + 中间结果卸载到文件系统,这套组合拳让长任务不 OOM。如果你用过其他框架处理长任务,就知道这个有多重要。
  • 沙箱设计务实:支持本地 / Docker / K8s 三种沙箱模式,开发时可以用本地模式快速迭代,生产时切到 Docker 隔离。不用一上来就搞复杂的 K8s 部署。
  • ByteDance 背书:这不是个人业余项目,是 ByteDance 内部打磨后开源的框架,2.0 版本完全重构,代码质量和文档都相当不错。74K+ stars 和 GitHub Trending 第一也证明了社区认可度。
  • IM 渠道集成很实用:无需公网 IP 就能通过飞书/企微接收任务,对国内用户非常友好。想象一下在企业微信群里 @ 一下你的 AI 智能体,它就去后台帮你跑一个深度研究任务,完成后通知你——这个体验很丝滑。

当然也有一些注意事项:项目默认设计为本地可信环境部署,不可信环境需要额外配置认证网关;生产环境扩容需要通过提升单 worker 资源配置或拆分数据库、沙箱到独立节点实现,不能直接增加 worker 数量。部署前建议仔细阅读安全文档。

📦 下载地址

  • GitHubhttps://github.com/bytedance/deer-flow(74K+ Stars,2.3K+ Commits)
  • 官方网站https://deerflow.tech(在线体验 + 完整文档)
  • 文档中心https://deerflow.tech/docs(支持英文、中文、日文、法文、俄文)
  • 在线体验https://deerflow.tech/playground(无需安装,直接试用)
  • License:MIT License(商业友好,可自由修改和分发)
  • 支持的 LLM:OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM / 豆包 Doubao(推荐 Seed-2.0-Code)等
  • 如果你正在寻找一个能处理复杂长任务的 AI 智能体框架,或者想了解 ByteDance 级别的工程团队是如何设计超级智能体的,deer-flow 绝对值得深入研究。74K+ 社区星标不会骗你。

  • AutoGPT:引爆AI智能体革命的开源里程碑,185K+ Stars让AI学会自主思考和行动

    AutoGPT:引爆AI智能体革命的开源里程碑,185K+ Stars让AI学会自主思考和行动

    2023年AI智能体革命的起点

    AutoGPT

    引爆AI智能体浪潮的开源里程碑,185K+ Stars 让 AI 学会自主思考和行动

    🚀 185K+ Stars
    🏠 自托管
    🐳 Docker 部署
    🤖 自主智能体

    AutoGPT 是2023年引爆AI智能体浪潮的开源项目,让AI能够自主拆解目标、分解任务、调用工具、持续迭代,无需人工干预即可完成复杂任务。它不仅是AI Agent领域的”比特币时刻”,更发展成了一个完整的AI智能体构建、部署和管理平台。

    AutoGPT Platform

    AutoGPT 平台架构示意图(图片来自 GitHub)

    📦 安装要求和过程

    环境要求

    CPU 4+ 核心(推荐)
    内存 最低 8GB,推荐 16GB
    存储 至少 10GB 可用空间
    操作系统 Linux / macOS / Windows 10+ (WSL2)
    必需软件 Docker Engine 20.10+, Docker Compose 2.0+, Git, Node.js 16+, npm 8+

    🚀 一键安装(推荐)

    AutoGPT 提供官方一键安装脚本,自动完成所有依赖配置:

    # macOS / Linux 一键安装
    curl -fsSL https://setup.agpt.co/install.sh -o install.sh && bash install.sh
    
    # Windows (PowerShell)
    powershell -c "iwr -useb https://setup.agpt.co/install.ps1 | iex"

    安装完成后访问本地 Web 界面即可开始使用,无需手动配置。

    🐳 Docker 手动部署

    git clone https://github.com/Significant-Gravitas/AutoGPT.git
    cd AutoGPT
    cp .env.template .env
    # 编辑 .env 填入 OPENAI_API_KEY 等配置
    docker-compose up -d

    完整文档:agpt.co/docs

    ⚡ 核心功能

    🎯 自主任务拆解与执行

    AI 自动将大目标拆解为可执行的子任务,持续迭代执行直到完成。支持循环执行、条件分支和错误自动恢复,让 AI 真正”会思考”。

    🛠️ 多工具集成能力

    内置联网搜索、代码执行、文件操作、记忆管理、浏览器自动化等工具。支持通过插件系统扩展自定义工具,让 Agent 具备实际操作能力。

    🏗️ 平台化架构

    从单一 Agent 工具发展为完整平台,支持构建、部署和管理多个 AI Agent。提供 REST API、Webhook 和图形化管理界面,适合生产环境使用。

    🖥️ 图形化管理界面

    基于 Web 的控制面板,可视化管理和监控 Agent 运行状态。支持实时日志查看、任务进度追踪和结果预览,无需命令行即可操作。

    ☁️ 云托管 + 自托管双模式

    支持完全本地 Docker 部署(免费),也提供云端托管版本(Beta)。数据和应用完全自主可控,满足不同场景的部署需求。

    💡 典型使用场景

    📊 场景一:自动化市场调研

    给 AutoGPT 一个目标:”分析 AI 编程工具市场竞品,输出对比报告”。它会自动搜索资料、访问竞品官网、汇总功能特性、截取关键页面,最终生成结构化的 Markdown 报告。整个过程无需人工干预。

    提示词示例:Research the top 5 open-source AI agent frameworks on GitHub, compare their star counts, key features, and licensing. Output a Markdown comparison table.

    💻 场景二:端到端代码项目搭建

    描述你的需求,AutoGPT 自动生成代码框架、编写功能模块、运行测试、修复错误、提交 Git 记录。支持与 GitHub 集成,实现从需求到部署的端到端自动化。

    提示词示例:Build a FastAPI app with user authentication (JWT), PostgreSQL database, and Swagger docs. Include unit tests and Dockerfile.

    🌟 推荐理由

    AutoGPT 在 AI 发展史上的地位,怎么强调都不为过。2023年3月,它成为 GitHub 史上增速最快的开源项目,仅用几天就从几千星冲到十万星,让全世界第一次直观看到”AI 自主完成复杂任务”的真实能力。

    虽然今天已有 LangChain、AutoGen、CrewAI 等更先进的框架,但 AutoGPT 的历史意义不可替代——它定义了”AI Agent 自主循环执行”这一范式,启发了此后几乎所有的 Agent 框架设计。

    现在的 AutoGPT 已不再是简单的循环脚本,而是发展成了包含 Web UI、Agent 市场、云托管平台在内的完整生态系统。如果你想理解 AI Agent 的来龙去脉,或者需要一个开箱即用的自主 Agent 平台,AutoGPT 依然是最好的起点之一。

    📥 下载地址

    📌 项目许可:NOASSERTION(核心框架 · 查看仓库最新许可信息)

    🔄 最后更新:2026-06-24(GitHub 实时数据)

    ⭐ 当前 Stars:185,142+ | Fork:43,000+ | 贡献者:300+

  • Graphify:让AI编码助手拥有持久记忆的知识图谱工具,71K+ Stars让代码/文档/会议全部可查询

    Graphify:让AI编码助手拥有持久记忆的知识图谱工具,71K+ Stars让代码/文档/会议全部可查询

    ⭐ GitHub 71.2K+ Stars | MIT 许可 | Python

    Graphify

    AI 编码助手的知识图谱技能,让代码、文档、会议记录全部可查询

    📋 项目简介

    Graphify 是一款 AI 编码助手技能插件,支持 Claude Code、Codex、Cursor、Gemini CLI 等几乎所有主流 AI 编码工具。它可以将任意文件夹下的代码、SQL 模式、文档、论文、图片、视频等内容,转换为可查询的知识图谱,实现单个图谱同时覆盖应用代码、数据库模式和基础设施信息。

    核心价值:让 AI 编码助手拥有持久记忆,不再「忘记」之前的对话和决策。

    71.2K+
    GitHub Stars

    1.1M+
    下载量

    20+
    AI 工具支持

    36
    语言/格式支持

    ⚙️ 安装要求和过程

    环境要求

    依赖 最低版本 安装方式
    Python 3.10+ python.org
    uv(推荐) 任意版本 curl -LsSf https://astral.sh/uv/install.sh | sh

    快速安装(3步搞定)

    # 1. 安装 graphify(PyPI 包名为 graphifyy,双 y)
    uv tool install graphifyy
    
    # 2. 注册到 AI 助手
    graphify install
    
    # 3. 在 AI 助手中使用
    /graphify .

    可选扩展功能

    uv tool install "graphifyy[all]" — 安装全部扩展(PDF/Office/视频/MCP/Neo4j/中文分词)

    🚀 核心功能

    🧠 知识图谱自动构建

    支持 36 种编程语言 AST 解析、PDF/Office 文档、图片、视频/音频、YouTube 链接等几乎所有项目相关文件,自动构建可查询的知识图谱。

    ⚡ 增量更新(无需重建)

    不同于 RAG 管道每次更改都重新嵌入所有内容,Graphify 维护一个活图谱。文件变更时,仅更新受影响的节点和边,其余保持不变。

    🔍 多模态语义查询

    支持语义查询、节点路径查询、节点解释、PR 影响分析、PR 冲突检测等功能,查询结果附带来源和置信度评分。

    🤖 20+ AI 工具兼容

    支持 Claude Code、Cursor、VS Code Copilot、Aider、Devin CLI、OpenClaw、Codex、Gemini CLI 等几乎所有主流 AI 编码工具。

    🔒 隐私优先(本地处理)

    代码文件完全本地通过 tree-sitter 解析,无需调用 API;无遥测、无用户行为追踪;支持气隙(air-gapped)部署。

    👥 团队协作友好

    生成的 graphify-out/ 目录可直接提交到 Git,团队成员拉取后可直接使用图谱,无需重复构建;支持 MCP 服务暴露供团队共享。

    💡 典型使用场景

    场景一:新人快速上手大型代码库

    问题:新工程师加入团队,需要数周时间阅读文档、grep 代码才能理解代码库。

    解决:运行 /graphify .,图谱一次性构建完成。询问 AI 助手「为什么我们移动从 REST 到 gRPC?」即可获得完整决策链路,包括 RFC 文档、设计会议记录、相关提交。

    场景二:PR 影响分析与冲突检测

    问题:提交 PR 时不知道哪些模块会受影响,容易引入隐形 Bug。

    解决:使用 graphify prs 42 查看 PR 的详细影响分析;使用 graphify prs --conflicts 检测共享图谱社区的 PR,避免合并冲突。

    场景三:跨代码/文档/会议的完整上下文

    问题:AI 编码助手只看到代码,看不到设计文档、会议记录、研究论文,导致建议不全面。

    解决:将代码仓库、PDF 设计文档、Markdown 会议记录、YouTube 技术讲座全部添加到图谱(graphify add <url>),AI 助手查询时获得完整上下文。

    🌟 推荐理由

    Graphify 是我近期关注的最令人兴奋的新项目之一。它解决了 AI 编码助手的一个核心痛点:遗忘。每次新对话,AI 助手都不记得之前的决策和上下文,导致重复解释、决策不一致。

    Graphify 通过知识图谱方案解决这个问题,比传统 RAG 更高效:

    • 增量更新:文件变更时仅更新受影响部分,不需要像 RAG 那样每次都重新嵌入所有文档
    • 结构化关系:图谱中的节点和边能够表达代码之间的调用关系、文档之间的引用关系,查询结果更有意义
    • 本地优先:代码解析完全在本地进行,不需要发送到大模型 API,保护代码隐私

    特别适合:使用 Claude Code、Cursor、Aider 等 AI 编码工具的开发者;需要管理大型代码库或跨多个文档/会议工作的团队;重视代码隐私、希望本地处理敏感项目的企业。

    ⚡ 增长惊人:项目 2026 年 4 月 3 日才创建,仅 3 个月已达到 71,275 Stars 和 110 万次下载,是 YC S26 孵化项目,增长势头非常强劲!

    📥 下载地址

    快速开始:

    uv tool install graphifyy && graphify install

    📌 项目开源许可:MIT | 最新版本:0.8.46 | 最后更新:2026 年 6 月

    🏷️ 相关标签:AI Agent · 知识图谱 · RAG · 代码智能 · Claude Code · Cursor

  • Pydantic AI:类型安全的AI Agent框架,Pydantic官方出品,17.9K+ Stars为GenAI开发带来FastAPI体验

    项目简介:Pydantic AI 是由 Pydantic 官方团队开发的 Python 原生 AI Agent 框架,目标是将 FastAPI 的开发体验带到生成式 AI 应用和 Agent 开发中。Pydantic 验证库已被 OpenAI SDK、Anthropic SDK、LangChain 等主流 AI 工具采用,而 Pydantic AI 则直接从源头集成 Pydantic 能力,让开发者能够快速、自信、低痛苦地构建生产级 GenAI 应用和工作流。

    ⭐ GitHub Stars
    17.9K+
    🍴 Forks
    2,250+
    📜 开源许可
    MIT
    🏢 开发团队
    Pydantic

    Pydantic AI Logo

    🔧 安装要求和过程

    环境要求

    • Python 3.9+(推荐 Python 3.10+)
    • pip 或 uv 包管理器
    • 支持的操作系统:Windows / macOS / Linux

    快速安装

    # 使用 pip 安装
    pip install pydantic-ai

    # 或使用 uv 安装(推荐)
    uv pip install pydantic-ai

    # 安装可选依赖(如需运行示例)
    pip install "pydantic-ai[examples]"

    验证安装

    python -c "import pydantic_ai; print(pydantic_ai.__version__)"

    🚀 核心功能

    1. 官方团队原生开发

    Pydantic 验证是 OpenAI SDK、Google ADK、Anthropic SDK、LangChain、LlamaIndex 等主流 AI 工具的基础验证层。Pydantic AI 直接从源头集成 Pydantic 能力,稳定性和兼容性更强。

    2. 完全类型安全

    充分利用 Python 类型提示,为 IDE 提供充足上下文,支持自动补全和静态类型检查,将大量运行时错误提前到编写时发现,获得类似 Rust “编译通过即可用” 的开发体验。

    3. 模型无关性

    支持几乎所有主流模型和提供商:OpenAI、Anthropic、Gemini、DeepSeek、Grok、Cohere、Mistral、Perplexity;云厂商:Azure AI Foundry、Amazon Bedrock、Google Cloud;本地推理:Ollama、LiteLLM、Groq、OpenRouter 等。未覆盖的模型可通过自定义模型扩展。

    4. 无缝可观测性

    深度集成 Pydantic Logfire(通用 OpenTelemetry 可观测平台),支持实时调试、基于评估的性能监控、行为追踪、成本追踪。同时也支持其他兼容 OpenTelemetry 的可观测平台。

    5. 强大的评估与扩展能力

    支持系统化测试和评估 Agent 系统的性能和准确性;支持通过可组合的能力(Capabilities)构建 Agent,能力可打包工具、钩子、指令、模型设置为可复用单元;支持完全通过 YAML/JSON 定义 Agent,无需编写代码。

    💡 典型使用场景

    场景一:银行客服 Agent

    构建具备工具调用、依赖注入、结构化输出的银行客服 Agent。通过 RunContext 注入数据库连接,使用 Pydantic BaseModel 定义结构化输出,实现类型安全的 Agent 响应。

    from pydantic_ai import Agent, RunContext
    from pydantic import BaseModel

    class SupportOutput(BaseModel):
        support_advice: str
        block_card: bool
        risk: int

    agent = Agent('openai:gpt-5.2', output_type=SupportOutput)

    场景二:带可观测性的生产级 Agent

    集成 Pydantic Logfire 实现全链路可观测性,监控 Agent 的完整运行链路、工具调用、数据库查询、Token 消耗和成本追踪,让生产环境 AI 应用透明可控。

    import logfire
    logfire.configure()
    logfire.instrument_pydantic_ai()
    logfire.instrument_sqlite3()

    💬 推荐理由

    Pydantic AI 是我见过的类型安全做得最彻底的 Python AI Agent 框架。如果你已经在用 Pydantic 做数据验证(相信我,你一定在用),那么 Pydantic AI 会让你感觉”回家了”。

    最打动我的是它的开发体验——类型提示让 IDE 自动补全几乎能”预测”你想写什么,大量潜在错误在编写阶段就被捕获,而不是在运行时才爆雷。这种”编译通过即可用”的 Rust 式体验,在 Python AI 开发中实在难能可贵。

    另外,Pydantic 团队在构建 Pydantic Logfire 时因为没有找到符合预期的 Agent 框架,干脆自己造了一个——这种”自己用它才做得好”的项目,质量通常有保障。目前 17.9K Stars,正处于快速成长阶段,现在上手正当其时。

    📥 下载地址

    📚
    官方文档

    ai.pydantic.dev

    🐍
    PyPI 安装

    pypi.org/project/pydantic-ai

    🔥
    Pydantic Logfire

    logfire.pydantic.dev

    🚀 Pydantic AI —— 类型安全的 AI Agent 框架,让 GenAI 开发像 FastAPI 一样流畅

  • LangGraph:Build Resilient Agents,LangChain 团队出品的 AI 智能体编排框架,循环计算图让智能体真正「会思考」(35.5K Stars)

    LangGraph:Build Resilient Agents,LangChain 团队出品的 AI 智能体编排框架,循环计算图让智能体真正「会思考」(35.5K Stars)

    🔄

    LangGraph

    Build Resilient Agents —— LangChain 团队出品的 AI 智能体编排框架

    35.5K+ Stars
    MIT 许可
    Python
    LangChain 官方

    LangGraph 是由 LangChain 团队开发的 AI 智能体编排框架,专为构建有状态、可循环、鲁棒的 AI 智能体而设计。与传统的 DAG(有向无环图)工作流不同,LangGraph 支持循环计算图,让智能体能够真正”思考-行动-反思”,实现接近人类的问题解决过程。

    LangGraph 架构设计

    LangGraph 循环计算图设计(支持状态循环与条件分支)

    ⚙️
    安装要求和过程

    环境要求

    • Python >= 3.9
    • pip 或 poetry 包管理器
    • (可选)LangChain 生态集成
    • (可选)LangSmith 用于调试追踪

    快速安装

    # 安装 LangGraph 核心库
    pip install langgraph
    
    # 安装 LangGraph CLI(用于本地开发)
    pip install langgraph-cli
    
    # 安装 LangChain(如需使用 LangChain 集成)
    pip install langchain langchain-openai
    
    # 使用 poetry
    poetry add langgraph

    最新版本:langgraph==1.2.6(2026-06-18 发布)


    核心功能

    01

    🔄 循环计算图支持

    与传统 DAG 框架不同,LangGraph 支持循环(cycles)条件分支,让智能体能够迭代优化输出、进行多轮对话、实现复杂的决策逻辑。这是构建真正”会思考”的智能体的关键能力。

    02

    💾 持久化状态管理

    内置 Checkpointer 机制,支持将智能体状态持久化到内存、SQLite、PostgreSQL 等存储后端。支持人机协作(Human-in-the-Loop):可以在智能体执行过程中暂停、审核、修改状态,然后继续执行。

    03

    🎯 细粒度控制与调试

    支持 时间旅行(Time Travel) 调试:可以回到智能体执行的任意步骤,检查状态、修改输入、重新运行。完美集成 LangSmith 进行追踪和评估。支持断点、单步执行、状态快照等高级调试功能。

    04

    🏗️ LangGraph Studio 可视化 IDE

    提供 LangGraph Studio 桌面应用,可视化编辑智能体工作流、实时预览执行状态、交互式调试。支持一键部署为 API 服务,或导出为 Python 代码。让智能体开发从”写代码”升级为”画流程”。

    05

    🚀 生产级部署方案

    提供 LangGraph Cloud(托管服务)和 自托管(Docker + LangGraph Server)两种部署方式。支持水平扩展、异步执行、长时运行任务、Webhook 回调等企业级特性。已有数千家公司在生产环境使用。

    💡
    典型使用场景

    场景一:多轮对话智能客服

    利用 LangGraph 的循环计算图,构建能够”理解上下文→查询知识库→生成回复→等待用户反馈→迭代优化”的智能客服。通过持久化状态,即使会话中断数小时,智能体仍能记住之前的对话内容。配合 LangSmith 可以持续优化回复质量。

    场景二:AI 研究智能体

    构建能够”分解问题→搜索资料→阅读内容→综合答案→验证准确性→补充细节”的自主研究智能体。LangGraph 的循环机制让智能体可以在发现信息不足时自动回溯、重新搜索,直到找到满意答案。这是 LangGraph 官方示例中的经典案例。

    场景三:代码审查智能体

    构建代码审查工作流:智能体 A 负责读取 PR diff,智能体 B 负责检查代码规范,智能体 C 负责生成审查意见,协调器(supervisor)负责整合结果。LangGraph 的多智能体协调能力让这种复杂协作变得简单。支持人工审核节点,关键决策需人工确认后才执行。

    ❤️
    推荐理由

    作为 LangChain 生态的核心框架,LangGraph 解决了 AI 智能体开发中最棘手的问题:如何让智能体”有记忆、能循环、可调试”。如果你用过 LangChain 的 LCEL(LangChain Expression Language),可能会觉得”链式调用”很方便,但遇到需要循环、条件分支、状态管理的复杂场景就力不从心了。LangGraph 正是为这些场景而生。

    我最欣赏 LangGraph 的 「时间旅行调试」功能。传统智能体开发是”黑盒”——你输入一个问题,等半天得到一个答案,中间发生了什么完全不知道。LangGraph 让你可以”回到过去”:查看某一步的状态、修改输入、重新运行。这简直是 AI 智能体开发的”时光机”,大幅提升了调试效率。

    另外,LangGraph Studio 是我见过最实用的 AI 智能体可视化工具。它不仅能”看”到智能体的执行流程,还能”改”——直接在某一步修改状态,然后继续运行。对于复杂智能体的开发和演示,这是无敌的工具。

    当然,LangGraph 也有学习曲线。如果你是完全的新手,建议先从 官方教程开始,跟着示例做一遍”聊天机器人”和”研究智能体”两个案例,就能掌握核心概念。MIT 许可 + LangChain 团队维护 + 35K+ Stars,这是目前最值得学习的 AI 智能体框架之一。

    📥
    下载地址

    📊 项目信息

    GitHub Stars: 35,504+
    Forks: 5,956+
    开源许可: MIT
    主要语言: Python
    最新版本: langgraph==1.2.6
    最后更新: 2026-06-23
    维护团队: LangChain 团队
    Issues 开放: 591

    🔄 如果你正在构建需要”记忆、循环、反思”能力的 AI 智能体,

    LangGraph 是目前最成熟、最完整的解决方案。

    LangChain 生态官方框架 · MIT 许可 · 35K+ Stars · 生产环境验证

  • DSPy:用编程取代提示词工程,Stanford 出品 LLM 应用优化框架,27.5K+ Stars

    DSPy:用编程取代提示词工程,Stanford 出品 LLM 应用优化框架,27.5K+ Stars

    📌 项目简介

    DSPy(Declarative Self-improving Language Programs in Python)是斯坦福大学开发的 LLM 编程框架,让你用 编程取代提示词工程。不再手写 prompt,而是定义模块 + 数据,DSPy 自动优化提示词和权重,让 LLM 应用可靠、可测量、可迭代。

    🔧 安装要求与过程

    环境要求

    • Python ≥ 3.9
    • pip 包管理器
    • (可选)OpenAI / Anthropic / Google API Key,或本地 Ollama

    快速安装

    # 基础安装(仅 DSPy 核心)
    pip install dspy-ai
    
    # 安装常用扩展(推荐)
    pip install dspy-ai[vertexai,anthropic,cohere]
    
    # 从源码安装最新版
    pip install git+https://github.com/stanfordnlp/dspy.git
    

    Hello World

    import dspy
    
    # 配置 LLM(支持 OpenAI / Claude / Gemini / Ollama 等)
    lm = dspy.LM("openai/gpt-4o-mini")
    dspy.configure(lm=lm)
    
    # 定义签名(Signature):输入 → 输出
    class QnA(dspy.Signature):
        question = dspy.InputField()
        answer   = dspy.OutputField()
    
    # 创建预测器
    qa = dspy.Predict(QnA)
    
    # 直接调用!
    result = qa(question="DSPy 是什么?")
    print(result.answer)
    

    ⭐ 核心功能

    1
    签名(Signature)= 结构化 Prompt

    用类型安全的 Python 类定义输入输出,DSPy 自动生成高质量 prompt。告别手工调 prompt,代码即文档。
    2
    自动优化器(Optimizer)= 自动 Prompt 工程

    内置 BootstrapFewShotMIPROv2COPRO 等优化器,只需提供训练数据,DSPy 自动搜索最优 prompt / 示例 / 权重。质量可测量、可复现。
    3
    模块化编程模型 = 像 PyTorch 一样组合 LLM

    提供 PredictChainOfThoughtProgramOfThoughtRetriever 等模块,自由组合成复杂 pipeline,支持多跳推理、工具调用、RAG。
    4
    全模型兼容 = 一处编写,任意 LLM 运行

    统一接口支持 OpenAI、Anthropic、Google、Cohere、Ollama、Together AI、Azure 等 30+ LLM 提供商,切换模型只需改一行配置。
    5
    内置评估框架 = 量化 AI 应用质量

    提供 EvaluateMetric 工具,科学评估模型效果,支撑数据驱动的迭代优化。

    🚀 典型使用场景

    场景 1:RAG 问答系统(最经典用法)

    import dspy
    from dspy.datasets import HotPotQA
    
    # 配置检索器 + LM
    colbertv2 = dspy.ColBERTv2(url="http://20.102.90.50:2017/wiki17_abstracts")
    lm = dspy.LM("openai/gpt-4o-mini")
    dspy.configure(lm=lm, rm=colbertv2)
    
    # 定义 RAG 签名
    class GenerateAnswer(dspy.Signature):
        context = dspy.InputField(desc="相关维基百科段落")
        question = dspy.InputField()
        answer   = dspy.OutputField()
    
    # 构建 RAG 管道
    class RAG(dspy.Module):
        def __init__(self):
            super().__init__()
            self.retrieve = dspy.Retrieve(k=3)
            self.generate = dspy.ChainOfThought(GenerateAnswer)
    
        def forward(self, question):
            context = self.retrieve(question).passages
            return self.generate(context=context, question=question)
    
    # 编译优化(自动调参)
    from dspy.teleprompt import MIPROv2
    teleprompter = MIPROv2(metric=dspy.evaluate.answer_exact_match)
    optimized_rag = teleprompter.compile(
        RAG(), trainset=your_trainset, valset=your_valset
    )
    

    场景 2:多跳推理 Agent

    DSPy 原生支持构建多步推理 Agent,结合 ReAct 模块和工具调用,让 LLM 自主规划 + 执行复杂任务:

    class MultiHopQA(dspy.Module):
        def __init__(self):
            self.react = dspy.ReAct(GenerateAnswer)
            # ReAct 自动循环:Thought → Action → Observation → ...
        
        def forward(self, question):
            return self.react(question=question)
    

    场景 3:生产级 Prompt 优化(MLOps 集成)

    用 DSPy 的评估 + 优化管线,将 prompt 工程纳入 CI/CD:每次模型更新自动重新优化 prompt,保证质量不回退。


    💡 推荐理由

    如果你还在手写 prompt、手动调 few-shot 示例、靠感觉评估 LLM 应用质量——DSPy 会彻底改变你的工作方式

    它的核心洞察是:Prompt 是代码,应该像代码一样被编译、优化、测试。DSPy 把 prompt 工程从「手工艺」升级为「工程学科」,让 LLM 应用开发进入可测量、可迭代的正循环。

    最打动我的是 MIPROv2 优化器:给它一堆训练数据,它能自动搜索最优的指令指令 + few-shot 示例组合,效果往往超过手工调参。对于需要稳定质量的 production 场景,这是救命稻草。

    另外,DSPy 的学术背景(斯坦福 Ocelot 团队,NeurIPS/ICML 多篇论文)保证了它的方法论严谨性,不是又一个「AI 包装框架」。

    📊 项目数据

    GitHub Stars 27.5K+
    开源许可 MIT License
    主要语言 Python
    维护团队 Stanford Ocelot Lab(@stanfordnlp)
    最新版本 v2.6+(2026 持续更新)
    文档地址 dspy.ai

    📥 下载地址

    🌐
    官方网站

    dspy.ai

    💻
    GitHub 仓库

    github.com/stanfordnlp/dspy

    📚
    官方文档

    dspy.ai/docs

    💬
    Discord 社区

    discord.gg/XCGy2WOMnX

    🎯 立即用 DSPy 把你的 LLM 应用工程化
    告别手工调 prompt,拥抱可测量、可优化的 LLM 编程新范式
  • Qdrant:用Rust打造的高性能向量数据库,AI检索引擎的新标杆

    Qdrant:用Rust打造的高性能向量数据库,AI检索引擎的新标杆

    🚀 项目简介

    Qdrant 是一个用 Rust 编写的高性能、大规模向量数据库与向量搜索引擎,专为下一代 AI 应用设计。它将向量相似度搜索与丰富的 JSON 元数据处理能力深度融合,是构建 RAG、语义搜索、AI 智能体等应用的理想检索底座。

    GitHub:qdrant/qdrant|Stars:32.5K+|语言:Rust 🦀|许可:Apache 2.0

    ⚙️ 安装要求与过程

    环境要求

    • 最低配置:2 vCPU、4GB RAM(测试环境)
    • 生产推荐:8+ vCPU、16GB+ RAM、SSD 存储
    • 支持平台:Linux / macOS / Windows(Docker)、Kubernetes
    • 客户端支持:Python、JavaScript/TypeScript、Go、Rust、.NET/C#、Java
    • 依赖:Docker(快速启动),或直接从 Release 下载二进制

    快速安装(Docker 方式)

    # 拉取并启动 Qdrant(默认端口 6333)
    docker run -p 6333:6333 qdrant/qdrant
    
    # Python 客户端连接
    pip install qdrant-client
    
    python -c "
    from qdrant_client import QdrantClient
    client = QdrantClient(url='http://localhost:6333')
    print(client.get_collections())
    "

    其他安装方式

    • Qdrant Cloud:注册即用,含免费套餐(cloud.qdrant.io
    • 自托管 Kubernetes:官方 Helm Chart 支持
    • Qdrant Edge:轻量版,可嵌入应用进程,适合边缘设备
    • Hybrid Cloud / Private Cloud:企业级自建云部署方案

    ⭐ 核心功能

    🔍 多向量搜索

    同时支持稠密向量(语义搜索)、稀疏向量(关键词搜索)、多向量(ColBERT 等晚期交互模型),一套引擎覆盖全场景。

    🔀 原生混合检索

    在单次查询中融合稠密与稀疏向量,支持 BM25、SPLADE++、miniCOIL 等多种算法,结果通过 RRF/DBSF 策略智能合并。

    📊 高级元数据过滤

    HNSW 遍历过程中直接应用过滤条件(非后过滤),支持嵌套对象、全文检索、地理位置、has_vector 等丰富过滤类型,高召回低延迟。

    ⚡ 极致性能优化

    Rust + SIMD 指令加速;Scalar/Asymmetric/Binary 量化降低内存占用最高 64 倍;GPU 加速索引(NVIDIA/AMD);io_uring 异步 I/O 最大化磁盘吞吐。

    🏗️ 企业级部署能力

    分布式水平扩展(分片 + 副本);零停机扩缩容;多租户数据隔离;SOC 2 / GDPR 合规;SSO(SAML/OIDC);Prometheus / Grafana / Datadog 监控集成;严格模式磁盘保护;WAL 持久化保证断电不丢数据。

    🏆 典型使用场景

    📚 RAG(检索增强生成)系统

    Qdrant 是 RAG 应用最流行的向量数据库选择之一。将企业文档、知识库切分后存入 Qdrant,用户提问时先向量检索最相关片段,再喂给 LLM 生成答案。Tripadvisor 使用 Qdrant 为数十亿条评论和图片提供 AI 旅行规划检索,收入提升 2-3 倍。
    技术栈:Qdrant + LangChain/LlamaIndex + OpenAI/DeepSeek

    🤖 AI 智能体长期记忆

    AI Agent 需要跨会话持久化记忆,Qdrant 提供高性能向量存储让智能体”记住”历史上下文。Deutsche Telekom 的多智能体平台基于 Qdrant 实现实时上下文检索,支撑 200 万+ AI 驱动对话。
    技术栈:Qdrant + Mem0 + LangChain/CrewAI

    🛍️ 电商语义推荐系统

    传统关键词搜索无法理解用户意图,Qdrant 的向量语义匹配让”类似风格””可以搭配”等模糊需求精准命中。Lyzr 的 AI 智能体平台接入 Qdrant 后,延迟降低 90%、吞吐量提升 150%。支持实时相似度匹配数百万商品,结合元数据过滤实现个性化推荐。
    技术栈:Qdrant + 多模态嵌入模型(CLIP)+ 推荐算法

    💡 推荐理由

    作为一个深度使用过多个向量数据库的开发者,Qdrant 给我印象最深刻的是它的“工程完成度”。以下是我的真实使用体会:

    • 🦀 Rust 带来的安心感:生产环境最怕 OOM 和奇怪的崩溃,Qdrant 用 Rust 编写,内存安全 + 高并发,跑了几个月稳如磐石,不像某些 Java 系的方案动不动就要调 JVM 参数。
    • 🎯 过滤性能是真的强:很多向量数据库的元数据过滤是”后过滤”(先搜再筛),大数据量下性能灾难。Qdrant 的过滤是在 HNSW 遍历过程中完成的,实测百万级向量 + 复杂过滤条件,延迟依然在毫秒级。
    • 📦 量化功能省真金白银:Scalar Quantization 开箱即用,内存占用直接砍掉 75%,精度损失微乎其微。如果用量大,这一项就能省好几台服务器的钱。
    • 🔌 生态集成无脑顺畅:LangChain、LlamaIndex、Haystack、MCP 协议……主流 AI 框架全部原生支持,基本不用写适配代码,直接 pip install qdrant-client 开箱即用。
    • ☁️ Cloud 免费额度够用:不想自己运维可以用 Qdrant Cloud,免费套餐够小型项目跑起来,后续扩容也无缝迁移,不用担心被锁定。

    ⚠️ 注意事项:默认 Docker 启动是无认证的,千万不要直接暴露到公网!一定要先看官方安全配置指南,开启 API Key 或 mTLS 认证。另外,如果数据量在千万级以下,其实 Chroma 这类更轻量的方案也够用,Qdrant 的优势在大规模生产场景才完全体现。

    📦 下载地址 & 资源链接

    🌐 官方网站

    qdrant.tech

    💻 GitHub 仓库

    github.com/qdrant/qdrant

    ☁️ Qdrant Cloud

    cloud.qdrant.io(含免费套餐)

    📖 官方文档

    qdrant.tech/documentation

    🐍 Python 客户端

    qdrant-client (PyPI)

    📊 性能基准测试

    qdrant.tech/benchmarks

    Apache License 2.0 开源 · 完全自托管 · 32.5K+ Stars

  • Chroma:AI原生开源向量数据库,RAG与语义搜索首选,28,530 Stars让搜索基础设施零门槛

    Chroma:AI原生开源向量数据库,RAG与语义搜索首选,28,530 Stars让搜索基础设施零门槛

    Chroma Logo

    Chroma – Search Infrastructure for AI

    📦 项目简介

    Chroma 是一款AI 原生的开源向量数据库,提供向量、全文、正则表达式和元数据搜索一体化基础设施。专为 AI 应用设计,支持语义相似搜索、混合检索和数据集版本管理,是 RAG(检索增强生成)和 AI 搜索场景的首选开源方案。

    ⭐ 28,530 Stars
    🍴 2,333 Forks
    📜 Apache-2.0
    🐍 Python / TypeScript / Rust
    📦 15M+ 月下载

    ⚙️ 安装要求和过程

    环境要求

    • Python ≥ 3.8(推荐 3.9+)
    • Node.js ≥ 18(TypeScript 客户端)
    • Rust ≥ 1.70(可选,自行编译时使用)
    • Docker(可选,服务端部署)

    快速安装(Python)

    # 安装 Chroma Python 客户端
    pip install chromadb
    
    # 启动 Chroma 服务端(默认端口 8000)
    pip install chromadb[server]
    chromadb run
    
    # 或使用 Docker 一键启动
    docker run -d --name chroma \
      -p 8000:8000 \
      -v $(pwd)/chroma-data:/chroma/chroma \
      chromadb/chroma:latest

    TypeScript / JavaScript 安装

    # npm
    npm install chromadb
    
    # 在 Node.js / 浏览器中使用
    import { ChromaClient } from 'chromadb';
    
    const client = new ChromaClient({ path: "http://localhost:8000" });

    Chroma Cloud(托管服务)

    注册 Chroma Cloud 即可获得免运维、自动扩缩容的托管向量数据库,支持 S3/GCS 对象存储、SOC 2 Type II 合规。

    ✨ 核心功能

    🔍 多模态搜索

    同时支持向量搜索(语义相似度)、全文搜索(BM25/SPLADE 稀疏向量)、正则表达式搜索元数据过滤。可在单次查询中混合多种搜索策略,实现更精准的召回效果。

    📦 集合 Forking(数据集版本管理)

    支持写时复制(Copy-on-Write)Forking,可快速复制整个 Collection 用于 A/B 测试、模型版本对比或数据回滚,无需额外存储空间。

    ⚡ 对象存储原生架构

    索引专门优化用于 S3 / GCS 对象存储,热数据内存缓存 + 温数据 SSD + 冷数据对象存储三层智能分层。存储成本降低 10 倍(向量 1GB → 对象存储 $0.02/GB/mo vs 内存 $5/GB/mo)。

    🔌 多语言 SDK + 生态集成

    官方支持 Python、TypeScript、Rust 三语言 SDK;无缝集成 LangChain、LlamaIndex、OpenAI、Cohere、Hugging Face 等主流 AI 框架;也可通过 MCP 协议直接接入 AI Agent。

    📊 企业级可靠性

    SOC 2 Type II 认证;支持多租户隔离、VPC 私有部署(BYOC)、CMEK 客户托管密钥、AWS PrivateLink 私有网络;索引状态实时监控;读写一致性级别可控(ReadLevel)。

    🚀 典型使用场景

    场景一:RAG(检索增强生成)知识库

    将企业文档、技术手册、FAQ 等嵌入为向量存入 Chroma,LLM 回答问题时先检索相关片段再生成答案。相比直接使用 LLM,准确率提升 40%+,同时可追溯答案来源。

    # RAG 典型代码(Python)
    import chromadb
    from langchain.vectorstores import Chroma
    from langchain.embeddings import OpenAIEmbeddings
    
    # 创建向量库
    vectordb = Chroma.from_documents(
        documents=splits,
        embedding=OpenAIEmbeddings(),
        persist_directory="./chroma_db"
    )
    
    # 检索相关文档
    retriever = vectordb.as_retriever(search_kwargs={"k": 4})
    relevant_docs = retriever.get_relevant_documents("如何重置密码?")

    场景二:语义搜索与推荐系统

    电商、内容平台可用 Chroma 实现”以文搜图”、”相关推荐”等功能。用户查询经嵌入模型转化为向量后,与数据库中商品/内容向量计算相似度,返回最相关的结果。支持混合检索(向量+全文+元数据过滤联合排序)。

    场景三:AI Agent 长期记忆

    为 AI Agent 提供跨会话的持久化记忆。将历史对话、用户偏好、工具调用记录存入 Chroma,Agent 每次运行时检索相关上下文注入 Prompt,实现”越用越懂你”的个性化体验。可与 Mem0、claude-mem 等记忆层搭配使用。

    💡 推荐理由

    Chroma 是目前最易上手的向量数据库,没有之一。pip install chromadb 后 3 行代码即可启动,不需要任何外部依赖或复杂配置。这对于想要快速验证 RAG 想法的开发者来说,是绝对的”第一步”首选。

    它的多模态搜索能力尤其值得称道——不再是单一的向量相似度搜索,而是可以混合稀疏向量(BM25)、稠密向量、全文和正则表达式,在一个查询里完成多路召回再重排序。这个设计让召回率比单纯向量搜索提升了不少,尤其在专业术语、产品编码等”精确匹配”场景。

    对象存储原生架构也是一个被低估的亮点。很多向量数据库把索引放内存,数据量大了成本直线上升。Chroma 把向量存 S3/GCS,热数据才进内存,存储成本直接降到 1/10。对于千万级向量规模的应用,这个差异就是”用得起”和”用不起”的分界线。

    最后,Chroma 的社区活跃度很高,27K+ Stars、15M+ 月下载量、9 万+ GitHub 仓库依赖,意味着你踩过的坑几乎一定有人踩过,Stack Overflow / Discord 上能找到现成答案。加上 LangChain、LlamaIndex 的官方集成,基本上”开箱即用”。

    📥 下载地址

    📊 技术规格

    项目 详情
    GitHub chroma-core/chroma
    Stars 28,530
    最新版本 Python 1.5.9 / JS 3.4.5 / CLI 1.4.4
    开源许可 Apache-2.0
    主要语言 Python、Rust、Go、TypeScript
    月下载量 15,000,000+
    存储后端 S3 / GCS(对象存储原生)
    查询延迟(P50) 20ms(热缓存)/ 650ms(冷启动)
    集合上限 100 万 Collection / 500 万条记录
    搜索类型 向量 / 全文 / 正则 / 元数据 / 混合

    🚀 Chroma 让每个开发者都能在 5 分钟内拥有生产级向量搜索能力。
    无论是构建 RAG 知识库、语义搜索引擎,还是为 AI Agent 配备长期记忆,它都是最值得信赖的开源基石。