Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢(44.9K Stars)

Milvus Logo

Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢

44,934+ ⭐ · Go + C++ · Apache 2.0 · LF AI & Data 基金会托管

📌 项目简介

Milvus 是由 Zilliz 开发、LF AI & Data 基金会托管的开源向量数据库,专为 AI 应用的大规模非结构化数据检索而设计。底层使用 Go 和 C++ 编写,支持 CPU/GPU 硬件加速,可在十亿级向量规模下实现毫秒级检索延迟,是 RAG、推荐系统、多模态搜索等 AI 应用的首选向量存储引擎。最新稳定版:v2.5.13(2026年6月)。

44.9K
GitHub Stars

4,089
Forks

10亿+
向量规模

5种
SDK语言

⚙️ 安装要求和过程

💻 环境要求
  • CPU:4核以上(生产推荐16核+)
  • 内存:16GB以上(十亿级向量推荐128GB+)
  • 存储:SSD推荐,冷数据可归档至S3/GCS(成本降低10倍)
  • Docker:Standalone模式需Docker 19.03+(最简方式)
  • Kubernetes:分布式部署需K8s 1.20+
  • Python:3.8~3.12(pymilvus SDK支持)
🐳 快速安装(Docker Standalone,生产推荐
# 下载 docker-compose.yml(含 etcd + MinIO 依赖)
wget https://github.com/milvus-io/milvus/releases/download/v2.5.13/milvus-standalone-docker-compose.yml -O docker-compose.yml

# 启动 Milvus
docker compose up -d

# 验证(看到三个容器均为 healthy 即成功)
docker compose ps

🐍 Python SDK 安装(最常用
# 标准安装(连接远程Milvus服务)
pip install -U pymilvus

# 包含 Milvus Lite(嵌入式,pip install即可运行,无需Docker)
pip install "pymilvus[milvus-lite]"

# 验证
python -c "from pymilvus import MilvusClient; print('Milvus OK')"

☁️ 零配置托管(Zilliz Cloud)

不想自建服务?试用 Zilliz Cloud,提供 Serverless(按量付费)、Dedicated(专属集群)、BYOC(自带云)三种模式,免费额度足够个人开发使用。与 AWS Bedrock、Azure OpenAI 深度集成。

✨ 核心功能

⚡ 十亿级高性能检索

存储计算分离架构,支持 HNSW / IVF / SCANN / DiskANN 等全部主流索引。GPU 加速兼容 NVIDIA CAGRA,十亿级向量下毫秒级延迟,QPS 可达数万次/秒。在 官方性能基准中处于行业第一梯队。

🔀 混合检索(稠密+稀疏向量)

原生支持 BM25 全文检索和学习的稀疏嵌入(SPLADE、BGE-M3),同一集合可同时存储稠密和稀疏向量,自定义重排策略合并多路结果,RAG 召回率提升 30%+。这是 Milvus 相比其他向量数据库的显著优势。

🏢 企业级多租户与安全

支持数据库/集合/分区/分区键四级隔离,单集群可承载数百万租户。强制用户认证、TLS 加密、RBAC 细粒度权限控制,满足 SOC 2 合规要求。适合 SaaS 平台多客户场景。

💾 冷热存储分离

热数据存内存/SSD,冷数据自动归档至 S3/GCS,存储成本降低 10 倍。支持对象存储原生架构,无需额外 ETL 即可直接读取云存储中的向量数据。Collection 级别的 Fork(写时复制)功能,大幅提升实验迭代效率。

🌐 多语言 SDK + 丰富 AI 生态集成

官方 SDK 覆盖 Python(pymilvus)、Java、Go、Node.js、Restful API 五种语言。原生集成 LangChain、LlamaIndex、OpenAI、HuggingFace、AutoGPT 等主流 AI 框架,可作为 RAG 应用的即插即用向量存储。Attu 提供图形化管理界面,Prometheus/Grafana 支持监控告警。

🏗️ 架构设计

Milvus 采用存储与计算分离、无状态微服务的分布式架构,所有组件以容器化方式部署,可充分利用 Kubernetes 的调度和自愈能力。

┌───────────────────────────────────────────────┐
│            API Service Layer                 │
│    gRPC / REST / Python / Java / Go SDK   │
└──────────────┬──────────────────────────────┘
                │
┌───────────────▼──────────────────────────────┐
│         Coordinator Service (元数据)            │
│   Root Coord  │  Query Coord  │  Data Coord  │
└────┬──────────┴─────────────┴──────────────┘
      │          │              │
      ▼          ▼              ▼
┌──────────┐┌──────────┐  ┌──────────┐
│ Query    ││ Data     │  │ Index    │  ← 可独立扩缩容
│ Node     ││ Node     │  │ Node     │
│(读密集) ││(写密集) │  │(索引构建)│
└───┬──────┘└───┬──────┘  └───┬──────┘
     │          │            │
┌─────▼──────────▼────────────▼─────────┐
│      Object Storage (S3 / GCS / MinIO)  │
│       + Hot Cache (内存 / SSD)           │
└──────────────────────────────────────────┘

所有协调服务支持多副本部署,单节点故障秒级恢复。存储与计算解耦,可按业务特征独立调整查询/写入容量。

🎯 典型使用场景

场景一:RAG(检索增强生成)应用

将企业知识库文档向量化存入 Milvus,用户提问时检索最相关的 Top-K 片段,注入 LLM 上下文窗口,显著提升回答准确性并减少幻觉。混合检索(向量+全文)可进一步提升召回率。官方 RAG 教程 30分钟可跑通 Demo。

场景二:多模态语义搜索引擎

利用 CLIP 等多模态模型将图片、音频、视频转为向量存入 Milvus,实现”以文搜图”、”以图搜图”、”视频片段检索”等功能。支持动态字段存储原始元数据,检索结果可直接返回图片 URL 或视频时间戳。图像检索实战教程 可直接参考。

场景三:实时推荐系统

将用户行为特征和物品特征向量化后存入 Milvus,通过近似最近邻搜索实时找相似用户或相似物品,实现个性化推荐。支持流式数据实时更新,新用户行为可在秒级反映到推荐结果中。官方电影推荐系统教程 可直接参考。

💡 推荐理由

在向量数据库赛道中,Milvus 是最成熟、生产案例最多的开源选择之一。与 Chroma(轻量级,适合原型)和 Qdrant(Rust 性能优异)相比,Milvus 的独特优势在于:

  • 云原生分布式架构:K8s 原生支持,可独立扩展查询/数据/索引节点,真正适合生产环境大规模部署(Chroma 无分布式,Qdrant 分布式为企业版功能)
  • 混合检索能力:稠密+稀疏向量一体化,RAG 场景召回率显著优于单一向量检索(多数竞品仅支持稠密向量)
  • LF AI & Data 基金会托管:开源治理规范,Apache 2.0 永久开源,不会突然变更许可协议
  • Milvus Lite 零配置:pip install 即可运行嵌入式版本,本地开发、单元测试、CI/CD 均无需 Docker

如果你正在构建 RAG 应用或语义搜索功能,Milvus 值得作为向量存储的首选方案进行评估。根据 官方性能基准,Milvus 在十亿级向量场景下的检索性能处于行业第一梯队。

LF AI & Data 基金会托管 · Apache 2.0 开源协议 · Zilliz 主导开发

最后更新:2026年6月25日 · 数据来源:GitHub API + milvus.io

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注