Milvus：高性能云原生向量数据库，为AI应用打造的神经记忆中枢（44.9K Stars）

Milvus：高性能云原生向量数据库，为AI应用打造的神经记忆中枢

44,934+ ⭐ · Go + C++ · Apache 2.0 · LF AI & Data 基金会托管

📌 项目简介

Milvus 是由 Zilliz 开发、LF AI & Data 基金会托管的开源向量数据库，专为 AI 应用的大规模非结构化数据检索而设计。底层使用 Go 和 C++ 编写，支持 CPU/GPU 硬件加速，可在十亿级向量规模下实现毫秒级检索延迟，是 RAG、推荐系统、多模态搜索等 AI 应用的首选向量存储引擎。最新稳定版：v2.5.13（2026年6月）。

44.9K

GitHub Stars

4,089

Forks

10亿+

向量规模

5种

SDK语言

⚙️ 安装要求和过程

💻 环境要求

CPU：4核以上（生产推荐16核+）
内存：16GB以上（十亿级向量推荐128GB+）
存储：SSD推荐，冷数据可归档至S3/GCS（成本降低10倍）
Docker：Standalone模式需Docker 19.03+（最简方式）
Kubernetes：分布式部署需K8s 1.20+
Python：3.8～3.12（pymilvus SDK支持）

🐳 快速安装（Docker Standalone，生产推荐）

# 下载 docker-compose.yml（含 etcd + MinIO 依赖）
wget https://github.com/milvus-io/milvus/releases/download/v2.5.13/milvus-standalone-docker-compose.yml -O docker-compose.yml

# 启动 Milvus
docker compose up -d

# 验证（看到三个容器均为 healthy 即成功）
docker compose ps

🐍 Python SDK 安装（最常用）

# 标准安装（连接远程Milvus服务）
pip install -U pymilvus

# 包含 Milvus Lite（嵌入式，pip install即可运行，无需Docker）
pip install "pymilvus[milvus-lite]"

# 验证
python -c "from pymilvus import MilvusClient; print('Milvus OK')"

☁️ 零配置托管（Zilliz Cloud）

不想自建服务？试用 Zilliz Cloud，提供 Serverless（按量付费）、Dedicated（专属集群）、BYOC（自带云）三种模式，免费额度足够个人开发使用。与 AWS Bedrock、Azure OpenAI 深度集成。

✨ 核心功能

⚡ 十亿级高性能检索

存储计算分离架构，支持 HNSW / IVF / SCANN / DiskANN 等全部主流索引。GPU 加速兼容 NVIDIA CAGRA，十亿级向量下毫秒级延迟，QPS 可达数万次/秒。在官方性能基准中处于行业第一梯队。

🔀 混合检索（稠密+稀疏向量）

原生支持 BM25 全文检索和学习的稀疏嵌入（SPLADE、BGE-M3），同一集合可同时存储稠密和稀疏向量，自定义重排策略合并多路结果，RAG 召回率提升 30%+。这是 Milvus 相比其他向量数据库的显著优势。

🏢 企业级多租户与安全

支持数据库/集合/分区/分区键四级隔离，单集群可承载数百万租户。强制用户认证、TLS 加密、RBAC 细粒度权限控制，满足 SOC 2 合规要求。适合 SaaS 平台多客户场景。

💾 冷热存储分离

热数据存内存/SSD，冷数据自动归档至 S3/GCS，存储成本降低 10 倍。支持对象存储原生架构，无需额外 ETL 即可直接读取云存储中的向量数据。Collection 级别的 Fork（写时复制）功能，大幅提升实验迭代效率。

🌐 多语言 SDK + 丰富 AI 生态集成

官方 SDK 覆盖 Python（pymilvus）、Java、Go、Node.js、Restful API 五种语言。原生集成 LangChain、LlamaIndex、OpenAI、HuggingFace、AutoGPT 等主流 AI 框架，可作为 RAG 应用的即插即用向量存储。Attu 提供图形化管理界面，Prometheus/Grafana 支持监控告警。

🏗️ 架构设计

Milvus 采用存储与计算分离、无状态微服务的分布式架构，所有组件以容器化方式部署，可充分利用 Kubernetes 的调度和自愈能力。

┌───────────────────────────────────────────────┐
│            API Service Layer                 │
│    gRPC / REST / Python / Java / Go SDK   │
└──────────────┬──────────────────────────────┘
                │
┌───────────────▼──────────────────────────────┐
│         Coordinator Service (元数据)            │
│   Root Coord  │  Query Coord  │  Data Coord  │
└────┬──────────┴─────────────┴──────────────┘
      │          │              │
      ▼          ▼              ▼
┌──────────┐┌──────────┐  ┌──────────┐
│ Query    ││ Data     │  │ Index    │  ← 可独立扩缩容
│ Node     ││ Node     │  │ Node     │
│(读密集) ││(写密集) │  │(索引构建)│
└───┬──────┘└───┬──────┘  └───┬──────┘
     │          │            │
┌─────▼──────────▼────────────▼─────────┐
│      Object Storage (S3 / GCS / MinIO)  │
│       + Hot Cache (内存 / SSD)           │
└──────────────────────────────────────────┘

所有协调服务支持多副本部署，单节点故障秒级恢复。存储与计算解耦，可按业务特征独立调整查询/写入容量。

🎯 典型使用场景

场景一：RAG（检索增强生成）应用

将企业知识库文档向量化存入 Milvus，用户提问时检索最相关的 Top-K 片段，注入 LLM 上下文窗口，显著提升回答准确性并减少幻觉。混合检索（向量+全文）可进一步提升召回率。官方 RAG 教程 30分钟可跑通 Demo。

场景二：多模态语义搜索引擎

利用 CLIP 等多模态模型将图片、音频、视频转为向量存入 Milvus，实现”以文搜图”、”以图搜图”、”视频片段检索”等功能。支持动态字段存储原始元数据，检索结果可直接返回图片 URL 或视频时间戳。图像检索实战教程可直接参考。

场景三：实时推荐系统

将用户行为特征和物品特征向量化后存入 Milvus，通过近似最近邻搜索实时找相似用户或相似物品，实现个性化推荐。支持流式数据实时更新，新用户行为可在秒级反映到推荐结果中。官方电影推荐系统教程可直接参考。

💡 推荐理由

在向量数据库赛道中，Milvus 是最成熟、生产案例最多的开源选择之一。与 Chroma（轻量级，适合原型）和 Qdrant（Rust 性能优异）相比，Milvus 的独特优势在于：

云原生分布式架构：K8s 原生支持，可独立扩展查询/数据/索引节点，真正适合生产环境大规模部署（Chroma 无分布式，Qdrant 分布式为企业版功能）
混合检索能力：稠密+稀疏向量一体化，RAG 场景召回率显著优于单一向量检索（多数竞品仅支持稠密向量）
LF AI & Data 基金会托管：开源治理规范，Apache 2.0 永久开源，不会突然变更许可协议
Milvus Lite 零配置：pip install 即可运行嵌入式版本，本地开发、单元测试、CI/CD 均无需 Docker

如果你正在构建 RAG 应用或语义搜索功能，Milvus 值得作为向量存储的首选方案进行评估。根据官方性能基准，Milvus 在十亿级向量场景下的检索性能处于行业第一梯队。