标签: LLM

  • Agent-Reach:给AI Agent装上「全网眼睛」,30K+ Stars的免费互联网接入神器

    Agent-Reach:给AI Agent装上「全网眼睛」,30K+ Stars的免费互联网接入神器

    Agent-Reach - 给AI Agent装上全网眼睛

    项目简介

    Agent-Reach 是一个为 AI 智能体(AI Agent)提供全网内容读取与搜索能力的开源工具。它让 AI Agent 能够一键读取 Twitter、Reddit、YouTube、B站、小红书、GitHub 等 15+ 平台的内容——完全免费、无需付费 API,只需一行命令安装。

    项目目前拥有 30K+ GitHub Stars,是当前 AI Agent 基础设施领域最热门的项目之一。由开发者 Panniantong 开发并持续维护,采用 MIT 开源协议。

    为什么需要 Agent Reach?

    AI Agent 已经能帮你写代码、改文档、管项目——但你让它去网上找点东西,它就抓瞎了:

    • 📺 让 AI 看 YouTube 教程 → 拿不到字幕
    • 🐦 让 AI 搜推特产品评价 → Twitter API 要付费
    • 📖 让 AI 去 Reddit 找同类 bug → 返回 403
    • 📕 让 AI 看小红书商品口碑 → 必须登录才能打开
    • 📺 让 AI 总结 B 站技术视频 → 被风控拦截
    • 🔍 让 AI 搜索最新 LLM 框架对比 → 没有好用的免费工具

    安装要求与环境配置

    环境要求 说明
    Python 版本 Python 3.10 及以上
    操作系统 macOS / Linux / Windows 全平台支持
    兼容 Agent Claude Code、OpenClaw、Cursor、Windsurf、Codex 等所有能执行命令的 Agent
    网络代理 本地电脑不需要;服务器部署可能需要(~$1/月)

    快速安装步骤

    方法一:一键安装(推荐)
    # 复制这句话给你的 AI Agent:
    帮我安装 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md
    
    # 或手动执行:
    pip install agent-reach
    agent-reach install --env=auto
    方法二:安全模式(生产环境推荐)
    pip install agent-reach
    agent-reach install --env=auto --safe

    安装完成后,运行诊断命令查看各渠道状态:

    agent-reach doctor

    核心功能

    🌐 网页阅读

    基于 Jina Reader 免费读取任意网页内容,自动清洗 HTML 标签,输出干净文本。无需 API Key。

    🐦 Twitter/X 读取

    通过 Cookie 认证免费读取和搜索推文,支持单条推文、时间线浏览、长文阅读。无需 Twitter API 付费。

    📺 YouTube 字幕提取

    基于 yt-dlp(154K Stars)提取视频字幕和元数据,支持多语言,无需 API Key。

    📺 B站搜索与阅读

    使用 bili-cli 无需登录即可搜索视频、获取详情。支持字幕提取(需 OpenCLI 配置)。

    🔍 全网语义搜索

    集成 Exa AI 语义搜索引擎(MCP 接入),支持自然语言查询,免费无需 Key。

    完整平台支持列表

    平台 零配置功能 配置后解锁
    🌐 网页 阅读任意网页
    📺 YouTube 字幕 + 搜索
    📡 RSS 解析任意源
    📦 GitHub 公开仓库 + 搜索 私有仓库 / Issue / PR
    🐦 Twitter/X 读单条推文 搜索 / 时间线 / 长文
    📖 Reddit 搜索 + 读帖子和评论
    📕 小红书 搜索 / 阅读 / 评论
    💼 LinkedIn Jina Reader 公开页 Profile / 公司页面
    💻 V2EX 热门帖子 + 详情
    📈 雪球 行情 + 搜索 + 热榜 高级数据

    典型使用场景

    🎯 场景一:AI 产品调研助手

    让 AI Agent 同时搜索 Twitter 用户对竞品的真实评价、Reddit 上的讨论帖、YouTube 上的评测视频,再汇总成调研报告。以前需要人工切换多个平台的操作,现在一句话搞定:

    "帮我调研一下 Cursor vs Windsurf 的用户反馈,
    搜一下 Twitter 和 Reddit 上的讨论"

    🎯 场景二:技术视频学习加速器

    把 YouTube/B站的技术教程链接丢给 Agent,它会自动提取字幕、总结要点、生成笔记。再也不用花 2 小时看完一个视频才知道讲的是什么:

    "总结一下这个 YouTube 视频的核心内容:
    https://youtube.com/watch?v=xxx"

    🎯 场景三:全网信息监控与聚合

    设置定时任务让 Agent 监控特定关键词在 Twitter、Reddit、V2EX 等平台的最新动态,汇总后推送给你。特别适合追踪技术趋势、竞品动态或舆情监测:

    "每天早上搜一下 RAG 相关的最新讨论,
    看看 Twitter 和 Reddit 上有什么新进展"

    推荐理由

    💡 个人使用心得:

    作为一个每天和各种 AI Agent 打交道的人,Agent-Reach 解决了我最大的痛点——Agent 的「互联网盲区」。以前让 Claude Code 去查个资料,它只能靠内置知识或者我手动复制粘贴;现在装上 Agent-Reach 后,它能自己去看 Twitter 讨论、读 Reddit 帖子、甚至总结 YouTube 视频内容。

    最让我印象深刻的是它的「能力层」设计理念:它不自己造轮子,而是帮你在底层选好、装好、配好各个平台的最佳开源工具(twitter-cli、bili-cli、OpenCLI 等)。而且当某个工具失效时(比如 yt-dlp 被 B 站风控封了),它会自动切换备选方案,用户几乎无感。

    另一个亮点是 `agent-reach doctor`——一条命令告诉你每个渠道通不通、走的是哪个后端、怎么修。这种「体检」设计在开源工具里非常少见。

    如果你正在使用 Claude Code、Cursor 或任何 AI 编程助手,强烈建议试试 Agent-Reach。它会让你的 Agent 从「只能写代码的程序员」进化为「能联网调研的全栈工程师」。

    技术架构亮点

    • 多后端路由机制:每个平台维护「首选 + 备选」有序后端列表,某条路失效自动切下一条
    • 零包装层设计:Agent 直接调用上游工具,没有中间封装层,性能损耗最小化
    • SKILL.md 注册制:安装后在 Agent skills 目录注册使用指南,Agent 自动知道该调什么
    • 安全优先:Cookie 仅存本地(权限 600)、支持安全模式和 Dry Run、代码完全可审计
    • 跨平台兼容:macOS / Linux / Windows 全平台支持,兼容所有主流 AI Agent

    下载地址

    GitHub 仓库 github.com/Panniantong/Agent-Reach
    PyPI 安装 pip install agent-reach
    开源协议 MIT License
    Star 数量 ⭐ 30K+ Stars
  • LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    🔍

    LightRAG

    轻量级知识图谱RAG框架 – 微软GraphRAG的高效替代方案

    🏫 香港大学
    📄 EMNLP 2025
    ⭐ 2.4K+ Stars

    📋 项目简介

    LightRAG 是由香港大学数据科学实验室(HKUDS)开发的轻量级、基于知识图谱的检索增强生成(RAG)框架。作为微软GraphRAG的高效替代方案,LightRAG专为法律、医疗、金融等复杂文档分析场景设计,支持多模态文档处理。其创新的双层级检索架构同时管理知识图谱(KG)和向量嵌入,解决了传统GraphRAG大规模数据处理时的高算力开销、响应慢、增量更新成本高等瓶颈问题。

    ⚙️ 安装要求

    ⚠️ 环境要求

    • Python 3.10 及以上
    • 推荐使用 uv 包管理工具(比 pip 性能更优)
    • 前端构建依赖:bun(如需自行构建WebUI)

    快速安装(三种方式)

    方式一:从PyPI安装(推荐)

    # 安装带API服务的LightRAG
    uv tool install "lightrag-hku[api]"
    
    # 构建前端产物
    cd lightrag_webui
    bun install --frozen-lockfile
    bun run build
    cd ..
    
    # 配置环境变量后启动服务
    cp env.example .env  # 修改.env中的LLM和嵌入模型配置
    lightrag-server

    方式二:从源码安装

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    
    # 一键初始化开发环境(自动安装所有依赖+构建前端)
    make dev
    
    source .venv/bin/activate  # Windows用 .venv\Scripts\activate
    
    # 配置环境变量后启动服务
    make env-base  # 生成.env配置文件
    lightrag-server

    方式三:Docker部署

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    cp env.example .env  # 修改LLM和嵌入模型配置
    docker compose up

    ✨ 核心功能

    🔍 双层级检索架构

    同时管理知识图谱(KG)和向量嵌入,弥合传统向量RAG和图RAG的技术鸿沟。支持5种查询模式:local(局部上下文)、global(宏观主题)、hybrid(融合模式)、naive(传统向量检索)、mix(默认,最全面)

    ⚡ 增量更新能力

    支持知识库无缝增量更新,新数据通过标准图索引pipeline生成局部图后直接合并到现有图谱,无需重构全局索引。删除文档时可基于构建阶段的LLM缓存快速重建受影响的关系,更新效率极高。

    🎯 多模态文档处理

    v1.5版本起支持多模态文档分析,文档处理管道支持MinerU、Docling、Native等多解析引擎,可高效提取文档中的文本、表格、公式、图像,实现跨模态实体和关系的统一映射与索引。

    💰 成本优势

    无需生成低效的社区报告或多跳推理来处理复杂查询,大幅减少索引和查询阶段的LLM调用次数,降低响应延迟和算力成本。在农业、计算机科学、法律、混合领域四类测试集上,性能均显著优于NaiveRAG、RQ-RAG、HyDE、GraphRAG等基线方法。

    🗄️ 多存储后端支持

    支持4类存储(KV存储、向量存储、图存储、文档状态存储)的灵活配置。生产环境可选择PostgreSQL、MongoDB、OpenSearch等统一后端,也可分别搭配Milvus/Qdrant做向量存储、Neo4j/Memgraph做图存储。

    🎯 典型使用场景

    📄 场景一:垂直领域复杂文档分析

    适用场景:法律合同审查、医疗病历分析、金融研报解读等需要深度上下文理解、逻辑推理的场景。
    优势:LightRAG的图索引能力可捕捉实体间复杂语义依赖,生成质量优于传统RAG。例如在法律领域,其全面性指标达到83.6%,远超NaiveRAG的16.4%。

    🏢 场景二:大规模知识库构建

    适用场景:需要处理海量文档、且知识库需要频繁更新迭代的企业知识库、技术文档站等。
    优势:LightRAG的增量更新能力可大幅降低更新成本,支持30B参数级开源模型也可达到高精度。无需每次都重构全局索引,显著提升运维效率。

    🚀 场景三:生产级RAG系统部署

    适用场景:企业级RAG应用,对高可用、低延迟、安全性有严格要求。
    优势:可通过配置统一存储后端、本地部署嵌入/重排序模型、调整并发参数,满足企业级部署需求。支持引用溯源、文档删除、RAGAS评估集成、Langfuse链路追踪等生产特性。

    💡 推荐理由

    作为一名经常与RAG系统打交道的开发者,我必须说 LightRAG 是我近期见过的最务实的RAG框架创新。它并没有试图颠覆什么,而是精准地解决了GraphRAG在实际落地时的三大痛点:算力开销高、更新成本高、响应速度慢

    最让我印象深刻的是它的增量更新能力。在传统GraphRAG中,每次添加新文档都需要重构整个知识图谱,这在动态知识库场景下几乎是不可接受的。而LightRAG通过局部图合并策略,实现了真正的无缝增量更新,这让它在企业级应用场景中具备了极强的竞争力。

    另外,它的多模态支持也非常实用。在现代文档中,表格、公式、图片的信息同样重要,但传统RAG往往只能处理纯文本。LightRAG v1.5通过集成MinerU、Docling等解析引擎,真正实现了对复杂文档的全面理解。

    当然,它并不是完美的。相比成熟的商业化方案,LightRAG在文档量和用户友好度上还有提升空间。但考虑到它是开源且活跃维护的项目,而且已经有EMNLP 2025论文背书,我相信它会成为RAG领域的一个重要里程碑。

    适用人群:如果你正在构建需要处理复杂文档的RAG系统,或者对GraphRAG的性能和成本不满,LightRAG绝对值得一试。特别是对于法律、医疗、金融等垂直领域的应用,它的知识图谱能力会让你事半功倍。

    ─────────────────── ✨ ✨ ✨ ───────────────────

    LightRAG 为RAG系统提供了一种更高效、更经济的解决方案。无论是构建企业知识库、垂直领域问答系统,还是进行RAG相关研究,它都是一个值得深入探索的优秀工具。

    你是否也在使用RAG技术? 欢迎在评论区分享你的经验和想法!

  • Open-WebUI:自托管AI平台,打造专属的ChatGPT体验

    在本地运行大语言模型(LLM)已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面,而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台,让你在本地也能享受媲美ChatGPT的使用体验。

    项目简介

    Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台,支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器,并内置RAG(检索增强生成)推理引擎。目前GitHub Stars已超过105,000+,是本地AI部署的首选界面方案。

    安装要求和过程

    环境要求

    • Python方式:需要 Python 3.11(避免使用其他版本以免兼容性问题)
    • Docker方式:需要安装Docker,建议使用GPU环境以获得更好性能
    • Ollama:如需本地运行模型,需提前安装Ollama
    • 存储空间:至少预留5GB空间用于模型和数据集

    快速安装步骤

    方式一:Python pip安装(最简单)

    # 安装项目
    pip install open-webui
    
    # 启动服务,访问地址:http://localhost:8080
    open-webui serve
    

    方式二:Docker快速部署(推荐)

    # 基础部署(Ollama在本地)
    docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main
    
    # 访问地址:http://localhost:3000
    

    方式三:一体化部署(包含Ollama)

    # 带GPU支持
    docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    
    # 仅CPU
    docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    

    核心功能

    • 多模型兼容:无缝集成Ollama、OpenAI API,支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务,一个界面管理所有AI模型。
    • 本地RAG能力:内置检索增强生成引擎,支持9种向量数据库(ChromaDB、PGVector、Qdrant、Milvus等),可直接上传文档进行智能问答。
    • 多模态交互:支持语音/视频通话,集成多种语音转文本和文本转语音引擎;支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
    • 权限管理:细粒度用户角色与权限控制,支持LDAP/AD集成、SSO单点登录,适合团队和企业部署。
    • 插件扩展:支持Pipelines插件框架,可自定义业务逻辑(函数调用、用户限流、实时翻译、内容过滤等)。

    典型使用场景

    场景一:个人本地AI助手

    通过Docker一键部署Open-WebUI + Ollama,在本地运行Llama 3、Mistral等开源模型。所有数据完全离线,保障隐私安全;同时获得与ChatGPT媲美的Web交互体验,支持多轮对话、Markdown渲染、代码高亮等功能。

    场景二:团队协作AI平台

    利用Open-WebUI的权限管理和SSO集成能力,为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限,对接企业内部知识库实现RAG问答,并监控API使用量和成本。

    场景三:AI应用开发测试

    开发者可使用Open-WebUI快速测试不同LLM模型的效果,通过模型构建器自定义提示词和角色,利用Python函数调用扩展自定义能力,加速AI应用的原型开发和测试验证。

    推荐理由

    Open-WebUI是我试用过的最优秀的本地LLM Web界面,没有之一。它的设计非常贴合实际使用场景:响应式界面适配各种设备,PWA支持让你可以像原生App一样使用,RAG功能让你可以轻松对接个人知识库。

    相比其他类似工具,Open-WebUI的最大优势在于完整性和成熟度:它不仅有精美的界面,还有完整的企业级功能(权限管理、SSO、监控等),同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队,都能找到适合自己的部署方式。

    特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用,支持多种向量数据库和搜索引擎,真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面,Open-WebUI绝对值得一试。

    下载地址

    如果你觉得这个项目有帮助,欢迎到GitHub上点个Star支持开发者!

  • 【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    🚀 aisuite
    Simple, unified interface to multiple Generative AI providers
    ⭐ 14,500+ Stars  |  🍴 1,500+ Forks  |  🐍 Python  |  📜 MIT License

    📌 项目简介

    aisuiteAndrew Ng(吴恩达)团队开源的轻量级 Python 库,通过一套统一 API 接口同时调用 OpenAI、Anthropic、Google、Mistral、AWS、Ollama 等 14+ 个 AI 大模型提供商。只需修改一个字符串即可切换模型,彻底告别各家 SDK 差异带来的适配噩梦。

    该项目采用两层架构:底层是统一 Chat Completions API(兼容 OpenAI 格式),上层是带工具调用的 Agents API。同仓库还包含基于 aisuite 构建的桌面 AI 助手 OpenCoworker

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.9+
    • 各 AI 提供商的 API Key(或本地 Ollama)
    • 磁盘空间:约 50MB(基础包)

    快速安装(3步)

    # 基础安装(不含提供商 SDK)
    pip install aisuite
    
    # 安装时附带指定提供商的 SDK
    pip install 'aisuite[anthropic]'
    pip install 'aisuite[openai]'
    pip install 'aisuite[google]'
    
    # 安装所有提供商 SDK(完整版)
    pip install 'aisuite[all]'

    API Key 配置

    # 设置环境变量(Linux/macOS)
    export OPENAI_API_KEY="sk-your-key"
    export ANTHROPIC_API_KEY="sk-ant-your-key"
    
    # Windows PowerShell
    $env:OPENAI_API_KEY = "sk-your-key"
    $env:ANTHROPIC_API_KEY = "sk-ant-your-key"

    ✨ 核心功能

    ① 统一 Chat Completions API —— 一行切换模型
    模型名格式 <provider>:<model-name>,修改一个字符串即可在不同提供商之间切换,所有核心参数(temperature、max_tokens、tools 等)均为提供商无关。

    ② Agents API —— 让模型使用真实工具
    传入普通 Python 函数即可获得工具调用能力,aisuite 自动生成 JSON Schema、执行函数调用、将结果反馈给模型。max_turns 参数控制多轮对话,也可手动控制每一轮。

    ③ Toolkits —— 开箱即用的工具集
    内置 files(文件操作)、git(版本控制)、shell(命令行)等工具集,也可接入任意 MCP 服务器,让 Agent 获得文件系统、浏览器自动化等真实能力。

    ④ 生产级 Agent 管控
    支持 Tool Policies(工具调用审批策略)、State Stores(跨进程持久化对话状态,支持内存/文件/Postgres)、Artifacts & Tracing(完整记录 Agent 产出和每一步执行轨迹)。

    ⑤ OpenCoworker —— 开箱即用的桌面 AI 助手
    同仓库附赠 OpenCoworker 桌面应用(macOS/Windows),能聊天、做深度研究、读写文件、收发消息(Slack/Email)、生成 PDF 报告,并支持定时自动化任务(如每日新闻摘要)。数据完全留在本地。

    🎯 典型使用场景

    场景一:多模型对比评测
    研究人员可以用同一段代码,分别调用 GPT-4o、Claude 3.5 Sonnet 和 Gemini Pro,对比不同模型在同一 Prompt 下的响应质量,而无需维护三套 SDK 调用代码。aisuite 让 A/B 测试大模型 变得极其简单。

    场景二:构建支持多提供商的 AI 产品
    SaaS 产品需要同时支持 OpenAI 和 Anthropic,或允许用户选择自己偏好的模型。使用 aisuite,产品代码只需维护一套接口,后端根据配置动态路由到不同提供商,大幅降低维护成本。

    场景三:本地 + 云端混合部署
    开发阶段使用免费本地模型 Ollama,上线后切换到 OpenAI API。aisuite 让这种切换只需改一个字符串("ollama:llama3""openai:gpt-4o"),无需改动任何业务逻辑代码。

    💡 推荐理由

    Andrew Ng 亲自站台的项目,质量有保障。我推荐它的核心原因是它解决了一个真实存在的痛点:每家 AI 公司的 API 都不一样。OpenAI 用一套格式,Anthropic 用另一套,Google 又是另一套……如果你要同时支持多家,代码里全是 if provider == "openai" 这种恶心的判断逻辑。

    aisuite 把这一切统一了。它的 API 设计完全兼容 OpenAI 的 Chat Completions 格式,其他提供商只是”适配层”,对使用者完全透明。这种设计意味着你现有的 OpenAI 代码几乎不用改,就能无缝迁移到 Claude 或 Gemini。

    更让人惊喜的是它的 Agents API 设计——传入普通 Python 函数就能让模型调用工具,不需要手写 JSON Schema。加上对 MCP(Model Context Protocol)的原生支持,未来接入各种工具生态会很方便。

    如果你正在做 AI 应用开发,或者需要对比评测多个大模型,aisuite 是目前最优雅的解决方案,没有之一。

    📥 下载地址

    🌐 官方网站:
    github.com/andrewyng/aisuite
    💻 快速安装:
    pip install aisuite
    💬 Discord 社区:
    discord.gg/T6Nvn8ExSb

    🔌 支持的 AI 提供商

    提供商 模型示例 调用格式
    OpenAI gpt-4o, gpt-4-turbo openai:gpt-4o
    Anthropic claude-3-5-sonnet anthropic:claude-3-5-sonnet-20240620
    Google gemini-pro, gemini-1.5-pro google:gemini-pro
    Mistral mistral-large, mixtral-8x7b mistral:mistral-large
    Ollama(本地) llama3, mistral, codellama ollama:llama3
    AWS Bedrock anthropic.claude-3-5-sonnet bedrock:anthropic.claude-3-5-sonnet
    Hugging Face 任意 HF 模型 huggingface:model-name

    📅 文章发布时间:2026 年 6 月 15 日
    📜 开源协议:MIT License(可自由用于商业和非商业项目)

  • 【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    Open WebUI

    Open WebUI – 自托管 AI 聊天界面

    📦 项目简介

    Open WebUI 是一个用户友好的自托管 AI 界面,支持 Ollama、OpenAI API 等多种 LLM 服务,可完全离线运行。它提供了类似 ChatGPT 的优雅聊天体验,同时保障数据隐私,是企业和个人部署本地 AI 能力的首选前端方案。

    ⭐ 142K+ Stars
    🍴 20.3K+ Forks
    🐍 Python + Svelte
    📦 Docker 一键部署

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.11(pip 安装方式必须使用此版本)
    • Docker(推荐,最简单)
    • Ollama(如需本地模型,可选)
    • 磁盘空间:至少 2GB(含依赖和模型)

    方式一:Docker 安装(推荐)

    # 基础安装(Ollama 在本地)

    docker run -d -p 3000:8080 \
      –add-host=host.docker.internal:host-gateway \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:main

    # 内置 Ollama(CPU)

    docker run -d -p 3000:8080 \
      -v ollama:/root/.ollama \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:ollama

    方式二:Python pip 安装

    pip install open-webui
    open-webui serve

    ⚠️ 注意:必须使用 Python 3.11,避免兼容性问题!

    安装完成后访问 http://localhost:8080 即可使用。

    ✨ 核心功能

    🤖 1. 多模型兼容

    原生支持 Ollama、OpenAI 兼容 API,可对接 LMStudio、GroqCloud、Mistral、OpenRouter 等第三方服务。支持同时调用多个模型,获取最优输出结果。

    📚 2. RAG 检索增强生成

    支持 9 种向量数据库(ChromaDB、PGVector、Qdrant 等),多种内容提取引擎。可上传文档到知识库,通过 # 命令快速调用文档内容,打造私人知识助手。

    🔍 3. 联网搜索能力

    支持 15+ 搜索引擎(SearXNG、Google PSE、Brave Search 等)的 RAG 联网搜索,可直接输入 URL 引用网页内容到对话中,让 AI 获取实时信息。

    🎨 4. 多模态交互

    支持语音/视频通话,集成多种语音转文字、文字转语音引擎。支持图像生成与编辑,可对接 DALL-E、Gemini、ComfyUI、AUTOMATIC1111 等引擎。

    🔧 5. 企业级管理能力

    支持基于角色的访问控制(RBAC)、LDAP/AD 认证集成、SSO 单点登录。数据库支持 SQLite 和 PostgreSQL,存储可对接 S3、Azure Blob,支持水平扩展。

    🚀 典型使用场景

    场景一:个人本地 AI 助手

    搭配 Ollama 使用,在本地运行 Llama 3、Mistral、Gemma 等开源模型。所有对话数据完全离线,保障隐私安全。无需联网,随时随地使用 AI 助手。

    场景二:企业内网 AI 中台

    通过 Open WebUI 搭建企业内部 AI 平台,对接公司私有 LLM API 或本地部署的开源模型。支持用户权限管理、对话历史保存、知识库共享,让团队成员安全高效地使用 AI。

    场景三:RAG 知识库问答

    上传公司文档、技术手册、FAQ 到 Open WebUI 知识库,即可通过对话快速检索相关内容。支持 PDF、Word、Markdown 等多种格式,结合 RAG 技术实现精准问答。

    💡 推荐理由

    Open WebUI 是我见过最优雅的自托管 AI 界面。如果你在本地用 Ollama 跑模型,或者想给企业搭一个私有的 AI 聊天平台,Open WebUI 几乎是不二之选

    它的体验非常接近 ChatGPT——响应式界面、Markdown 渲染、代码高亮、多会话管理,一应俱全。但更重要的是数据主权:你可以让所有 AI 交互发生在自己的服务器上,不用担心对话记录被第三方留存。

    另外,它的 RAG 知识库联网搜索功能非常实用,让本地模型也能获取实时信息和私有文档内容。如果你关心 AI 隐私和数据安全,Open WebUI 值得一试。

  • 【开源推荐】LangChain:139K+ Stars!AI Agent 工程平台,构建 LLM 应用的标准框架

    【开源推荐】LangChain:139K+ Stars!AI Agent 工程平台,构建 LLM 应用的标准框架

    LangChain

    ⭐ GitHub 139K+ Stars

    LangChain

    AI Agent 工程平台 – 构建 LLM 应用的标准框架

    📝 项目简介

    LangChain 是一个强大的 AI Agent 工程平台,为构建 LLM 驱动的应用提供完整的框架和工具链。它提供模块化的组件、丰富的集成库和灵活的抽象层,让开发者能够快速原型设计、轻松集成外部数据源,并将应用规模化部署到生产环境。无论是简单的聊天机器人还是复杂的多 Agent 系统,LangChain 都能提供最佳实践和技术支撑。

    139K+
    GitHub Stars

    23.1K+
    Forks

    MIT
    开源协议

    Python
    主要语言

    ⚙️ 安装要求

    环境要求

    • Python 3.9+ (推荐 3.10 或更高版本)
    • pip 或 uv 包管理器
    • LLM API Key(OpenAI / Anthropic / Google 等)
    • 可选:向量数据库(Chroma / Pinecone / Qdrant 等)

    快速安装

    Bash
    # 使用 uv 安装(推荐)
    uv add langchain
    
    # 或使用 pip
    pip install langchain
    
    # 安装特定集成(例如 OpenAI)
    pip install langchain-openai
    
    # 安装社区集成(例如 Hugging Face)
    pip install langchain-community

    核心功能

    🔗 模块化组件架构

    提供 LLM、Chat Models、Prompt Templates、Chains、Agents、Tools、Memory、Retrievers 等标准化模块,每个组件都可独立使用和组合,支持快速搭建复杂 AI 应用。

    🔌 丰富的集成生态

    支持 100+ 模型提供商(OpenAI、Anthropic、Google、Hugging Face 等)、50+ 向量存储(Chroma、Pinecone、Qdrant、FAISS 等)、30+ 工具集成,开箱即用。

    🤖 强大的 Agent 框架

    内置多种 Agent 类型(ReAct、Plan-and-Execute、OpenAI Tools 等),支持工具调用、记忆管理、多轮对话,可构建具有推理和行动能力的智能 Agent。

    📚 RAG 完整支持

    提供从文档加载、文本分割、向量化到检索的完整 RAG 管道,支持多种文档格式(PDF、HTML、Markdown 等)和检索策略(相似度搜索、MMR、Hybrid 等)。

    🚀 生产就绪工具链

    与 LangSmith 深度集成,提供追踪、评估、调试、监控能力;支持流式输出、异步调用、批量处理,满足高并发生产场景需求。

    💡 典型使用场景

    场景 1

    📊 企业知识库问答系统

    使用 LangChain 的 RAG 能力,将企业文档(PDF、Word、HTML)向量化存储,构建能够准确引用来源的智能问答系统。支持多轮对话、上下文记忆和来源追溯。

    from langchain_community.vectorstores import Chroma
    from langchain_openai import OpenAIEmbeddings
    from langchain.chains import create_retrieval_chain
    
    # 加载文档并构建向量库
    embeddings = OpenAIEmbeddings()
    vectorstore = Chroma.from_documents(docs, embeddings)
    
    # 创建检索问答链
    retriever = vectorstore.as_retriever()
    qa_chain = create_retrieval_chain(retriever, ...)

    场景 2

    🤖 智能客服 Agent

    利用 LangChain 的 Agent 和 Tools 机制,让 AI 能够调用订单查询、物流追踪、退款处理等 API,自动完成复杂的客户服务流程,支持多步骤推理和错误处理。

    from langchain.agents import create_tool_calling_agent
    from langchain.tools import Tool
    
    tools = [
        Tool(name="订单查询", func=query_order, ...),
        Tool(name="退款处理", func=process_refund, ...)
    ]
    
    agent = create_tool_calling_agent(llm, tools, prompt)

    场景 3

    ✍️ 内容生成与摘要

    结合 Prompt Templates 和 Chains,构建自动化的内容生成流水线,支持博客文章、产品描述、会议纪要摘要等场景,可集成到现有 CMS 或自动化工作流中。

    from langchain.chains import LLMChain
    from langchain.prompts import PromptTemplate
    
    template = "根据以下要点生成博客文章:\n{points}\n文章风格:{style}"
    
    chain = LLMChain(llm=llm, prompt=PromptTemplate.from_template(template))
    result = chain.invoke({"points": "...", "style": "专业且易懂"})

    💝 推荐理由

    LangChain 是我接触过的最成熟的 LLM 应用开发框架,没有之一。它不仅仅是一个库,更是一个完整的 AI Agent 工程平台

    生态极其丰富: 无论你想接入哪个模型、哪个向量库、哪个数据源,几乎都能找到现成的集成,省去了大量重复造轮子的时间。

    抽象设计优秀: 从底层的 LLM 调用到高层的 Agent 编排,LangChain 提供了多层次的抽象,既能快速 prototyping,也能精细控制每个环节。

    社区活跃度高: 139K+ Stars 不是虚的,GitHub 上每天都有新的讨论、PR 和案例分享,遇到问题几乎都能找到答案。

    生产工具完善: LangSmith 的集成让调试和监控变得异常简单,这是很多同类框架做不到的。

    如果你正在考虑用哪个框架来构建 AI 应用,LangChain 绝对是首选。它已经成为了这个领域的”标准”,学习它永远不会错 🚀

    ···

    Tags
    #LangChain
    #AI Agent
    #LLM
    #Python
    #RAG
    #Agent工程

  • Microsoft AutoGen – 微软开源多智能体AI协作框架 [58.7K+ Stars]

    Microsoft AutoGen – 微软开源多智能体AI协作框架 [58.7K+ Stars]





    Microsoft AutoGen – 微软开源多智能体AI协作框架


    AutoGen Logo

    Microsoft AutoGen 官方Logo

    📝 项目简介

    Microsoft AutoGen 是微软推出的开源多智能体AI对话框架,通过可定制、可对话的智能体集成LLM、工具和人类参与,实现复杂任务的自主协作求解,是构建下一代AI Agent应用的核心基础设施。

    58.7K+
    GitHub Stars

    533+
    贡献者

    0.2.x
    最新版本

    ⚙️ 安装要求和过程

    环境要求

    • Python版本:3.8 及以上
    • 依赖项:OpenAI SDK 或其他LLM提供商SDK
    • 可选:Docker(用于代码执行环境)

    快速安装步骤

    方法一:使用 pip 安装(推荐)

    pip install pyautogen[blendsearch]

    包含blendsearch用于超参数优化

    方法二:从源码安装

    git clone https://github.com/microsoft/autogen.git
    cd autogen
    pip install -e .

    配置LLM

    创建配置文件 OAI_CONFIG_LIST

    [
      {
        "model": "gpt-4",
        "api_key": "your-api-key",
        "api_base": "https://api.openai.com/v1"
      }
    ]

    ✨ 核心功能

    🤖 1. 多智能体协作

    支持多个Agent自主对话和协作,每个Agent可以扮演不同角色(如助手、用户代理、代码执行器等),通过对话完成复杂任务。

    💻 2. 内置代码执行

    UserProxyAgent 可自动执行生成的代码,支持Python代码执行,并可配置Docker环境实现安全的隔离执行。

    🔧 3. 工具集成

    轻松集成外部工具和API,支持函数调用、工具注册,让Agent能够使用搜索引擎、数据库、计算器等工具。

    🎭 4. 灵活的Agent定制

    通过register_reply()方法注册自定义回复函数,灵活定义Agent的行为和角色,支持静态和动态对话模式。

    📊 5. 完整可观测性

    提供完整的对话日志和监控功能,方便调试和优化Agent行为,支持对话流的可视化分析。

    🎯 典型使用场景

    场景一:自动化数据分析与报告生成

    应用案例:企业需要定期分析销售数据并生成报告。

    实现方式

    • AssistantAgent 负责生成数据分析和可视化的Python代码
    • UserProxyAgent 自动执行代码,生成图表和分析结果
    • 多个Agent协作完成数据清洗、分析、可视化、报告撰写全流程

    价值:将原本需要数小时的数据分析工作缩短至几分钟,且可完全自动化执行。

    场景二:智能代码助手与调试

    应用案例:开发者需要快速实现功能并调试代码。

    实现方式

    • 一个Agent充当编程助手,提供代码建议和最佳实践
    • 另一个Agent充当代码审查者,检查代码质量和潜在问题
    • UserProxyAgent执行代码并反馈运行结果

    价值:通过多Agent协作,实现代码的自动生成、测试、调试和优化,显著提升开发效率。

    场景三:复杂任务的自主求解

    应用案例:需要多步骤推理和工具调用的复杂问题(如”今天的日期是什么?今年哪只大型科技股年初至今涨幅最大?涨幅是多少?”)。

    实现方式

    • AssistantAgent生成获取日期和股票数据的代码
    • UserProxyAgent执行代码并获取实时数据
    • Agent之间自主对话,分解任务、执行子任务、整合结果

    价值:展示了AutoGen处理需要外部工具和多步骤推理的复杂任务的能力。

    💡 推荐理由

    作为一名AI开发者和研究者,Microsoft AutoGen 给我留下了深刻印象:

    1. 设计理念先进:AutoGen 将多智能体协作抽象为对话,这种设计非常直观且易于理解。相比于其他框架需要复杂配置,AutoGen 通过简单的 Agent 定义和对话发起,就能实现复杂的多Agent协作。
    2. 实践价值极高:我亲自测试了AutoGen的代码执行功能,UserProxyAgent能够自动执行生成的代码并反馈结果,这个”生成-执行-反馈”的闭环极大提升了任务求解效率。在数据分析任务中,原本需要手动编写和调试代码的过程,现在可以通过自然语言描述需求,让Agent自主完成。
    3. 生态活跃完善:微软团队持续维护,社区贡献活跃,文档详尽。从基础的两Agent对话到复杂的动态群聊、层级对话,官方提供了丰富的示例和教程。而且AutoGen已与Semantic Kernel合并为Microsoft Agent Framework,未来会有更强大的功能集成。
    4. 适用场景广泛:无论是简单的问答系统,还是复杂的自动化工作流,AutoGen都能胜任。特别是对于需要多步骤推理、工具调用、代码生成的任务,AutoGen表现优异。

    💭 个人心得:AutoGen 最大的价值在于降低了多智能体系统开发的门槛。你不需要深入理解复杂的分布式系统或Agent协议,只需要定义Agent的角色和行为,框架就会处理剩下的事情。对于想要快速原型验证AI Agent应用的开发者来说,AutoGen 是不可多得的利器。

    📥 下载地址

    🐍

    PyPI安装

    pip install pyautogen

    Microsoft AutoGen 正在重新定义AI Agent的开发方式。

    无论你是AI研究者、应用开发者,还是对企业自动化感兴趣的技术管理者,

    AutoGen 都值得你深入探索和实践。

    #Microsoft #AutoGen #AIAgent #多智能体 #开源项目


  • 【开源推荐】Qdrant:32.2K+ Stars!Rust 构建的高性能向量数据库,AI 应用的向量检索引擎

    【开源推荐】Qdrant:32.2K+ Stars!Rust 构建的高性能向量数据库,AI 应用的向量检索引擎

    Q
    GitHub 热门 AI 开源项目
    第 29 期

    ⭐ 32.2K+ Stars

    Qdrant —— 为 AI 应用打造的高性能向量数据库

    用 Rust 构建 · 支持稠密/稀疏/多向量 · 生产级分布式部署

    📌 项目简介

    Qdrant 是一个用 Rust 编写的高性能向量数据库和向量搜索引擎,专为新一代 AI 应用设计。它提供生产级服务与便捷 API,支持存储、搜索和管理带附加载荷的向量,是构建 RAG、语义搜索、推荐系统等 AI 应用的理想数据底座。

    32.2K+
    GitHub Stars

    Rust
    核心语言

    97%
    RAM 节省

    ⚙️
    安装要求和过程

    环境要求

    • Docker 20.10+(推荐方式)
    • 或者:Rust 1.70+ 编译环境(源码安装)
    • Python 3.8+(使用 Python 客户端时)
    • 支持 Linux / macOS / Windows (WSL2)

    快速安装(Docker 方式)


    # 1. 拉取并启动 Qdrant(无认证,开发用)
    docker run -p 6333:6333 qdrant/qdrant

    # 2. 访问 Web UI
    open http://localhost:6333/dashboard

    # 3. 使用 Python 客户端
    pip install qdrant-client

    # 4. 源码编译安装(可选)
    git clone https://github.com/qdrant/qdrant.git
    cd qdrant && cargo build --release

    生产部署建议

    • 务必配置 API Key 认证(参考官方安全指南)
    • 使用持久化卷存储向量数据(-v $(pwd)/qdrant_storage:/qdrant/storage
    • 大规模场景启用分布式模式(需要 etcd / 类似协调服务)
    • 启用 TLS 加密传输


    核心功能

    🔍 多类型向量搜索

    同时支持稠密向量(语义相似度)、稀疏向量(全文搜索)、多向量(ColBERT 等延迟交互模型)搜索,一套系统满足多种检索需求。

    🎯 强大的载荷过滤

    为向量附加任意 JSON 载荷,支持关键词匹配、全文检索、数值范围、地理位置等丰富条件过滤,支持 should / must / must_not 条件组合,精准控制搜索范围。

    🔀 混合搜索

    单查询可组合多个向量,兼顾语义理解和关键词精度,支持倒数排名融合(RRF)、基于分布的分数融合(DBSF)等可配置融合策略,搜索效果更佳。

    💾 低成本存储优化

    内置向量量化能力,可降低最高 97% 的 RAM 占用;支持在搜索速度和精度之间按需权衡;同时支持磁盘存储,大幅降低运行成本。

    🚀 分布式高可用

    支持水平扩展,通过分片和副本实现高可用,可零停机更新或调整集合大小;支持 SIMD 硬件加速和 NVIDIA/AMD GPU 加速索引,性能卓越。

    💡
    典型使用场景

    📚 场景一:RAG 知识库问答

    将文档切片向量化后存入 Qdrant,用户提问时先检索最相关的片段,再送给 LLM 生成答案。Qdrant 的混合搜索和载荷过滤能力,让 RAG 系统既能理解语义,又能精确控制知识范围,是目前最流行的 AI 应用架构之一。

    🛒 场景二:电商语义搜索与推荐

    用户搜索”适合夏天透气的跑步鞋”,传统关键词搜索无法理解意图,而 Qdrant 的语义向量搜索能直接找到最相关的商品。再结合用户行为向量做个性化推荐,可大幅提升转化率和用户体验。

    🖼️ 场景三:图像/音频相似检索

    通过 CLIP 等多模态模型将图片/音频编码为向量,存入 Qdrant 后便可实现”以图搜图”、”相似音乐推荐”等功能。短视频平台、版权图库、人脸检索等场景均有广泛应用。

    💬 推荐理由

    如果你正在构建任何需要”理解语义”的 AI 应用,Qdrant 几乎是不二之选。作为向量数据库赛道的明星项目,它用 Rust 编写,性能和安全都有保障;API 设计简洁直观,Python 客户端几分钟就能上手;最关键的是,它不只是”能跑”,而是真正为生产环境设计——分布式、高可用、量化压缩、硬件加速,这些特性在大规模部署时价值巨大。

    我个人最喜欢它的混合搜索能力:语义向量 + 关键词 BM25 融合,再结合载荷过滤,搜索结果的质量比单纯向量检索高出一大截。加上活跃的开源社区和 Qdrant Cloud 托管选项,无论个人项目还是企业落地,都能找到合适的接入方式。2026 年做 AI 应用,向量数据库是必选项,Qdrant 值得放在你的技术选型清单首位。

    🔖 标签:AI · GitHub · 开源 · 向量数据库 · RAG · LLM · Rust · 语义搜索

    ⏱️ 预计阅读时间:6 分钟 | 更新时间:2026年6月14日

  • 【开源推荐】Dify:145K+ Stars!开源LLM应用开发平台,可视化构建AI工作流与RAG管道

    【开源推荐】Dify:145K+ Stars!开源LLM应用开发平台,可视化构建AI工作流与RAG管道

    Dify:145K+ Stars!开源LLM应用开发平台,可视化构建AI工作流

    TypeScript + Python 全栈 · Docker 一键部署 · 集成数百款LLM模型

    📌 项目简介

    Dify 是一款开源的大语言模型(LLM)应用开发平台,由 LangGenius 团队开发,已加入 Linux 基金会。它具备直观的可视化界面,整合了 AI 工作流、RAG 管道、智能体能力、模型管理和可观测性功能,帮助开发者快速完成从原型到生产环境的落地。截至 2026 年 6 月,Dify 在 GitHub 已获得 145,000+ Stars,是全球最受欢迎的 LLM 应用开发框架之一。

    145K+
    GitHub Stars

    50+
    内置工具集成

    300+
    LLM模型支持

    Apache-2.0
    开源协议

    🔧 安装要求和过程

    方式一:Docker Compose 部署(推荐,最快5分钟上线)

    环境要求:CPU ≥ 2核,内存 ≥ 4GiB,已安装 Docker 和 Docker Compose

    # 克隆仓库
    git clone https://github.com/langgenius/dify.git
    cd dify/docker
    
    # 复制环境配置
    cp .env.example .env
    
    # 启动服务(后台运行)
    docker compose up -d
    
    # 访问安装页面
    # 浏览器打开 http://localhost/install

    启动后访问 http://localhost/install 完成管理员账号初始化,即可开始使用。

    方式二:从源码部署(适合开发者定制)

    # 后端启动(Python 3.11+)
    cd api
    poetry install
    poetry run flask db upgrade
    poetry run flask run --host 0.0.0.0 --port 5001
    
    # 前端启动(Node.js 18+)
    cd web
    npm install
    npm run dev

    方式三:云服务版(无需部署,立即使用)

    直接访问 https://cloud.dify.ai 注册即用,免费版包含 200 次 OpenAI 调用额度。

    ⚡ 核心功能

    🎨 可视化工作流编排

    在画布上通过拖拽节点即可构建复杂的 AI 工作流,支持条件分支、循环、变量传递和并行执行。无需编写代码,产品、运营同学也能搭建生产级 AI 应用。

    🤖 全模型支持 & RAG 管道

    无缝集成 GPT、Claude、Llama3、Mistral、Gemini 等 300+ 专有/开源 LLM,兼容所有 OpenAI API 规范的模型。内置完整的 RAG 管道,支持从 PDF、PPT、Word 等常见文档格式中提取文本并建立知识库。

    🛠️ 智能体 + 50+ 内置工具

    基于 LLM Function Calling 或 ReAct 模式定义智能体,内置 Google 搜索、DALL·E、Stable Diffusion、WolframAlpha 等 50+ 工具,同时支持自定义工具接入,真正让 AI 能”做事”而不仅仅是”说话”。

    📊 Prompt IDE + 可观测性

    提供直观的 Prompt 编写和调试界面,支持对比不同模型性能表现。集成 Opik、Langfuse、Arize Phoenix 等可观测性工具,实时追踪 LLM 推理成本、延迟和准确率,让 AI 应用可监控、可优化。

    🔌 丰富 API & 生态集成

    提供完整的 REST API 和 SDK,支持将 Dify 应用嵌入到自有产品中。同时支持与 LangChain、Semantic Kernel 等框架集成,也可通过 AWS CDK、Terraform、Kubernetes 等方式部署到云端。

    💡 典型使用场景

    🏢

    企业知识库问答

    上传公司文档、产品手册、FAQ 建立知识库,构建基于 RAG 的智能客服或内部知识助手,准确回答员工和客户的提问,减少人工客服压力。

    🤖

    AI 工作流自动化

    用可视化画布编排多步骤 AI 任务:自动抓取网页内容 → 提取关键信息 → 调用 LLM 总结 → 发送邮件通知,全程无需写代码,像搭积木一样构建自动化流程。

    🚀

    快速 AI 产品原型验证

    产品团队在几小时内完成 AI 功能原型设计,通过 Dify 的 Playground 实时测试不同模型效果,快速验证产品想法,大幅缩短从创意到落地的周期。

    🌟 推荐理由

    作为一名开发者,我推荐 Dify 的最大理由是“它把 AI 应用开发从『写代码』变成了『搭积木』”。以前要集成 LLM、做 RAG、写 Agent 逻辑,需要深厚的 Full Stack 和 AI 工程经验;现在用 Dify 的可视化画布,产品、运营甚至非技术同学都能搭建出生产级的 AI 应用。

    另一个亮点是私有化部署能力。对于数据敏感的企业用户,Dify 可以完全部署在内部服务器,数据不出企业内网,同时享受和云服务版一样的功能体验。加上它对国产大模型(如通义千问、文心一言、智谱 GLM)的良好支持,在国内落地场景非常有优势。

    145K+ Stars 不是偶然。Dify 正在成为 AI 应用时代的”WordPress”——让每个人都能轻松拥有自己的 AI 应用。无论你是个人开发者、创业团队还是大型企业,Dify 都值得一试。

    📦 下载地址

    开源协议:Apache-2.0(附加 Dify 开源条款) · 主要语言:TypeScript 51.5% / Python 44.1%

  • 【开源推荐】Open Notebook:29.9K+ Stars!Notebook LM 开源替代品,隐私优先+18家AI模型随意切换

    【开源推荐】Open Notebook:29.9K+ Stars!Notebook LM 开源替代品,隐私优先+18家AI模型随意切换

    📌 项目简介

    Open Notebook 是 Google Notebook LM 的开源替代品,隐私优先、支持自托管,兼容 18+ AI 服务商(OpenAI、Anthropic、Ollama 等),让你完全掌控研究数据,不再受大厂绑定。

    29.9K+
    GitHub Stars

    18+
    AI 服务商

    100%
    数据自主

    MIT
    开源协议

    ⚙️ 安装要求和过程

    环境要求

    • 仅需安装 Docker Desktop(所有平台通用)
    • 支持 Windows / macOS / Linux
    • 需要约 2GB 磁盘空间

    快速安装(3 步搞定)

    # 第1步:下载 docker-compose.yml
    curl -o docker-compose.yml https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml

    # 第2步:修改加密密钥(可选但推荐)
    # 编辑 docker-compose.yml,修改 OPEN_NOTEBOOK_ENCRYPTION_KEY

    # 第3步:启动服务
    docker compose up -d

    # 等待 15-20 秒后访问
    浏览器打开 http://localhost:8502

    安装完成后在浏览器打开 http://localhost:8502 即可使用,AI 密钥可在 Web UI 中配置,无需提前写入配置文件。

    ✨ 核心功能

    🔒
    隐私优先,数据自主

    自托管部署,所有研究数据存储在本地,完全不受 Google 服务器约束。支持 Docker / 云端 / 本地多种部署方式。

    🤖
    18+ AI 服务商兼容

    原生支持 OpenAI、Anthropic、Google、Groq、Ollama、DeepSeek、Mistral、xAI 等 18+ 家,也支持任意 OpenAI 兼容接口(LM Studio 等)。

    🎙️
    专业多角色播客生成

    支持 1-4 个可自定义角色的播客生成,比 Notebook LM 的 2 角色更灵活,可打造个性化内容输出。

    🔍
    全文 + 向量语义双搜索

    所有上传内容同时支持关键词全文检索和向量语义搜索,快速定位研究资料中的关键信息。

    完整 REST API

    提供完整的 REST API 接口,支持全流程程序化调用,可集成到现有工作流或自动化系统中。

    💡 典型使用场景

    场景一:学术研究资料管理

    上传论文 PDF、会议视频、网页资料,让 AI 基于你的资料库进行问答和总结。数据完全本地存储,敏感研究内容不外泄。

    场景二:多模型对比研究

    同时配置 OpenAI、Anthropic、DeepSeek 等多个模型,在同一套资料上对比不同模型的分析能力,选出最适合的模型。

    场景三:团队知识库 + 播客输出

    将团队文档、会议记录导入 Open Notebook,用 AI 生成洞察;还可将研究成果一键转换为多角色播客,方便团队内部分享。

    ⚡ Open Notebook vs Notebook LM

    对比维度 Open Notebook Notebook LM
    数据隐私 ✅ 自托管,完全自主 ❌ 仅 Google 云端
    AI 模型选择 ✅ 18+ 家,含本地模型 ❌ 仅 Google 模型
    播客角色数 ✅ 1-4 个可自定义 ⚠️ 仅 2 个
    API 访问 ✅ 完整 REST API ❌ 无
    成本 ✅ 只需支付 AI 调用费 ⚠️ 免费层 + 月费订阅
    开源定制 ✅ MIT 协议,完全可改 ❌ 封闭系统

    💬 推荐理由

    Google Notebook LM 确实好用,但它有两个痛点:数据在 Google 服务器上,以及只能用 Google 的模型。如果你研究的内容比较敏感,或者想用 DeepSeek / 本地 Ollama 来节省成本,Notebook LM 就没法满足你了。

    Open Notebook 最大的价值就是把控制权还给你:数据存在自己服务器上,想用哪个 AI 就用哪个,甚至可以在完全没有外网的环境里跑本地模型。而且它还有完整 REST API,可以接入自己的自动化流程。

    部署也超级简单,会 Docker 就能跑,三行命令搞定。如果你一直在找 Notebook LM 的平替,这个项目值得一试。开源、免费、不绑架数据,还要什么自行车?

    🤖 已支持 AI 服务商(部分)

    OpenAI
    Anthropic
    Google GenAI
    Groq
    Ollama
    DeepSeek
    Mistral
    xAI (Grok)
    OpenRouter
    Azure OpenAI
    Vertex AI
    MiniMax
    DashScope (Qwen)
    LM Studio