标签: 开源

  • browser-use:99.6k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use:99.6k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use logo
    browser-use – AI浏览器自动化工具

    📦 项目简介

    browser-use 是一个让AI代理能够自动操作浏览器的开源工具,通过自然语言指令即可完成各类网页操作,无需手动编写复杂的爬虫逻辑。无论是表单填写、网页信息提取,还是复杂的多步骤网页交互,AI都能帮你自动完成。


    ⚙️ 安装要求和过程

    环境要求

    • Python版本:≥3.11
    • 推荐包管理工具uv(也可使用pip等常规Python包管理工具)
    • 浏览器:自动安装Chromium(也可使用本地已安装的Chrome/Edge)

    快速安装步骤

    # 1. 初始化项目并安装browser-use
    uv init && uv add browser-use && uv sync
    
    # 2. 若本地未安装Chromium,执行以下命令自动安装
    uvx browser-use install

    可选配置

    • 如需使用云端能力,可前往 Browser Use Cloud 获取API Key,在.env文件中配置即可
    • 支持对接多种LLM提供商:自带优化后的ChatBrowserUse模型,也支持Google Gemini、Anthropic Claude、OpenAI等主流模型,还可对接Ollama运行本地模型

    💡 核心功能

    • 自然语言控制浏览器:支持AI代理通过自然语言指令自动完成各类网页操作,无需手动编写复杂爬虫逻辑
    • 双模式支持:提供开源版本云端托管版本两种使用模式,可按需选择
    • 丰富的工具集成:支持集成1000+第三方工具(如Gmail、Slack、Notion等),支持自定义工具扩展
    • CLI命令行支持:提供CLI命令行快速操作,提供持久化浏览器会话,适合快速迭代调试
    • AI编码工具集成:支持Claude Code等AI编码工具集成,可直接对接AI工作流

    云端版本专属能力

    • 更强的复杂任务处理能力,任务完成准确率远高于开源版本
    • 内置隐身浏览器指纹、代理轮换、验证码自动解决能力,避免被网站反爬检测
    • 支持持久化文件系统和记忆,适合长期运行的代理任务
    • 无需本地部署,开箱即用,支持大规模并行任务调度

    🚀 典型使用场景

    1. 个人效率提升:自动完成重复性网页操作,如批量填写表单、自动购物、自动整理网页信息等
    2. AI应用开发:作为AI代理的浏览器交互层,让AI具备操作网页的能力,开发智能助手类产品
    3. 企业级自动化:结合云端版本的扩展能力,实现大规模网页数据采集、业务流程自动化等场景
    4. 编码辅助:对接Cursor、Claude Code等AI编码工具,让AI可以直接操作浏览器验证代码效果、调试网页相关问题

    🌟 推荐理由

    在AI Agent爆发的2026年,让AI具备操作浏览器的能力,就像给AI装上了一双”眼睛”和”手”。browser-use不仅简化了浏览器自动化的开发流程,更重要的是它让AI真正能够与世界互动——从简单的信息查询到复杂的多步骤业务流程,都可以通过自然语言来完成。

    特别推荐它的双模式设计:如果你只是想快速尝试,开源版本足够使用;如果你需要生产级别的稳定性和扩展性,云端版本提供了完整的解决方案。这种灵活的设计理念,让不同需求的开发者都能找到适合自己的使用方式。

    另外,它对主流LLM的原生支持也是一大亮点。无论你用的是Claude、GPT还是本地部署的模型,都能无缝对接。这种开放性的设计,正是开源项目的魅力所在。


    📥 下载地址


    ⭐ 如果你觉得这个项目有帮助,欢迎到GitHub上给它一个Star!

  • Hugging Face Transformers – 161K+ Stars,现代AI开发的基石框架,统一百万预训练模型调用标准

    Hugging Face Transformers – 161K+ Stars,现代AI开发的基石框架,统一百万预训练模型调用标准

    Hugging Face Transformers

    GitHub OpenGraph Preview

    🤗 项目简介

    Hugging Face Transformers 是现代AI开发的基石框架,为文本、视觉、音频和多模态模型提供统一的模型定义标准,支持推理与训练全流程。只需掌握3个核心类,即可调用Hugging Face Hub上超过100万个预训练模型检查点。

    161K+
    GitHub Stars
    1M+
    预训练模型
    500+
    模型架构
    3
    核心类

    ⚙️ 安装要求与过程

    环境要求:

    • Python 3.10+
    • PyTorch 2.4+(或 JAX/TensorFlow 2.0+)
    • CUDA(可选,用于GPU加速)

    快速安装:

    # 使用 pip 安装(推荐)
    pip install "transformers[torch]"
    
    # 使用 uv 安装(更快)
    uv pip install "transformers[torch]"
    
    # 从源码安装最新版
    git clone https://github.com/huggingface/transformers.git
    cd transformers
    pip install '.[torch]'

    验证安装:

    import transformers
    print(transformers.__version__)  # 输出版本号即成功

    🚀 核心功能

    1. 统一的模型定义框架 🏗️

    Transformers 提供了统一的模型定义标准,只要模型被支持,就能兼容绝大多数训练框架(Axolotl、Unsloth、DeepSpeed等)、推理引擎(vLLM、SGLang、TGI等)以及相邻建模库(llama.cpp、mlx等)。

    2. 极简API设计 🎯

    只需学习 AutoModelAutoTokenizerPipeline 三个核心类,即可使用Hugging Face Hub上超过100万个预训练模型,覆盖NLP、CV、音频、多模态等任务。

    3. 跨框架无缝切换 🔄

    支持在PyTorch、JAX、TensorFlow 2.0之间随意切换模型,可针对不同阶段(训练、评估、生产)选择最合适的框架,3行代码即可训练前沿模型。

    4. 全模态Pipeline支持 🎨

    提供高层推理API Pipeline,支持文本生成、图像分类、音频识别、视频理解等多模态任务,自动处理输入预处理并返回对应输出。

    5. 高度可定制与可复现 🔬

    提供每个架构的官方结果复现示例,模型内部结构尽可能统一暴露,模型文件可脱离库独立使用,方便快速实验和研究。

    💡 典型使用场景

    场景一:快速原型开发 🏃

    使用Pipeline API,3行代码即可完成文本分类、命名实体识别、文本生成、图像分类等任务。无需关心模型架构细节,直接调用SOTA模型进行推理。

    from transformers import pipeline
    
    # 文本生成
    generator = pipeline("text-generation", model="gpt2")
    result = generator("AI will", max_length=50)
    
    # 图像分类
    classifier = pipeline("image-classification", model="google/vit-base-patch16-224")
    result = classifier("cat.jpg")

    场景二:模型微调与训练 🎓

    基于预训练模型进行下游任务微调,利用Hugging Face Trainer API或Accelerate库,轻松实现分布式训练和混合精度训练,大幅降低计算成本。

    from transformers import AutoModelForSequenceClassification, Trainer, TrainingArguments
    
    model = AutoModelForSequenceClassification.from_pretrained("bert-base-uncased")
    training_args = TrainingArguments(output_dir="./results", num_train_epochs=3)
    trainer = Trainer(model=model, args=training_args, train_dataset=dataset)
    trainer.train()

    🌟 推荐理由

    Hugging Face Transformers 是现代AI开发的”基础设施”,几乎每个AI开发者都或多或少用过它。它不仅提供了统一的模型定义标准,更重要的是构建了一个庞大的生态系统——Hugging Face Hub上超过100万个预训练模型,覆盖了从BERT到GPT、从ViT到CLIP、从Whisper到Llama的所有主流模型。

    作为一个AI开发者,掌握Transformers库是必修课。它的API设计非常优雅,只需3个核心类就能玩转绝大多数SOTA模型。而且,它对PyTorch/JAX/TF的跨框架支持,让你可以在不同场景下灵活选择最合适的后端。无论你是做研究还是做应用,Transformers都是不可或缺的工具。

    📄 许可证:Apache License 2.0(允许商业使用)
    💻 主要语言:Python
    🏢 开发方:Hugging Face Team
  • Aider – 42K+ Stars 终端原生 AI 结对编程助手,Git 深度集成,支持全模型

    Aider – 42K+ Stars 终端原生 AI 结对编程助手,Git 深度集成,支持全模型

    📌 项目简介

    Aider 是一款终端原生 AI 结对编程工具,支持搭配各大云端/本地大语言模型(LLM)开启新项目或在现有代码库基础上进行开发。它由 Paul Gauthier 独立开发维护,GitHub 获得 42K+ Stars,是 2026 年最热门的开源 AI 编程助手之一。

    Aider Logo

    Aider-AI 组织头像


    ⚙️ 安装要求和过程

    环境要求

    • Python:3.8 – 3.14(实验性支持 3.14)
    • pip:最新版本
    • Git:用于版本控制集成
    • 网络:访问 LLM API(或本地模型)

    快速安装步骤

    1. 安装 aider-install 工具

      python -m pip install aider-install
      aider-install
    2. 进入项目目录

      cd /path/to/your/project
    3. 配置模型(选择其一)

      # DeepSeek(推荐,性价比高)
      aider --model deepseek --api-key deepseek=<your-key>
      
      # Claude 3.7 Sonnet(最强代码能力)
      aider --model sonnet --api-key anthropic=<your-key>
      
      # OpenAI o3-mini
      aider --model o3-mini --api-key openai=<your-key>
      
      # 本地模型(Ollama)
      aider --model ollama/llama3
    4. 开始编程!

      # 启动 aider
      aider
      
      # 在 aider 中直接对话
      > 帮我实现一个用户登录功能
      > 修复这个 bug
      > 优化这段代码的性能

    🌟 核心功能

    1. 全模型兼容 —— BYOK 模式

    Aider 采用 BYOK(Bring Your Own Key) 模式,支持几乎所有主流 LLM:

    • Claude:3.5 Haiku、3.7 Sonnet、Opus 4.1
    • OpenAI:o1、o3-mini、GPT-4o、GPT-5.5
    • DeepSeek:R1、Chat V3(推荐,性价比极高)
    • Google:Gemini 3.1 Pro
    • 本地模型:Ollama、LM Studio、vLLM

    2. Repo Map —— 智能代码库映射

    Aider 会自动分析整个代码库,生成智能映射(Repo Map),让 LLM 理解项目结构:

    • 自动识别所有源代码文件
    • 提取函数、类、方法签名
    • 建立文件之间的依赖关系图
    • 即使是大项目(100+ 文件),AI 也能精准定位需要修改的位置

    3. Git 原生集成 —— 自动提交

    Aider 与 Git 深度集成,每次 AI 修改代码后:

    • 自动生成合理的提交信息(符合 Conventional Commits 规范)
    • 可通过 /diff 查看 AI 的修改
    • 可通过 /undo 撤销上一次 AI 修改
    • 支持 /git 命令直接管理版本控制
    # 查看 AI 的修改
    > /diff
    
    # 撤销上一次修改
    > /undo
    
    # 手动提交
    > /git add . && git commit -m "xxx"

    4. 多模态输入 + 语音转代码

    Aider 支持丰富的输入方式:

    • 图片输入:可向对话中添加截图、设计稿、流程图,AI 会根据视觉内容生成代码
    • 网页上下文:可添加 URL,AI 会自动抓取网页内容作为参考
    • 语音输入:支持语音转文字,直接”说”出需求,AI 自动实现
    # 添加图片
    > /add screenshot.png
    > 根据这个设计稿实现界面
    
    # 添加网页
    > /web https://example.com
    > 参考这个页面的布局

    5. 自动 Lint & 测试修复

    Aider 每次修改代码后,会自动执行 linter 和测试套件

    • 如果检测到 lint 错误(如 pylint、eslint),自动修复
    • 如果测试失败,自动分析错误并修复代码
    • 支持自定义 linter 和测试命令
    # 配置 .aider.conf.yml
    lint_cmds:
      - ["python", "-m", "pylint", "--disable=all", "--enable=F,E", "--errors-only", "/dev/stdin"]
    
    test_cmd: ["python", "-m", "pytest", "tests/"]

    🚀 典型使用场景

    场景 1:快速原型开发

    需求:需要快速实现一个 Web 应用原型,验证想法。

    工作流

    # 1. 创建项目目录
    mkdir my-app && cd my-app
    git init
    
    # 2. 启动 aider
    aider --model deepseek
    
    # 3. 描述需求
    > 创建一个 Flask 应用,包含用户注册、登录、主页
    > 使用 SQLite 数据库
    > 前端使用 Bootstrap 5
    
    # 4. Aider 自动生成代码并提交
    # 每次修改都会自动 git commit

    效果:10 分钟内完成原型开发,自动提交 5-10 个 Git 版本。

    场景 2:遗留代码重构

    需求:有一个旧的 Python 2 项目,需要迁移到 Python 3,并重构优化。

    工作流

    # 1. 进入项目目录
    cd legacy-project
    aider --model claude
    
    # 2. 让 Aider 分析代码库
    > 分析这个项目的结构,列出需要迁移的地方
    
    # 3. 逐步重构
    > 将这些 Python 2 代码迁移到 Python 3
    > 优化这个函数的时间复杂度
    > 添加类型注解

    效果:Aider 的 Repo Map 能理解整个代码库,精准修改所有需要改动的地方,并自动提交每个步骤。

    场景 3:Bug 修复 & 调试

    需求:生产环境出现 bug,需要快速定位并修复。

    工作流

    # 1. 启动 aider
    cd production-app
    aider
    
    # 2. 描述 bug
    > 用户报告点击"提交订单"按钮后页面报错
    > 错误信息是 "NullPointerError at line 42 in order.py"
    > 帮我定位和修复这个 bug
    
    # 3. Aider 自动分析
    # - 读取 order.py 和相关文件
    # - 定位问题(如未判空)
    # - 修复代码
    # - 自动提交:fix: handle None case in order submission
    
    # 4. 运行测试
    > /test

    效果:从 bug 报告到修复提交,全程 5 分钟。


    💡 推荐理由

    我(数字生命卡兹克)在使用过 CursorGitHub CopilotKilo Code 等众多 AI 编程工具后,必须说:

    Aider 是我见过最”懂 Git”的 AI 编程助手。

    为什么推荐 Aider?

    1. 终端原生,无 IDE 锁定
      不需要特定的 IDE 或编辑器,在任何终端都能用。配合 tmux/vim/emacs 简直是神器。
    2. Git 集成无与伦比
      每次修改都自动提交,提交信息质量极高(比我自己写的还好)。可随时 /undo,版本控制安全感拉满。
    3. Repo Map 黑科技
      大项目也不慌,Aider 能理解整个代码库的结构,不会出现”改了 A 文件忘了改 B 文件”的低级错误。
    4. 性价比极高
      配合 DeepSeek API,一个月不到 10 块钱,能用几百次。比 Cursor 订阅便宜太多了。
    5. 开源 & 隐私优先
      Apache 2.0 许可,代码完全透明。也可以用本地模型(Ollama),代码不出本地。

    适合人群

    • 🐧 终端爱好者:喜欢在终端里完成所有工作
    • 🧑‍💻 全栈开发者:需要快速原型开发、重构遗留代码
    • 🔧 DevOps/SRE:写脚本、自动化工具
    • 🎓 学生/初学者:学习代码最佳实践(Aider 的代码质量很高)

    小技巧

    • 使用 --watch 模式,Aider 会自动监控文件变化并自动 commit
    • 配置 .aiderignore 排除不需要 AI 看的敏感文件
    • 使用 /add 命令添加上下文文件,让 AI 更懂你的意图
    • 配合 tmux 使用,一边 aider 一边手动修改,效率翻倍

    📥 下载地址

    快速安装

    # 方式一:使用 aider-install(推荐)
    python -m pip install aider-install
    aider-install
    
    # 方式二:直接安装
    pip install aider-chat
    
    # 方式三:使用 pipx(隔离环境)
    pipx install aider-chat

    系统要求

    • Python:3.8 – 3.14
    • 支持系统:Windows / macOS / Linux
    • 许可证:Apache 2.0(完全开源)
    • GitHub Stars:42K+(持续增长中)

    🎁 总结

    Aider 是一款终端原生、Git 深度集成、支持全模型的 AI 结对编程工具。它不试图替代你的 IDE,而是成为你终端工作流的一部分。

    如果你喜欢在终端里工作,追求极致的版本控制体验,或者想要一个高性价比的 AI 编程助手,Aider 绝对值得一试!strong>

    🌟 给 Aider 一个 Star:https://github.com/Aider-AI/aider

  • Open Interpreter — 为开源模型量身打造的轻量级AI编程智能体(64K+ Stars)

    Open Interpreter — 为开源模型量身打造的轻量级AI编程智能体(64K+ Stars)

    ⚡ Open Interpreter

    为开源模型量身打造的轻量级 AI 编程智能体

    ⭐ 64K+ Stars
    🦀 Rust
    📄 Apache-2.0
    🏢 Open Interpreter Org

    Open Interpreter

    📌 项目简介

    Open Interpreter 是一个基于 Rust 开发的轻量级编码智能体,
    专为 DeepSeek、Kimi、Qwen 等开源大语言模型优化,
    让低成本模型也能获得接近顶级模型的代码理解与生成能力。
    它最初是 OpenAI Codex 的开源替代品,现已发展为支持多模型、多 harness 的通用 AI 编程助手。

    64K+
    GitHub Stars

    5.5K+
    Forks

    7.6K+
    Commits

    270+
    Issues 开放

    🔧 安装要求与过程

    📋 环境要求

    • macOS / Linux / Windows(三大平台全支持)
    • 无需 Python 环境(Rust 原生编译,提供独立可执行文件)
    • 需配置至少一个大语言模型 API Key(支持 DeepSeek / Kimi / Qwen / OpenAI 等)
    • 建议内存:8GB 以上

    ⚡ 快速安装

    macOS / Linux:

    curl -fsSL https://www.openinterpreter.com/install | sh

    Windows (PowerShell):

    irm https://www.openinterpreter.com/install.ps1 | iex

    启动方式:

    # 终端输入以下命令之一即可启动
    i
    # 或
    interpreter

    ✨ 核心功能

    🧠 多 Harness 适配系统

    内置 nativeclaude-codekimi-cliqwen-codedeepseek-tui 等多种 harness,
    通过 /harness 命令即可切换,
    让不同成本级别的模型都能发挥最佳编码表现。这是 Open Interpreter 最核心的竞争力。

    🔒 原生沙箱执行

    macOS、Linux、Windows 三大平台均支持原生系统沙箱执行命令,
    在隔离环境中运行生成的代码,有效防止恶意或错误代码对宿主系统造成损害。
    沙箱策略可通过配置文件灵活调整。

    🤖 应用测试与 UI 自动化

    内置 QA 技能,可搭配 agent-browser 在真实浏览器中测试 Web 应用,
    或搭配 trycua 操作测试原生桌面应用。
    让 AI 不仅写代码,还能自动验证代码运行效果。

    🔌 ACP 协议 & MCP 支持

    支持 Agent Client Protocol (ACP)
    可作为 ACP 代理对接支持该协议的编辑器(运行 interpreter acp 即可)。
    同时原生支持 MCP 协议,可接入各类 MCP 工具扩展能力。

    📁 本地优先 & 隐私保护

    所有配置和会话状态默认存储在本地 ~/.openinterpreter 目录,
    API Key 和对话历史完全本地化管理,无需上传云端。
    支持自定义 AGENTS.md 配置文件,为不同项目定制 AI 行为。

    🎯 典型使用场景

    1

    低成本模型提升代码能力

    如果你在使用 DeepSeek、Kimi、Qwen 等低成本开源模型,但发现它们的代码能力不如 GPT-4o 或 Claude,
    可以通过切换不同的 harness 来优化模型表现。
    Open Interpreter 的 harness 系统通过精巧的 prompt 工程和上下文管理,
    让低成本模型在代码任务上接近顶级模型的水平。实测显示,搭配正确的 harness,
    DeepSeek-V3 在 HumanEval 上的通过率可提升 15-20%。

    2

    本地自动化脚本生成与执行

    需要批量处理文件、数据清洗、或编写系统运维脚本?
    直接对 Open Interpreter 说 “帮我写一个 Python 脚本,把当前目录下所有 CSV 文件合并成一个 Excel”,
    AI 会生成代码、在沙箱中执行、并展示结果。
    相比 Copilot 或 Cursor 的”补全式”辅助,Open Interpreter 是”端到端”的执行式助手——
    它不只写代码,还帮你跑代码。

    3

    Web/桌面应用自动测试

    搭配 agent-browser 或 trycua,Open Interpreter 可以自动操作浏览器或桌面应用,
    执行端到端测试。比如:让 AI 打开你的 Web 应用,注册一个新用户,完成登录,
    并提交一份表单——全程自动化,无需手动编写 Selenium 脚本。
    对于快速迭代的创业团队,这可以节省大量 QA 时间。

    💡 推荐理由

    Open Interpreter 最打动我的地方,是它真正解决了”低成本模型不好用”的痛点

    目前国内很多团队在使用 DeepSeek 或 Qwen 等开源模型,成本确实低,但代码能力跟 Claude 3.7 或 GPT-4.5 比还是有差距。
    以前这个问题只能通过”换更好的模型”来解决——成本随之上升。
    Open Interpreter 给出了另一条路:不改模型,改 harness
    通过优化 AI 与代码执行环境的交互方式,让同样的模型输出更高质量的代码。

    另外,它的原生沙箱设计也很值得称赞。
    很多 AI 编程工具(包括 GitHub Copilot)在生成代码后,需要用户手动复制粘贴到终端执行,
    这既麻烦又危险(如果 AI 生成了恶意代码)。
    Open Interpreter 的沙箱机制让”生成→执行→验证”形成完整闭环,同时把安全风险控制在隔离环境中。

    最后,Rust 重写带来的性能提升也不容忽视。
    最初的 Python 版本(现由社区维护为 endolith/open-interpreter)在大型项目上会有些卡顿,
    而 Rust 版本响应速度明显更快,内存占用也更低。
    如果你在意工具的运行效率,这个改进非常实用。

    ⚙️ 技术架构亮点

    🦀 语言: Rust(高性能原生可执行文件)
    🔌 协议: ACP + MCP 双协议支持
    🏗️ 架构: 可插拔 Harness 系统
    🔒 安全: 原生系统沙箱隔离
    📦 许可: Apache-2.0(商用友好)
    🌍 平台: macOS + Linux + Windows

    📥 下载地址

    Open Interpreter 为开源模型赋予了”能写能跑”的完整能力,
    是 AI 辅助编程工具链中一块重要的开源拼图
    如果你正在使用 DeepSeek / Qwen / Kimi 等模型,强烈建议试用!

    ⭐ 在 GitHub 上为项目点亮 Star,支持开源社区发展!

  • LobeChat —— 72K+ Stars 开源 AI 聊天框架,比 ChatGPT 更自由的选择

    LobeChat —— 72K+ Stars 开源 AI 聊天框架,比 ChatGPT 更自由的选择

    🤯 LobeChat

    开源 AI 聊天框架,72K+ Stars,比 ChatGPT 更自由的 AI 客户端

    ⭐ GitHub 72K+ Stars  | 
    🌐 在线体验  | 
    MIT 开源

    📌 项目简介

    LobeChat 是 LobeHub 团队开发的开源 AI 聊天框架,也是 GitHub 上 Star 数最多的开源 AI 客户端之一(72K+ Stars)。它支持 Web 和桌面两种形式,在一个界面里同时接入 GPT、Claude、Gemini、DeepSeek、Ollama 等 80+ 模型,还内置插件市场、RAG 知识库、多模型对比等实用功能。最重要的是——完全免费开源,数据可完全本地化

    72K+
    GitHub Stars

    🤖
    80+
    支持模型

    🔌
    40+
    内置插件

    💻
    3 平台
    Web/桌面/Docker

    1
    安装要求和过程

    环境要求

    部署方式 环境要求
    Web 版 浏览器访问,无需安装
    桌面版 Windows/macOS/Linux,下载安装包
    Docker Docker + Docker Compose
    本地开发 Node.js 18+, pnpm, Git

    快速安装(桌面版)

    # 1. 从 GitHub Releases 下载对应平台安装包

    https://github.com/lobehub/lobe-chat/releases

    # Windows: LobeChat-win.exe

    # macOS: LobeChat-mac.dmg

    # Linux: LobeChat-linux.AppImage

    Docker 部署(自托管推荐)

    # 拉取镜像并启动

    docker run -d -p 3210:3210 \

    -e OPENAI_API_KEY=your-key \

    –name lobechat lobehub/lobe-chat

    2
    核心功能

    🤖 多模型统一接入

    支持 OpenAI、Claude、Gemini、DeepSeek、Kimi、智谱、Ollama 等 80+ 模型,一个界面随意切换。自定义 Base URL,可接入任何兼容 OpenAI 协议的 API。

    🔌 插件市场 + MCP 集成

    内置 40+ 插件,联网搜索、代码执行、图片生成开箱即用。支持 MCP 协议,可一键接入 AI Agent 工具链,扩展能力无上限。

    📚 RAG 知识库

    上传 PDF、Word、网页,自动建立向量索引。基于个人知识库问答,适合企业文档、技术手册、合同条款等场景。本地向量数据库,数据不出门。

    ⚡ 多模型对比 + 语音对话

    同一问题多模型同时回答,横向对比 Claude/GPT/Gemini 差异。内置 TTS/STT,支持语音对话。还有「助手市场」,几百个预设专业助手直接可用。

    🏠 完全自托管 + 隐私优先

    Docker 一键部署,数据全留本地。MIT 开源,可自由修改分发。对比 ChatGPT Plus $20/月,LobeChat 客户端免费,只需按 API 用量付费。

    3
    典型使用场景

    🎯 场景一:多模型对比选型

    在模型选型阶段,同一个 Prompt 同时发给 Claude Opus、GPT-5.4、Gemini 2.5 Pro,直接对比输出质量,不再靠猜。LobeChat 的多模型对比功能让选型决策有数据支撑。

    📚 场景二:企业知识库问答

    将公司技术文档、产品手册、合同模板上传到 LobeChat 知识库,基于 RAG 检索增强生成,精准回答内部问题。支持 Docker 私有化部署,数据完全不出企业内网。

    💻 场景三:开发者日常助手

    配置 DeepSeek V3(中文代码能力强,价格低)+ Claude Sonnet(复杂逻辑)+ GPT-5.4(多模态),不同任务自动切换最合适模型。助手市场里的「代码审查」「SQL 优化」等预设助手,开箱即用。

    💡 推荐理由

    我用过不少 AI 客户端,LobeChat 是最顺手的选择之一,原因如下:

    • 真的免费:客户端 MIT 开源,桌面版零成本,只需付 API 费用(比 ChatGPT Plus 灵活太多)
    • 真的开放:不绑定任何厂商,自定义 Base URL 接入任何兼容 API,甚至支持本地 Ollama
    • 真的好用:界面现代美观,多模型对比、知识库、插件市场一应俱全,功能深度足够
    • 真的私密:Docker 一键自托管,数据 100% 本地,适合对隐私有要求的企业和个人

    如果你同时用多个 AI 模型,或者不想把数据交给 OpenAI,LobeChat 是目前最好的开源替代方案

    📥 下载地址

    许可协议:MIT License  |  语言:TypeScript  |  支持平台:Web / Windows / macOS / Linux / Docker

    ⚠️ 本文基于公开资料整理,项目数据截至 2026 年 6 月。LobeChat 与 LobeHub 为同一团队产品,功能持续迭代中。

  • Kilo Code – 22K+ Stars,开源AI编程智能体,支持VS Code/JetBrains/CLI三大平台

    Kilo Code – 22K+ Stars,开源AI编程智能体,支持VS Code/JetBrains/CLI三大平台

    Kilo Code Logo

    Kilo Code – 开源AI编程智能体

    📦 项目简介

    Kilo Code 是一款开源AI编程智能体,支持在 VS Code、JetBrains 和 CLI 中使用。它提供500+模型选择、多智能体协作、MCP市场扩展等强大功能,采用开源定价模式——你只需支付模型提供商的价格,零加价。

    22K+
    GitHub Stars
    500+
    AI模型
    3
    IDE支持
    MIT
    开源协议

    ⚙️ 安装要求和过程

    环境要求

    • VS Code: 1.80.0+
    • JetBrains: IntelliJ IDEA, PyCharm, WebStorm 等 (2023.2+)
    • CLI: Node.js 18+ (for npm install) 或直接使用二进制文件
    • 网络: 需要访问AI模型API(支持500+模型)

    快速安装

    方式一:VS Code 扩展

    1. 在 VS Code 扩展市场搜索 “Kilo Code”
    2. 点击安装
    3. 创建账户后即可使用(支持500+模型,包括GPT-5.5、Claude Opus 4.7、Gemini 3.1等)

    方式二:命令行工具(CLI)

    # npm 安装
    npm install -g @kilocode/cli
    
    # curl 一键安装
    curl -fsSL https://kilo.ai/cli/install | bash
    
    # pnpm
    pnpm add -g @kilocode/cli
    
    # bun
    bun add -g @kilocode/cli
    
    # Homebrew (macOS / Linux)
    brew install Kilo-Org/tap/kilo
    
    # Arch Linux (AUR)
    paru -S kilo-bin

    安装后,在项目目录中运行 kilo 即可启动。

    方式三:JetBrains 插件

    1. 在 JetBrains Marketplace 搜索 “Kilo Code”
    2. 或在 IDE 中打开 Settings → Plugins 搜索安装

    ✨ 核心功能

    🤖 1. 多智能体协作

    Kilo 内置多个专业智能体,可根据任务切换:

    • Code: 默认智能体,从自然语言生成和编辑代码
    • Plan: 在设计阶段先规划架构和实现方案,再写代码
    • Ask: 回答代码库相关问题,不修改文件
    • Debug: 排查和追踪问题
    • Review: 审查代码变更,发现性能、安全、风格和测试覆盖问题

    你还可以创建自定义智能体,满足特定需求。

    🧠 2. 500+ 模型支持

    支持中途切换模型,根据任务需求匹配延迟、成本和推理能力。支持的顶级模型包括:

    • GPT-5.5
    • Claude Opus 4.7
    • Claude Sonnet 4.6
    • Gemini 3.1 Pro Preview

    采用开源定价,支付模型提供商的价格,零加价,且不需要API密钥即可开始。

    💻 3. 多IDE支持

    Kilo Code 真正实现了全场景覆盖:

    • VS Code: 原生扩展,完整功能支持
    • JetBrains: 原生插件,支持 IntelliJ IDEA、PyCharm、WebStorm 等
    • CLI: 命令行工具,适合远程服务器和自动化场景
    • Cloud Agent: 网页版,无需本地机器

    🔧 4. MCP 市场

    通过 MCP (Model Context Protocol) 市场,可以发现和接入各种MCP服务器,扩展智能体的能力边界。让AI智能体能够连接数据库、API、文件系统等外部工具。

    🚀 5. 自主模式 (CI/CD)

    支持在 CI/CD 管道中运行自主模式:

    kilo run --auto "run tests and fix any failures"

    --auto 参数禁用所有权限提示,让智能体在无人工干预的情况下执行操作(仅在可信环境中使用)。

    🎯 典型使用场景

    场景一:日常编程助手

    在 VS Code 或 JetBrains 中,通过自然语言描述需求,Kilo Code 自动生成代码。支持多文件编辑、代码重构、单元测试生成等任务。内置的行内自动补全功能提供”幽灵文本”建议,按Tab键即可接受。

    场景二:代码审查自动化

    在 Pull Request 中设置自动AI代码审查。Kilo Code 会检查性能问题、安全漏洞、代码风格不一致和测试覆盖率不足等问题,并直接在PR中给出反馈。

    场景三:CI/CD 集成

    在自动化管道中使用 kilo run --auto 命令,让AI智能体自动运行测试、修复失败、更新文档等。特别适合需要持续集成的大型项目。

    💡 推荐理由

    • 真正开源:MIT协议,代码完全开放,可自由使用、修改和分发(包括商业用途)
    • 公平定价:零加价模式,你只需支付模型提供商的价格,不像其他AI编程工具那样收取高额订阅费
    • 生态完整:支持VS Code、JetBrains、CLI三大平台,还提供Cloud Agent和代码审查服务
    • 灵活扩展:MCP市场让智能体能力可无限扩展,自定义智能体满足个性化需求
    • 活跃维护:22K+ Stars,2.7K+ Forks,801个开放Issue(说明社区活跃),持续更新中

    如果你在寻找一个不绑定特定模型、不收取高额费用、真正开源可定制的AI编程助手,Kilo Code 是目前的最佳选择。

    🖼️ 项目截图

    Kilo in VS Code and CLI

    Kilo Code 在 VS Code 和 CLI 中的运行效果

    📥 下载地址

    🌐 官方网站

    https://kilo.ai/

    💻 GitHub 仓库

    Kilo-Org/kilocode

    ⭐ 22,150+ Stars | 🍴 2,706+ Forks

    📥 VS Code 扩展

    VS Code Marketplace

    🔌 JetBrains 插件

    JetBrains Marketplace

    📚 官方文档

    https://kilo.ai/docs

    💬 社区

    Discord | X (Twitter) | Reddit


    📌 本文由自动化任务采集整理,数据截至 2026年6月19日

    🔗 项目GitHub: https://github.com/Kilo-Org/kilocode

  • AnythingLLM — 61.7K Stars,全栈本地优先AI应用,私有知识库与AI代理一站式解决方案

    AnythingLLM

    Mintplex Labs 官方 Logo

    📦 项目简介

    AnythingLLM 是一款全功能本地优先 AI 应用,集 RAG(检索增强生成)、AI 代理、无代码代理构建器于一体。口号是「停止租用你的智能,用 AnythingLLM 拥有它」。支持连接本地或云端 LLM,导入文档后即可快速开始对话,内置代理、多用户支持、向量数据库和文档管道,无需额外配置。

    ⭐ 61.7K+ Stars
    🍴 6.74K+ Forks
    📜 MIT 许可
    🏢 Mintplex Labs

    ⚙️ 安装要求和过程

    环境要求

    • Docker(推荐,最简单方式)
    • 或:Node.js 18+、Yarn、LM Studio / Ollama(裸金属部署)
    • 支持系统:macOS、Windows、Linux
    • 向量数据库:默认 LanceDB(内置,无需额外安装)

    快速安装 — 桌面版(最简单)

    # 访问官网下载对应系统安装包

    https://anythingllm.com/download

    # macOS

    下载 .dmg → 拖入 Applications

    # Windows

    下载 .exe → 一路 Next

    # Linux

    下载 .AppImage → chmod +x → 运行

    Docker 部署(推荐服务器)

    # 拉取最新镜像

    docker pull mintplexlabs/anythingllm

    # 运行容器

    docker run -p 3001:3001 mintplexlabs/anythingllm

    # 浏览器访问

    http://localhost:3001

    ✨ 核心功能

    🤖 无代码 AI 代理构建器

    可视化构建 AI 代理,支持网页浏览、RAG 文档查询、API 调用等技能,无需写代码即可打造专属 AI 助手。

    🧠 动态模型路由 + 智能记忆

    根据自定义规则自动将对话路由到最合适的模型和提供商;AI 可记住你和工作区的重要信息,实现跨会话持久化上下文。

    📚 强大的 RAG 文档处理

    支持 PDF、TXT、DOCX、CSV 等多种格式,内置针对大型文档集的优化,比其他聊天 UI 成本更低、响应更快。

    👥 多用户与权限管理

    Docker 版本支持多用户实例与权限管控,适合团队协作;不会泄露实例安全或知识产权,企业级安全设计。

    🔌 MCP 兼容 + 完整开发者 API

    支持 Model Context Protocol (MCP),可无缝接入外部工具;提供完整 REST API,支持自定义集成与二次开发。

    🎯 典型使用场景

    ① 私有知识库问答

    将公司文档、技术手册、研究报告导入 AnythingLLM,打造私有化部署的 ChatGPT。员工可直接提问,AI 基于内部文档给出准确答案,数据不出企业内网。

    ② 个人 AI 研究助手

    结合本地 Ollama 运行开源模型,导入论文 PDF 和研究笔记,AI 代理可自动联网搜索、整理资料、定时执行研究任务,是研究人员的全能助手。

    ③ 网站智能客服嵌入

    利用可嵌入聊天组件(Docker 版),将定制化的 AI 客服挂到企业官网,基于私有知识库自动回答客户问题,无需人工值守。

    💡 推荐理由

    作为一款本地优先的全栈 AI 应用,AnythingLLM 最大的优势在于开箱即用——下载桌面版,连接本地 Ollama,导入文档,三步搞定私有知识库。无需 Docker、无需配置向量数据库、无需写代码。

    对比同类产品:Dify 偏向可视化工作流编排,AnythingLLM 更聚焦于个人/小团队的文档对话场景,界面更简洁,部署更轻松。MIT 许可意味着你可以自由修改和分发,真正「拥有你的智能」。

    特别推荐给:重视数据隐私的开发者、需要内部知识库的中小团队、以及想体验本地 LLM + RAG 完整链路的 AI 爱好者。

    📥 下载地址

    支持 macOS / Windows / Linux | Docker 镜像可用 | 自托管部署指南完备

    🛠️ 技术栈

    前端: ViteJS + React | 后端: NodeJS + Express | 向量数据库: LanceDB(内置)
    支持模型: OpenAI / Anthropic / Ollama / LM Studio / Bedrock 等 | 许可: MIT

  • Firecrawl — 134K+ Stars,为 AI Agent 量身打造的网页数据 API,搜索/爬取/交互一体化

    Firecrawl — 134K+ Stars,为 AI Agent 量身打造的网页数据 API,搜索/爬取/交互一体化

    Firecrawl Logo

    🔥 Firecrawl

    The API to search, scrape, and interact with the web at scale

    ⭐ 134K+ Stars
    📦 TypeScript
    📜 AGPL-3.0

    📌 项目简介

    Firecrawl 是专为 AI Agent 设计的网页数据 API,能将任意网页(含 JS 渲染)转换成 AI 友好的 Markdown/JSON 格式。它覆盖 96% 的网页,P95 延迟仅 3.4 秒,原生支持 MCP 协议,是 AI 应用获取实时网页数据的首选基础设施。

    ⚙️ 安装要求和过程

    环境要求

    Python
    3.8+ (SDK 支持)
    Node.js
    16+ (SDK 支持)
    API Key
    firecrawl.dev 注册
    自托管
    Docker / Redis / Playwright

    快速安装(Python SDK)

    # 安装 Python SDK
    pip install firecrawl-py
    
    # 基础使用示例
    from firecrawl import Firecrawl
    
    app = Firecrawl(api_key="fc-YOUR_API_KEY")
    
    # 搜索网页
    result = app.search("Firecrawl tutorial", limit=5)
    
    # 爬取单个 URL
    result = app.scrape('https://example.com', formats=["markdown"])
    print(result.markdown)

    快速安装(Node.js SDK)

    # 安装 Node.js SDK
    npm install firecrawl
    
    # 基础使用示例
    import { Firecrawl } from 'firecrawl';
    
    const app = new Firecrawl({ apiKey: 'fc-YOUR_API_KEY' });
    
    const result = await app.scrape('https://example.com', {
      formats: ['markdown']
    });
    console.log(result.markdown);

    MCP 集成(AI Agent 一键接入)

    # 一键安装 MCP Skill(支持 Claude Code、OpenClaw 等)
    npx -y firecrawl-cli@latest init --all --browser
    
    # 或手动配置 MCP 客户端
    {
      "mcpServers": {
        "firecrawl-mcp": {
          "command": "npx",
          "args": ["-y", "firecrawl-mcp"],
          "env": {
            "FIRECRAWL_API_KEY": "fc-YOUR_API_KEY"
          }
        }
      }
    }

    自托管部署(Docker)

    # 克隆仓库
    git clone https://github.com/firecrawl/firecrawl.git
    cd firecrawl
    
    # 启动自托管服务(需要 Docker、Redis、Playwright)
    docker-compose up -d
    
    # 访问本地服务
    # API: http://localhost:3002
    # Playground: http://localhost:3002/playground

    核心功能

    🔍 Search(智能搜索)

    全网搜索并返回结果页的完整 Markdown 内容,不再只是返回标题和 URL。支持关键词搜索、URL 搜索、智能过滤,返回结果可直接供 AI Agent 使用,无需二次处理。

    🕷️ Scrape(智能爬取)

    将任意 URL 转换为 Markdown、HTML、截图或结构化 JSON。自动处理 JS 渲染、代理轮换、速率限制、反爬虫策略,覆盖 96% 的网页,P95 延迟仅 3.4 秒。

    🤖 Agent(智能代理)

    无需指定 URL,用自然语言描述需求即可自动完成数据收集。支持结构化输出(Pydantic Schema),可自动提取创始人信息、产品定价、竞品对比等复杂数据,返回类型安全的 Python 对象。

    🗺️ Crawl + Map(全站爬取与 URL 发现)

    Crawl 支持单次请求爬取整个网站的所有页面内容;Map 快速发现网站所有 URL,支持关键词筛选。支持异步批量爬取数千个 URL,适合大规模数据采集场景。

    🖱️ Interact(交互式爬取)

    爬取页面后可执行点击、滚动、输入、等待、按键等交互操作,应对需要登录、搜索、翻页等动态场景。AI 提示驱动,无需编写复杂的选择器代码。

    💡 典型使用场景

    场景一:AI Agent 实时联网搜索

    通过 Firecrawl 的 Search API,AI Agent 可以实时搜索网页并获取完整内容,不再受训练数据时效限制。结合 MCP 协议,Claude Code、OpenClaw 等 AI 工具可以一键调用 Firecrawl 获取最新信息。

    # AI Agent 使用 Firecrawl 搜索最新信息
    result = app.search(
        query="2026年 AI 开源项目趋势",
        limit=10,
        scrape_options={"formats": ["markdown"]}
    )
    # result 包含搜索结果 + 每个结果的完整 Markdown 内容

    场景二:RAG 应用网页数据注入

    RAG(检索增强生成)应用需要大量外部数据,Firecrawl 可以批量爬取指定网站内容并转换为 Markdown,直接注入向量数据库。支持智能等待、JS 渲染、反爬虫绕过,大幅提升 RAG 应用的数据质量。

    # 批量爬取文档网站,用于 RAG
    docs = app.crawl(
        url="https://docs.example.com",
        limit=1000,
        scrape_options={"formats": ["markdown", "html"]}
    )
    # 将 docs 存入向量数据库(如 Milvus、Pinecone)

    场景三:竞品价格监控与数据分析

    使用 Agent API 自动收集竞品定价、功能对比、用户评价等数据,无需手动指定 URL,只需用自然语言描述需求。支持结构化输出,直接返回类型安全的 JSON 数据,可接入自动化分析流程。

    # 使用 Agent 自动收集竞品定价
    result = app.agent(
        prompt="Compare pricing of Firecrawl, ScrapingBee, and Apify",
        schema=PricingComparisonSchema
    )
    print(result.data)  # 结构化 JSON 输出

    ❤️ 推荐理由

    在 AI Agent 和 RAG 应用爆发式增长的今天,如何获取实时、高质量的网页数据成为了一个核心痛点。传统爬虫工具要么太底层(需要自己处理代理、JS 渲染、反爬虫),要么不够 AI 友好(返回脏 HTML,需要额外清洗)。

    Firecrawl 完美解决了这个问题:

    • 🌟 AI 原生设计:输出直接是 Markdown/JSON,无需额外清洗,降低 token 消耗
    • 🌟 高可靠性:覆盖 96% 的网页,自动处理 JS 渲染、代理轮换、速率限制
    • 🌟 高速度:百万级页面爬取 P95 延迟仅 3.4 秒,适合实时 AI 应用
    • 🌟 MCP 原生支持:一键接入主流 AI Agent 工具,无需复杂配置
    • 🌟 多语言 SDK:Python、Node.js、Java、Rust、Elixir 全覆盖
    • 🌟 开源可自托管:AGPL-3.0 许可,数据隐私完全自主可控

    💡 个人使用心得:Firecrawl 已成为我构建 AI Agent 的标配工具。以前需要组合使用 requests + BeautifulSoup + Playwright + 代理池才能完成的任务,现在一行代码就能解决。特别是它的 Agent API,用自然语言描述需求即可自动收集数据,大大降低了数据采集的门槛。如果你正在构建需要实时网页数据的 AI 应用,Firecrawl 绝对值得一试!

    📊 项目数据

    134K+
    GitHub Stars

    🍴
    7.8K+
    Forks

    👥
    375+
    Contributors

    📦
    5+
    官方 SDK

    📥 下载地址

    支持 Python、Node.js、Java、Rust、Elixir 等多语言 SDK • 开源 AGPL-3.0 许可 • 支持自托管部署

  • RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    📌 项目简介

    RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,由 InfiniFlow 团队(Milvus 向量数据库原班人马)开发,将前沿 RAG 技术与 Agent 能力深度融合,为大语言模型提供卓越的上下文理解层。

    RAGFlow 架构图

    RAGFlow 系统架构概览


    ⚙️ 安装要求和过程

    环境要求(自托管)

    配置项 最低要求
    CPU ≥ 4 核
    内存 ≥ 16 GB
    磁盘 ≥ 50 GB
    Docker ≥ 24.0.0
    Docker Compose ≥ v2.26.1

    🐳 Docker 快速部署(推荐)

    # 1. 调整系统内核参数(避免 Elasticsearch 启动失败)
    sudo sysctl -w vm.max_map_count=262144
    
    # 2. 克隆项目代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/docker
    
    # 3. 切换到稳定版本
    git checkout v0.26.1
    
    # 4. 启动服务(仅CPU)
    docker compose -f docker-compose.yml up -d
    
    # (可选)如需GPU加速,先执行:
    # sed -i '1i DEVICE=gpu' .env
    # docker compose -f docker-compose.yml up -d
    
    # 5. 验证服务状态
    docker logs -f docker-ragflow-cpu-1

    启动成功后,浏览器访问服务器 IP 地址(默认 HTTP 端口 80)即可进入 RAGFlow 登录页面。

    💻 源码启动(开发用途)

    # 安装依赖工具
    pipx install uv pre-commit
    
    # 克隆代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/
    uv sync --python 3.13
    uv run python3 download_deps.py
    
    # 启动基础依赖服务
    docker compose -f docker/docker-compose-base.yml up -d
    
    # 启动后端
    source .venv/bin/activate
    export PYTHONPATH=$(pwd)
    bash docker/launch_backend_service.sh
    
    # 启动前端(新终端)
    cd web && npm install && npm run dev

    ✨ 核心功能

    1. 深度文档理解,输入即精准

    基于先进的文档解析技术,可从格式复杂的非结构化数据(PDF、Word、PPT、Excel、扫描件、图片等)中精准提取知识,真正做到”Quality in, Quality out”。

    2. 可视化模板化分块,答案可追溯

    分块逻辑智能可解释,提供大量预置分块模板;支持文本分块可视化,允许人工干预调整;最终答案附带可追溯的引用来源,有效降低 LLM 幻觉问题。

    3. 多源数据兼容,异构数据统一管理

    支持解析 Word、PPT、Excel、TXT、图片、扫描件、结构化数据、网页等各类异构数据源,一站式完成企业知识库构建。

    4. Agentic 工作流 + MCP 协议支持

    内置丰富 Agent 能力,支持 Agentic 工作流编排、MCP 协议接入;内置 Python/JavaScript 代码执行器组件;支持 AI Agent 记忆功能。

    5. 高精度混合检索,多路召回+融合重排

    结合向量搜索、BM25 关键词搜索和自定义评分机制,配合先进重排序算法,提供无与伦比的回答准确性和上下文相关性。


    🚀 典型使用场景

    📈 股权投资研究

    自动化收集公司数据,整合财务指标与研究洞察。通过自主规划和多智能体编排,实现高级股票分析。自动从用户查询中识别股票代码,聚合外部权威来源和内部记录中的洞察,最终结合定性洞察和财务指标生成完整投资报告。

    ⚖️ 法律判例分析

    通过检查公共来源和内部数据集中的类似法律案例,提供结构化判例分析。自动提取关键属性(如司法管辖区和法律问题)以制定搜索查询并检索可比较的先例,最终整合成结构化分析报告。

    🏭 制造业维护支持

    通过从内部手册中准确获取内容,提供结构化维护指导(外部参考作为补充支持)。输入任务后,工作流首先验证输入充分性,然后从内部维护手册中提取标准协议,整合补充外部技术数据,生成清晰的执行指令。


    💡 推荐理由

    RAGFlow 是我用过的最”务实”的 RAG 产品,没有之一。

    第一,它真正解决了 RAG 的底层痛点——文档解析。很多 RAG 框架只关注向量检索和生成,却忽略了最关键的”输入质量”问题。RAGFlow 的 DeepDoc 技术能精准解析复杂格式的 PDF、扫描件,真正做到”Garbage in, garbage out”的反面——Quality in, quality out

    第二,可视化分块 + 可追溯引用,让 AI 回答有章可循。这是企业场景的刚需。你可以清楚看到每个答案是从哪个文档的哪个位置来的,大幅降低了 LLM 幻觉带来的风险。

    第三,Agentic 能力的融合非常自然。不是简单地在 RAG 上面套一个 Agent 外壳,而是将 Agent 能力(MCP 协议、代码执行、记忆管理)深度集成到 RAG 工作流中,真正实现了”RAG + Agent”的一体化编排。

    最后,InfiniFlow 团队是 Milvus 的原班人马,技术底蕴深厚。83K+ Stars 和 9600+ Forks 的社区活跃度也证明了产品的成熟度。如果你正在构建企业级知识库或 RAG 应用,RAGFlow 绝对值得一试。


    📥 下载地址

    🌐 官方网站:https://ragflow.io

    📦 GitHub 开源地址:https://github.com/infiniflow/ragflow ⭐ 83K+ Stars

    ☁️ 云服务(快速体验):https://cloud.ragflow.io

    📚 官方文档:https://ragflow.io/docs/dev/

    💡 小贴士:RAGFlow 支持飞书、Discord、Telegram、Line 等多聊天渠道接入(2026年6月更新),可快速将企业知识库接入到日常沟通工具中!

  • claude-mem —— 82.9K+ Stars,让 AI 智能体拥有跨会话持久记忆的开源工具

    🔥 GitHub 热门 AI 开源项目 · 第 21 期

    📌 项目简介

    claude-mem 是为所有 AI 智能体提供跨会话持久化记忆的开源工具。它能自动捕获 AI 代理在会话中的所有操作行为,通过 AI 压缩生成结构化记忆条目,并在后续会话中自动注入相关历史上下文。支持 Claude Code、OpenClaw、Codex、Gemini、Copilot 等主流 AI 编程工具,让无状态的 AI 代理拥有真正的”长期记忆”。

    🖼️ 项目预览

    claude-mem 项目预览
    claude-mem – AI 智能体跨会话记忆引擎

    ⚙️ 安装要求与过程

    环境要求

    • Node.js ≥ 18.0.0(核心运行环境)
    • ✅ 支持的操作系统:macOSLinuxWindows(WSL2 推荐)
    • ✅ 已安装任意支持的 AI 工具:Claude Code / OpenClaw / Codex / Gemini CLI / Copilot 等
    • ✅ 网络畅通(需访问 AI 供应商 API)

    快速安装

    # 交互式安装(推荐)
    npx claude-mem install
    
    # 指定参数安装
    npx claude-mem install --provider gemini --model gemini-pro
    
    # 安装后修复(如遇问题)
    npx claude-mem repair
    
    # 查看版本
    npx claude-mem --version

    Server Beta 模式(团队协作)

    # 配置环境变量
    export CLAUDE_MEM_RUNTIME=server-beta
    export CLAUDE_MEM_SERVER_DATABASE_URL=postgres://user:pass@localhost:5432/claudemem
    
    # 启动 API 服务
    claude-mem server start
    
    # 启动生成 Worker
    claude-mem server worker start

    ✨ 核心功能

    1. 全自动上下文捕获与注入

    无需任何手动标注,claude-mem 自动捕获会话中的所有工具调用、文件读写、代码编辑等行为,通过 AI 压缩生成结构化记忆条目。新会话启动时,自动注入最相关的历史上下文,让 AI 代理”记得”之前做过的工作。

    2. 多工具统一支持

    原生支持 Claude CodeOpenClawCodexGeminiHermesGitHub CopilotOpenCode 等主流 AI 编程工具。同时支持通过 MCP 协议接入 Cursor、Windsurf 等更多 IDE,真正实现”一次安装,处处可用”。

    3. 可视化记忆管理

    内置 Web 查看器(默认 localhost),可实时查看 AI 代理的操作记录、生成的记忆条目、会话统计等信息。支持按项目筛选记忆内容,可手动触发项目全量学习(/learn-codebase),帮助 AI 快速理解代码库。

    4. 企业级多租户支持(Server Beta)

    支持基于 Postgres 的独立服务端部署,无需依赖本地 Worker 进程。提供团队/项目级别的权限隔离、API Key 管理、操作审计链路,支持 Docker 容器化部署和水平扩展,满足企业协作场景需求。

    5. 成本优化遥测

    采用 5 分钟滚动窗口聚合遥测事件,可降低 99.9% 的 PostHog 使用成本。支持历史遥测数据匿名化回填,AI 生成任务幂等性设计避免重复计费,用户可自主选择是否开启遥测。

    💡 典型使用场景

    场景一:多日开发项目的上下文延续

    你正在用 Claude Code 开发一个复杂功能,工作日结束时会话上下文已达到上限。第二天开始新会话时,claude-mem 自动注入昨天的设计决策、修改的文件、遇到的问题等关键上下文,让你无需重新解释项目背景,直接继续开发。

    场景二:团队协作中的知识共享

    在团队项目中,开发者 A 用 Claude Code 完成了某个模块的开发。通过 claude-mem 的 Server Beta 模式,团队成员 B 在新会话中也能获取到 A 的开发上下文,包括设计思路、踩过的坑、未完成的 TODO 等,实现 AI 辅助开发的”知识传承”。

    场景三:跨工具开发体验统一

    你白天用 Claude Code 开发,晚上用 Gemini CLI 做代码 Review。claude-mem 作为统一的记忆层,让不同 AI 工具之间共享上下文,无论在哪个工具中操作,AI 都能”记得”你之前做过什么。

    🌟 推荐理由

    AI 编程工具的最大痛点之一就是会话结束后上下文丢失——你花了半小时给 AI 解释项目背景,新会话又要重新来一遍。claude-mem 从根本上解决了这个问题。

    我特别欣赏它的零摩擦设计:安装后无需任何手动操作,AI 代理的所有行为都会被自动捕获和压缩。当你开始新会话时,相关记忆会自动注入,就像 AI “自然记得”之前的工作一样。

    另一个亮点是多工具统一支持。如果你像我一样同时使用多个 AI 编程工具,claude-mem 提供了一个统一的记忆层,让不同工具之间可以共享上下文。这比每个工具各自维护记忆要高效得多。

    项目的活跃度也很高,截至目前已有 82,991 个 Stars,最近更新在 2026 年 6 月,说明维护团队在持续迭代。Apache-2.0 许可也让它可以放心用于商业项目。


    📥 下载地址

    💡 小贴士:安装完成后,在 AI 工具中输入 /learn-codebase 可触发项目全量学习,让 AI 更快理解你的代码库。查看记忆内容可访问安装时显示的 Web 查看器地址(默认 http://localhost:<端口>)。