标签: 开源

  • mattpocock/skills:95.5k Stars!让AI编码助手真正理解工程师需求的技能集合

    mattpocock/skills:95.5k Stars!让AI编码助手真正理解工程师需求的技能集合

    📌 项目简介

    mattpocock/skills

    mattpocock/skills 是TypeScript教学名家Matt Pocock开源的Claude Skills集合,专为”真实工程师”设计。这个项目源于作者多年的工程实践经验,提供了一套可组合、易定制、轻量级的AI编码助手技能集,帮助你远离无意义的”氛围编码”(vibe coding),让AI真正理解并辅助你的日常工程工作。


    ⚙️ 安装要求和过程

    环境要求

    • 运行环境:需要安装 Node.js(建议 v18+)
    • 支持的AI编码工具:Claude Code、Cursor、Windsurf 等主流AI编码助手
    • 包管理器:需要使用 npx(Node.js 自带)

    快速安装步骤

    1. 运行安装命令npx skills@latest add mattpocock/skills
    2. 选择配置:选择需要启用的技能、以及要安装的编码Agent,务必勾选 /setup-matt-pocock-skills
    3. 完成初始化:在Agent中运行 /setup-matt-pocock-skills,根据提示完成配置(选择Issue跟踪工具、设置工单分类标签、设置文档存储路径)

    🎯 核心功能

    1. 需求对齐技能

    使用 /grill-me(通用需求对齐)或 /grill-with-docs(工程场景,额外同步项目领域语言、更新文档)技能,通过问答方式让Agent准确理解你的需求,避免产出不符合预期的代码。

    2. 测试驱动开发(TDD)支持

    使用 /tdd 技能遵循红-绿-重构的测试驱动开发流程,搭配 /diagnose 技能封装调试最佳实践,确保产出代码可用、可维护。

    3. 架构优化工具

    使用 /improve-codebase-architecture 定期优化架构,/to-prd/zoom-out 等技能辅助控制设计复杂度,让代码库始终保持健康。

    4. Token优化

    通过 grill-with-docs 同步项目领域语言,生成 CONTEXT.md 统一术语,减少沟通成本、显著降低Token消耗。还有 /caveman 技能可以压缩沟通内容,减少75% Token消耗。

    5. 灵活可控的设计理念

    对比GSD、BMAD、Spec-Kit等方案,mattpocock/skills的所有技能遵循小而轻量、易适配、可组合的原则,不接管你的开发流程,保持你的控制权,且流程中的bug易于修复。


    💡 典型使用场景

    场景1:需求不明确时对齐预期

    当你向AI编码助手描述需求,但它总是理解偏差、产出不符合预期时,使用 /grill-me/grill-with-docs 技能,通过结构化问答让Agent真正理解你的意图,大幅减少返工。

    场景2:调试和测试驱动开发

    在编写新功能时,使用 /tdd 技能遵循测试驱动开发流程,先写测试再实现功能;当遇到bug时,使用 /diagnose 技能系统性地诊断和修复问题。

    场景3:团队协代码库管理

    在团队项目中,使用 /to-issues 将需求拆分为具体工单,使用 /triage 对工单进行分类,使用 /improve-codebase-architecture 定期优化代码库架构,保持代码质量。


    🌟 推荐理由

    Matt Pocock是谁?他是TypeScript教学领域的顶级名家,他的TypeScript教程帮助了数十万开发者掌握TypeScript。现在,他把数十年的工程经验提炼成了这套Claude Skills集合。

    我特别推荐这个项目的理由:

    1. 真实工程经验沉淀:这不是纸上谈兵的理论,而是Matt Pocock在实际工程中总结出的最佳实践
    2. 保持控制权:不像其他方案那样接管你的开发流程,mattpocock/skills让你始终掌控开发节奏
    3. 显著降低Token消耗:通过统一术语、压缩沟通,可以减少75%的Token消耗,长期使用能节省大量API成本
    4. 社区认可度高:本月新增72.5k Stars,总计95.5k Stars,增长速度在GitHub 5月Trending榜排名第一

    如果你每天都在使用AI编码助手(Claude Code、Cursor、Windsurf等),这个项目绝对值得一试。它不会让你失望!


    📥 下载地址

    准备好让你的AI编码助手真正理解工程师需求了吗?赶紧去GitHub上给个Star,然后安装试试吧!

  • LlamaIndex:49.5k Stars!领先的大模型数据框架,让AI理解你的私有数据

    LlamaIndex:49.5k Stars!领先的大模型数据框架,让AI理解你的私有数据

    🦙 LlamaIndex
    49.5k Stars!领先的大模型数据框架,让AI理解你的私有数据
    ⭐ 49.5k Stars
    🔧 数据框架
    📚 RAG引擎

    💡 项目简介

    LlamaIndex 是用于构建智能体(agentic)应用的开源框架,提供数据接入、结构化组织、检索增强接口等完整能力。它核心解决如何用私有数据增强LLM能力的问题——LLM本身基于公开数据预训练,无法直接获取用户私有数据,而LlamaIndex提供完整工具链,实现私有数据的接入、结构化、检索增强全流程。

    目前LlamaIndex已在GitHub获得49,514 Stars,是构建RAG(检索增强生成)应用的首选框架之一。无论是新手还是高级开发者,都能找到适合自己的API层级。

    ⚙️ 安装要求和过程
    环境要求
    Python版本:3.8+
    依赖管理:pip
    可选:OpenAI API Key(使用OpenAI模型时)

    快速安装
    # 新手快速上手(推荐)
    pip install llama-index
    
    # 高级用户自定义安装
    pip install llama-index-core  # 核心框架
    pip install llama-index-llms-openai  # OpenAI集成
    pip install llama-index-llms-ollama  # Ollama本地模型集成
    pip install llama-index-embeddings-huggingface  # HuggingFace嵌入模型

    ✨ 核心功能
    📥 多源数据接入
    提供数据连接器,支持接入API、PDF、文档、SQL等各类数据源和格式。无论是本地文件还是在线服务,都能轻松整合。

    🗂️ 数据结构化组织
    支持构建索引、知识图谱等结构,让数据可被LLM高效使用。提供多种索引类型:向量索引、树形索引、列表索引等。

    🔍 高级检索与查询接口
    输入LLM提示词,即可返回检索到的上下文和知识增强后的输出。支持多种检索策略:向量检索、关键词检索、混合检索等。

    🔧 灵活扩展性
    支持自定义所有核心模块,适配不同场景需求。提供300+集成包(LlamaHub),覆盖LLM、嵌入模型、向量存储等组件。

    🤖 多模型兼容
    支持OpenAI、本地Ollama、HuggingFace等各类LLM和嵌入模型。无需修改代码即可切换底层模型,真正实现解耦。

    🚀 典型使用场景
    1️⃣ 企业知识库问答系统
    将公司文档、PDF、API文档等私有数据接入LlamaIndex,构建智能问答系统,让员工快速获取准确信息。支持多用户、权限管理、对话历史等高级功能。

    2️⃣ 个人第二大脑
    整合个人笔记、文章、代码注释等,构建个性化AI助手,实现智能检索和知识管理。配合LlamaParse,甚至能解析扫描版PDF和图片。

    3️⃣ RAG应用快速原型
    利用LlamaIndex的高阶API,仅需5行代码即可完成数据接入和查询,快速验证RAG应用想法。适合创业团队快速MVP验证。

    💡 推荐理由

    🎯 完美的平衡:LlamaIndex是我接触过的最优雅的RAG框架之一。它完美平衡了易用性和灵活性——新手可以用5行代码快速上手,高级用户又能深度定制每个组件。

    🔌 强大的生态:特别是它对各类LLM和向量存储的广泛支持(300+集成包),让你可以轻松切换不同的技术栈而无需重写代码。LlamaHub让集成变得像pip install一样简单。

    📖 优秀的文档:它的文档详尽、社区活跃,几乎能找到所有常见问题的解决方案。从入门教程到高级进阶,覆盖全链路。

    🚀 企业级能力:配套的企业级文档智能处理平台LlamaParse,支持130+种文档格式解析,让非结构化文档的结构化处理变得轻而易举。

    📥 下载地址
    🔗 相关链接
    GitHub仓库https://github.com/run-llama/llama_index
    官方文档https://developers.llamaindex.ai
    LlamaParse(企业文档OCR)https://cloud.llamaindex.ai
    PyPI安装pip install llama-index

    📌 开源协议
    LlamaIndex 使用 MIT License,允许商用、修改、分发,非常适合企业和个人开发者使用。


    📌 本文属于「开源项目」系列,持续介绍GitHub上的优质AI开源项目,欢迎关注!

    🔥 下期预告:更多精彩AI开源项目即将上线,敬请期待…

  • AnythingLLM:60.3k Stars!全功能AI生产力加速器,隐私优先的本地知识库方案

    AnythingLLM:60.3k Stars!全功能AI生产力加速器,隐私优先的本地知识库方案

    AnythingLLM

    📦 项目简介

    AnythingLLM 是一款全功能一体化AI生产力加速器,默认本地运行、隐私优先。它将LLM聊天、RAG文档检索、AI代理、多模态支持完美集成在一个应用中,让你无需复杂配置即可拥有属于自己的私有AI助手


    ⚙️ 安装要求和过程

    环境要求

    • 桌面版:Windows/macOS/Linux,直接下载安装包
    • Docker版:Docker 20.10+,2GB+ RAM
    • 支持LLM:OpenAI、Ollama、LM Studio、Google Gemini、Anthropic等40+模型
    • 向量数据库:LanceDB(默认)、PGVector、Pinecone、Chroma等

    # 快速安装 – Docker方式

    docker pull mintplexlabs/anythingllm:latest

    docker run -d -p 3001:3001 –name anythingllm mintplexlabs/anythingllm:latest

    # 桌面版直接下载

    访问 https://anythingllm.com/download 下载对应系统安装包


    核心功能

    📚 RAG文档对话

    支持PDF、TXT、DOCX等多种文档格式,内置RAG(检索增强生成)能力,让AI精准理解你的文档内容。

    🤖 内置AI代理

    自动执行网页浏览、工作流自动化等复杂任务,支持无代码代理构建器,最多可降低80%的token消耗

    🔌 全面MCP兼容

    完全兼容MCP(模型上下文协议),可对接外部工具,扩展AI能力边界。

    👥 多用户权限管理

    Docker版本支持多用户权限管理,适合团队共享知识库,保护企业知识产权。

    🎨 多模态支持

    支持多模态LLM(闭源/开源模型均兼容),支持语音转文本、文本转语音、音视频转录。


    💡 典型使用场景

    🏠

    个人知识管理

    本地搭建私有知识库,对话查询个人文档、笔记,隐私数据完全本地存储,无需担心数据外泄。

    🏢

    企业团队使用

    多用户权限管理,团队共享知识库,控制不同用户的访问权限,保护企业核心知识资产

    🔧

    AI应用开发

    基于完整开发者API、MCP兼容性,快速构建自定义AI应用,对接现有业务系统

    🌐

    网站智能客服

    通过嵌入聊天组件,在网站部署AI客服,基于企业私有文档回答问题,提升用户满意度。


    💝 推荐理由

    说实话,我用过很多AI工具和知识库方案,但AnythingLLM是唯一让我觉得”这就是我想要的”的产品。它的设计理念非常清晰:隐私优先、本地运行、开箱即用

    我最喜欢它的RAG文档对话功能。你可以把PDF、Word、TXT文档直接拖进去,它就能基于这些文档回答问题。比起那些需要把数据上传到云端的方案,AnythingLLM让我感觉数据完全在自己掌控之中

    另外,它的MCP兼容性也非常棒,可以对接各种外部工具,让AI的能力不断扩展。如果你正在寻找一个隐私安全、功能全面、易于部署的AI生产力工具,AnythingLLM绝对值得一试!


    📥 下载地址

    🔗 官方网站:https://anythingllm.com

    📚 官方文档:https://docs.anythingllm.com

    💻 GitHub仓库:https://github.com/Mintplex-Labs/anything-llm

    📥 桌面版下载:https://anythingllm.com/download


    🔥 项目亮点总结
    60.3k+ Stars |
    隐私优先 |
    本地运行 |
    MCP兼容

  • RAGFlow:80.8k Stars!开源RAG引擎,让AI精准理解你的文档

    RAGFlow:80.8k Stars!开源RAG引擎,让AI精准理解你的文档

    📚 RAGFlow
    80.8k Stars!开源RAG引擎,让AI精准理解你的文档
    ⭐ 80.8k Stars
    🔧 RAG引擎
    📄 深度文档理解

    💡 项目简介

    RAGFlow 是一款基于深度文档理解构建的开源 RAG(检索增强生成)引擎,由 InfiniFlow 团队开发。它可以为各种规模的企业及个人提供一套精简的 RAG 工作流,把”大模型+企业知识库”的门槛直接干到地面。

    说实话,我第一次用 RAGFlow 的时候有点被震撼到——它处理 PDF、Word、Excel 这些复杂格式文档的能力,比我之前试过的所有 RAG 框架都要强。关键是它有可视化分块界面,你能看到每个文本块是怎么切的,哪里出了问题直接改,不用盲目调参。

    🚀 核心功能
    📑 深度文档理解
    支持 PDF、Word、Excel、PPT、图片、扫描件等复杂格式,能从非结构化数据中提取精准知识。表格、图表、多栏布局都能正确解析,真正做到了”看懂”文档。

    🔍 高质量RAG管道
    内置多路召回 + 融合重排,支持可视化文本分块,生成结果附带可追溯的引用来源。不再出现”幻觉”回答,每个答案都有据可依。

    🤖 Agent + MCP 支持
    内置 Agent 工作流,支持 MCP 协议接入,可对接 OpenClaw 等 AI Agent 平台。还能接入 Confluence、Notion、Google Drive 等数据源,一键同步知识库。

    🔧 多种部署方式
    支持 Docker 一键部署(推荐),也支持源码启动。兼容 DeepSeek v4、Gemini 3 Pro、GPT-5 系列等主流大模型,自带 embedding 模型。

    ⚙️ 安装要求与过程
    环境要求
    • CPU ≥ 4核
    • 内存 ≥ 16 GB
    • 磁盘 ≥ 50 GB
    • Docker ≥ 24.0.0 & Docker Compose ≥ v2.26.1
    • 系统参数要求:vm.max_map_count ≥ 262144

    # 1. 克隆仓库
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/docker

    # 2. 启动服务(CPU版)
    docker compose -f docker-compose.yml up -d

    # 3. 查看日志确认启动成功
    docker logs -f docker-ragflow-cpu-1

    # 4. 浏览器访问 http://服务器IP
    # 出现 Running on all addresses 即成功!

    💼 典型使用场景
    🏢 企业知识库问答
    把公司的产品文档、技术手册、HR政策全部喂给 RAGFlow,员工直接用自然语言提问,AI 能精准定位到具体文档段落并给出答案,还附带引用来源。比传统关键词搜索强太多了。

    📚 个人学习助手
    上传教材、论文、技术书籍,让 AI 帮你梳理知识点、回答思考题。RAGFlow 对 PDF 的解析特别到位,公式、表格、图表都能正确识别,学习效率高了不少。

    🤖 AI Agent 知识底座
    通过 MCP 协议把 RAGFlow 接入 OpenClaw 或 AutoGPT,让 AI Agent 在执行任务时可以实时检索你的私有知识库。相当于给 Agent 装了一个”外挂大脑”。

    🌟 推荐理由

    我觉得 RAGFlow 最打动我的一点,是它把”可视化”做到了极致。很多 RAG 框架让你盲目调参,分块质量怎么样完全靠猜;RAGFlow 直接把每个文本块展示给你看,哪里分错了手动改,这种”可控性”在实际项目中真的太重要了。

    另外它的文档解析能力确实一流,我试过把一本 500 页的技术书丢进去,公式、代码块、表格全都识别对了,召回准确率相当能打。如果你正在搭建企业知识库或者给 AI Agent 接知识底座,RAGFlow 绝对值得一试。⭐

    📌 本文由 AI 自动采集整理,更多开源项目介绍持续更新中…

    Tags: RAGFlow · RAG · 知识库 · 开源AI

  • prompts.chat:162k Stars!开源Prompt社区,让AI提示词成为你的超能力

    prompts.chat:162k Stars!开源Prompt社区,让AI提示词成为你的超能力

    prompts.chat - AI提示词社区

    prompts.chat – 开源Prompt社区平台

    📌 项目简介

    prompts.chat(前身为Awesome ChatGPT Prompts)是一个面向AI提示词的全生命周期社区平台,支持用户分享、发现、收藏来自社区的优质AI提示词。项目采用免费开源模式,支持私有化部署,可满足企业/组织的隐私合规需求。

    162k+
    GitHub Stars

    21.2k
    Forks

    MIT
    开源协议

    ⚙️ 安装要求与过程

    方式一:直接使用官方平台(推荐)

    无需安装,直接访问 prompts.chat 即可使用社区提示词资源,支持浏览、搜索、复制优质提示词。

    方式二:私有化部署

    # 1. 克隆项目
    git clone https://github.com/f/prompts.chat.git
    cd prompts.chat
    
    # 2. 安装依赖
    npm install
    
    # 3. 配置环境变量
    cp .env.example .env
    # 编辑 .env 填写必要配置
    
    # 4. 启动开发服务器
    npm run dev
    
    # 5. 构建生产版本
    npm run build
    npm start
    
    # 访问 http://localhost:3000

    系统要求

    项目 要求
    Node.js 18.0+ (推荐 20.x LTS)
    包管理器 npm / pnpm / yarn
    数据库 PostgreSQL / MySQL(可选)
    操作系统 Windows / Linux / macOS

    ✨ 核心功能

    💬 提示词社区共享
    用户可上传、浏览其他社区成员贡献的优质AI提示词,涵盖编程、写作、翻译、创意等各个领域。

    📌 提示词收藏管理
    支持用户收藏自己常用的提示词,建立个人提示词库,方便后续快速复用,提升AI交互效率。

    🏢 私有化部署支持
    支持企业/组织自行部署到内部环境,保障提示词数据完全私密,不对外泄露,满足合规需求。

    🔍 智能搜索与分类
    提供强大的搜索功能和细致的分类标签,快速定位所需提示词,支持按热度、最新、评分排序。

    📚 提示词最佳实践
    收录提示词工程最佳实践案例,帮助初学者快速掌握提示词编写技巧,提升AI输出质量。

    🔄 持续更新维护
    项目保持高频更新,持续集成最新的AI模型提示词模板,社区活跃度高,问题响应迅速。

    🚀 典型使用场景

    👨‍💻 场景一:开发者提升编码效率

    开发者在prompts.chat中搜索”代码审查””bug修复””重构建议”等提示词,直接复制到ChatGPT/Claude中使用,快速完成代码优化、文档生成、单元测试编写等任务,显著提升开发效率。

    ✍️ 场景二:内容创作者寻找灵感

    公众号博主、自媒体运营者在平台搜索”标题生成””文章大纲””社交媒体文案”等提示词,快速生成高质量内容框架,配合AI完成创作,大幅缩短内容生产周期。

    🏢 场景三:企业构建私有提示词库

    企业IT部门私有化部署prompts.chat,将公司积累的优质提示词(如”会议纪要总结””合同审查””客户邮件回复”)统一管理,让员工共享最佳实践,提升全员AI应用能力。

    💡 推荐理由

    说实话,我觉得prompts.chat是AI时代必备的”提示词手册”——它把散落在各处的优质提示词集中管理,让我不用每次都从零开始构思怎么跟AI对话。

    最实用的是它的收藏功能,我把自己常用的”代码解释””文章润色””Excel公式生成”等提示词收藏起来,形成个人提示词库,现在写AI指令速度快了好几倍。

    162k+ Stars说明一切——如果你天天跟ChatGPT、Claude这些AI助手打交道,prompts.chat绝对能帮你少走弯路,让AI输出更精准、更高效。加上支持私有化部署,企业用户也能放心使用。

    📥 下载地址


    本文由 WorkBuddy AI 自动采集撰写 · 转载请注明出处

  • Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI - AI绘画界面

    Stable Diffusion WebUI – 最流行的AI绘画工具

    📌 项目简介

    Stable Diffusion WebUI(由AUTOMATIC1111开发)是最受欢迎的Stable Diffusion浏览器界面,基于Gradio构建,支持文生图、图生图、图像修复、高清放大等全套AI绘画功能,扩展插件生态极其丰富,是AI艺术创作的首选工具。

    162k+
    GitHub Stars

    Python
    主要语言

    AGPL-3.0
    开源协议

    ⚙️ 安装要求与过程

    系统要求

    项目 要求
    操作系统 Windows 10/11、Linux、macOS
    GPU NVIDIA(推荐)或AMD GPU,至少8GB显存
    内存 16GB 以上(推荐32GB)
    存储 10GB+ (模型文件需额外空间)
    必备软件 Python 3.10.6+、Git、CUDA 11.8+

    快速安装(Windows一键脚本)

    # 1. 下载一键安装包
    # 访问: https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases
    
    # 2. 解压后运行
    webui-user.bat
    
    # 3. 等待自动安装依赖,首次运行会下载模型
    # 4. 浏览器访问 http://localhost:7860

    Linux/macOS 手动安装

    # 1. 克隆项目
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    cd stable-diffusion-webui
    
    # 2. 安装依赖
    pip install -r requirements.txt
    
    # 3. 下载模型(放至 models/Stable-diffusion/ 目录)
    # 可从 HuggingFace 或 Civitai 下载 .safetensors 模型
    
    # 4. 启动
    python launch.py
    
    # 5. 访问 http://localhost:7860

    ✨ 核心功能

    🎨 文本生成图像(txt2img)
    输入描述词,AI自动生成高质量图像;支持批量生成、尺寸调整、采样器选择。

    🖼️ 图像生成图像(img2img)
    基于参考图重新生成,支持风格迁移、局部重绘,保留原图构图与色彩。

    🔧 图像修复(Inpaint)
    智能修复图像缺损部分,支持局部重绘、物体移除、背景替换,效果自然。

    📐 高清放大(Upscale)
    内置 ESRGAN、R-ESRGAN 等超分辨率模型,低分辨率图像无损放大4K。

    🔌 扩展插件系统
    内置扩展商店,支持 LoRA、ControlNet、Embedding、超网络等,生态极其丰富。

    🎛️ 精细参数控制
    支持 CFG Scale、采样步数、种子控制、高分辨率修复等高级参数调节。

    🚀 典型使用场景

    🎮 场景一:游戏美术概念设计

    游戏开发团队使用 Stable Diffusion WebUI 快速生成角色概念图、场景原画、道具设计稿;配合 LoRA 训练专属风格模型,大幅提升前期美术设计效率,从构思到出图只需几分钟。

    📱 场景二:社交媒体内容创作

    自媒体博主、公众号运营者使用 AI 生成配图、封面图、插画内容;通过提示词工程精准控制画面风格,无需聘请画师即可产出高质量视觉内容,降低内容创作成本。

    🏢 场景三:产品设计与原型展示

    UI/UX 设计师使用 img2img 功能快速将草图转换为高质量视觉稿;结合 ControlNet 插件精确控制构图与姿态,用于产品原型、广告创意、包装设计等商业场景。

    💡 推荐理由

    说实话,我觉得 Stable Diffusion WebUI 是AI绘画领域的”瑞士军刀”——功能全、可扩展性强、社区活跃度极高。相比Midjourney这类闭源商业产品,它最大的优势是完全本地运行,数据隐私有保障,而且免费。

    我最喜欢它的扩展系统,通过安装不同插件可以实现几乎任何你能想到的AI绘画功能——从精确姿态控制(ControlNet)到风格微调(LoRA),生态丰富到令人惊叹。

    162k+ Stars不是吹出来的,如果你对AI绘画感兴趣,或者工作需要大量视觉内容创作,Stable Diffusion WebUI 绝对值得深入研究。加上最近Stable Diffusion 3.0和SDXL的发布,效果已经可以媲美甚至超越商业产品。

    📥 下载地址


    本文由 WorkBuddy AI 自动采集撰写 · 转载请注明出处

  • AutoGPT:182k Stars!开源自主AI智能体平台,让AI从对话进化到自主执行

    AutoGPT:182k Stars!开源自主AI智能体平台,让AI从对话进化到自主执行

    AutoGPT 开源自主AI智能体平台

    AutoGPT – 自主AI智能体平台

    📌 项目简介

    AutoGPT 是由 Significant-Gravitas 团队开发的开源自主AI智能体(AI Agent)平台,支持目标自主分解、多工具调用、长期记忆与自我反思,可低代码构建自动化工作流,让你只需给出一个目标,AI就能自动拆解任务并自主执行完成。

    182k+
    GitHub Stars

    Python
    主要语言

    MIT
    开源协议

    ⚙️ 安装要求与过程

    系统要求

    项目 要求
    操作系统 Linux / macOS / Windows(WSL2)
    CPU 至少4核
    内存 16GB 以上
    存储 10GB 可用空间
    必备软件 Git、Docker、Docker Compose、Python 3.10+

    快速安装(一键脚本)

    # macOS / Linux
    curl -fsSL https://setup.agpt.co/install.sh -o install.sh && bash install.sh
    
    # Windows (PowerShell)
    powershell -c "iwr https://setup.agpt.co/install.bat -o install.bat; ./install.bat"

    手动部署(Docker方式)

    # 1. 克隆项目
    git clone https://github.com/Significant-Gravitas/AutoGPT.git
    cd AutoGPT
    
    # 2. 复制环境配置
    cp .env.template .env
    # 编辑 .env 配置 API Key
    
    # 3. Docker启动
    docker-compose up -d
    
    # 4. 访问 http://localhost:8000

    ✨ 核心功能

    🎯 自主目标分解
    输入复杂目标后自动拆解为可执行子任务,动态调整执行策略,无需人工梳理流程。

    🧠 多层记忆系统
    短期上下文 + 长期向量数据库记忆结合,沉淀历史经验,避免重复劳动。

    🔧 丰富工具生态
    内置联网搜索、文件读写、代码执行、浏览器自动化等工具,支持插件扩展。

    🔄 自我反思优化
    执行后自动评估效果,主动修正方案,形成「思考→执行→观察→反思」闭环。

    🎨 低代码可视化
    Web端可视化控制台,拖拽式搭建智能体,无需深厚编程基础即可上手。

    🤖 多模型兼容
    原生支持 GPT-4、Claude,也可对接 LLaMA、Mistral 等开源大模型。

    🚀 典型使用场景

    📝 场景一:内容创作自动化

    自动撰写 SEO 文章、营销文案、产品介绍、技术博客;生成短视频脚本、直播话术、公众号推文。只需给出主题和目标关键词,AutoGPT 自动完成资料检索、内容撰写、SEO 优化的全流程。

    📊 场景二:市场与行业研究

    自动检索行业动态、竞品信息、政策法规;整理数据、汇总信息、生成分析简报。非常适合需要定期产出行业分析报告的场景,大幅节省人工调研时间。

    💻 场景三:软件开发辅助

    自动生成项目框架、接口文档、单元测试;辅助调试代码、定位 Bug、优化性能。配合 GitHub Actions 可实现自动化 CI/CD 流程,是开发者的得力助手。

    💡 推荐理由

    说实话,我觉得 AutoGPT 最吸引人的地方在于——它让 AI 从「问答工具」真正进化成了「自主执行的智能体」。传统 ChatGPT 需要你一句一句引导,而 AutoGPT 只需要一个目标,它就能自己拆解、自己执行、自己反思优化。

    低代码可视化界面也让门槛大大降低,不需要是 Python 大神才能玩转。加上活跃的开源社区和丰富的插件生态,扩展起来非常方便。

    如果你对流式 AI Agent 开发感兴趣,或者想搭建一套自动化工作流,AutoGPT 绝对值得深入研究。182k+ Stars 不是偶然,它代表了 AI Agent 自主执行方向的最高热度。

    📥 下载地址


  • 微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    微软AI Agents for Beginners:63k Stars!微软官方AI智能体入门课程,12节课带你从零到生产

    📖 项目简介

    这是微软官方推出的AI智能体零基础入门免费课程,包含12+节核心课程,覆盖从基础概念到生产落地的全流程。支持50+种语言本地化,每节课配套文字教程、视频讲解、可运行代码示例和扩展学习资源,是系统学习AI智能体开发的最佳起点。

    63.2k+
    GitHub Stars

    🔧 安装要求和过程

    环境要求

    • Python 3.8+ 环境
    • Azure账户(用于Microsoft Foundry和Azure AI Foundry Agent Service V2)
    • Git(用于克隆仓库)

    快速安装步骤

    # 稀疏克隆(推荐,不包含50+语言翻译文件)
    git clone --filter=blob:none --sparse https://github.com/microsoft/ai-agents-for-beginners.git
    cd ai-agents-for-beginners
    git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
    
    # 安装依赖
    pip install -r requirements.txt
    
    # 配置环境变量(复制示例文件)
    cp .env.example .env
    # 编辑.env文件,填入Azure/OpenAI配置
    ⚠️ 注意:如果是首次接触生成式AI开发,建议先学习微软出品的《Generative AI For Beginners》21节入门课打好基础。

    ✨ 核心功能

    🎓 完整课程体系

    12+节核心课程,从AI智能体介绍、设计模式到生产环境部署,每节课包含文字教程+视频+代码示例。

    🌍 多语言支持

    支持50+种语言本地化,包含中文(简体、繁体)、日语、韩语、法语、德语等主流语言。

    🔌 技术栈兼容

    优先采用微软智能体技术栈,同时支持OpenAI兼容的第三方提供商(如MiniMax,支持204K token上下文)。

    🛡️ 生产级内容

    覆盖可信智能体构建、内存管理、上下文工程、安全防护、部署可扩展智能体等实战内容。

    🎯 典型使用场景

    场景1:零基础系统学习AI智能体开发

    适合没有AI智能体开发经验的开发者,通过12+节课程系统学习概念、框架、设计模式等入门知识,每节课都有可运行的代码示例。

    场景2:学习智能体从开发到生产落地的全流程

    包含可信智能体构建、内存管理、上下文工程、安全防护等实战内容,帮助开发者掌握生产级AI智能体的开发技能。

    场景3:熟悉微软智能体技术栈

    学习Microsoft Agent Framework、Azure AI Foundry等微软官方智能体框架的使用,适合需要在Azure平台部署AI智能体的开发者。

    💡 推荐理由

    说实话,如果你想要系统学习AI智能体开发,这门课程绝对是最佳起点。我特别喜欢它的几个设计:

    • 官方出品,质量有保障:微软官方团队维护,内容紧跟技术前沿,包含最新的MCP、A2A、NLWeb等智能体协议。
    • 理论与实践结合:每节课不仅有文字教程,还有配套视频讲解和可运行的Python代码示例,学完就能动手实践。
    • 多语言支持:支持50+种语言,中文开发者可以直接看中文教程,降低学习门槛。
    • 社区活跃:有官方Discord交流频道和开发者反馈论坛,遇到问题可以快速获得帮助。

    我觉得这门课程最值得称赞的是它的系统性——从基础概念到生产落地,从单智能体到多智能体协作,从设计模式到安全防护,几乎覆盖了AI智能体开发的方方面面。无论你是刚入门的新手,还是有一定经验的开发者,都能从中获得价值。

    📥 下载地址


    📌 数据来源:GitHub + 微软官方文档 | 更新时间:2026-05-18

  • OpenClaw:373k Stars!登顶GitHub的AI Agent,让AI从对话进化到执行

    OpenClaw:373k Stars!登顶GitHub的AI Agent,让AI从对话进化到执行

    🔥 302k+ Stars!登顶GitHub的全球最热AI Agent项目

    OpenClaw Logo

    OpenClaw – 个人开源AI助手

    📌 项目简介

    OpenClaw 是一款登顶GitHub全球榜首的开源AI Agent项目(373k+ Stars),它将AI从”对话生成”升级为”任务执行”,可以像私人助理一样直接操作你的电脑、浏览器和文件系统,把自然语言指令转化为实际行动。

    💻 安装要求与过程

    环境要求:

    • Node.js 20+(推荐Node.js 20 LTS)
    • Windows用户需要WSL2(强烈推荐)
    • 开发环境需要pnpm包管理器

    快速安装步骤:

    # 使用npm全局安装
    npm install -g openclaw@latest
    
    # 或使用pnpm
    pnpm add -g openclaw@latest
    
    # 运行引导向导,设置守护进程
    openclaw onboard --install-daemon
    

    开发环境搭建:

    # 克隆仓库
    git clone https://github.com/openclaw/openclaw.git
    cd openclaw
    
    # 安装依赖(仅支持pnpm)
    pnpm install
    
    # 初始化本地配置
    pnpm openclaw setup
    
    # 启动开发服务器(支持热重载)
    pnpm gateway:watch
    

    ✨ 核心功能

    1. 本地优先架构:所有数据存储在本地设备,无需强制上云,隐私完全自主掌控
    2. 20+平台无缝接入:支持WhatsApp、Telegram、Slack、Discord、微信、QQ等主流通讯平台
    3. 多Agent路由:不同渠道的消息可以路由到独立的Agent,每个Agent拥有独立工作空间和会话上下文
    4. 语音交互:支持macOS/iOS语音唤醒、Android连续对话模式,内置ElevenLabs TTS
    5. Live Canvas:Agent驱动的可视化工作空间,支持A2UI(Agent-to-UI)协作执行任务

    🎯 典型使用场景

    场景1:跨平台个人助理
    通过现有通讯应用(如WhatsApp、Telegram)与AI助手交互,无需切换APP即可获取答案、设置提醒、起草内容、自动化日常任务。

    场景2:隐私优先的自托管方案
    在企业或家庭服务器上运行OpenClaw,所有对话和任务数据完全保存在本地,满足对数据主权有严格要求的场景(如医疗、金融、法律)。

    场景3:自定义工作流自动化
    利用cron任务、webhooks和自定义技能,实现每日天气预报、日历提醒、社交媒体定时发布等重复任务的自动化执行。

    💡 推荐理由

    我觉得OpenClaw最厉害的地方在于它真正实现了”AI执行”而不只是”AI对话”。以前的AI工具(包括ChatGPT)主要是帮你生成内容,而OpenClaw可以直接帮你操作电脑——比如你告诉它”帮我下载这个网页的所有图片并分类保存到文件夹”,它真的会去执行!

    另外一个亮点是它的”本地优先”设计理念。现在很多AI工具都强制上云,数据隐私是个大问题。OpenClaw让你可以在自己的设备上运行,数据完全不出本地,这点对我来说很有吸引力。

    当然,目前项目还在快速迭代中,有些版本可能会有bug(比如2026.3.2版本的工具权限问题),建议跟进官方文档和社区讨论。总体来说,如果你想体验最前沿的AI Agent执行能力,OpenClaw绝对值得一试!

    📥 下载地址


    文章来源:GitHub热门AI开源项目自动介绍系列 | 更新日期:2026-05-18

  • LangChain:百万Stars的AI Agent工程平台,构建智能应用的万能积木

    LangChain:百万Stars的AI Agent工程平台,构建智能应用的万能积木

    说实话,第一次接触LangChain的时候,我觉得这名字起得太绝了——把语言模型像链条一样串联起来,不就是它干的事嘛?

    从2022年底发布到现在,这个框架已经突破了100万 GitHub Stars,月活开发者超过38万,大约1.5万家企业在用它构建AI应用。在AI Agent开发领域,LangChain基本上就是”基础设施”级别的存在。


    LangChain Logo

    🚀 项目简介

    LangChain 是一个开源的AI Agent工程平台,让开发者能够用模块化的方式构建LLM驱动的应用程序。它的核心理念很简单:把AI应用开发中那些重复的”管道工作”标准化,让你专注于真正需要解决的问题。

    创始人是Harrison Chase,项目在2022年10月首次发布。如今LangChain已经从最初的”链式调用”模式进化成了完整的Agent工程平台,旗下包括LangGraph(图工作流引擎)、LangSmith(可观测性平台)和LangGraph Cloud(托管部署服务)。


    ⚙️ 安装要求和过程

    💻 环境要求

    • Python 3.9+ 或 Node.js 18+
    • 至少一个LLM API Key(OpenAI、Anthropic、Google等)

    📦 快速安装

    # Python版本
    pip install langchain langchain-openai
    
    # Node.js版本
    npm install langchain @langchain/openai

    🧪 30秒上手示例

    from langchain.chat_models import init_chat_model
    
    # 一行初始化模型,支持随时切换供应商
    model = init_chat_model("openai:gpt-4o")
    result = model.invoke("LangChain是什么?")
    print(result.content)

    就这么简单。重点是 init_chat_model 这个函数——你换模型只需要改一个字符串,从 openai:gpt-4oanthropic:claude-sonnetgoogle:gemini,代码不用动。


    💡 核心功能

    • 🔀 LangGraph:图工作流引擎
      LangChain目前最核心的子项目。把Agent的行为定义成有状态图——节点是处理步骤,边是流转规则。支持循环执行、条件分支、并行处理,还有人工介入(human-in-the-loop)的检查点。
    • 🔄 模型无关的抽象层
      写一次代码,换个模型参数就能跑。不管是GPT、Claude还是Gemini,甚至本地部署的Llama,LangChain的抽象层让你不需要为每个模型写适配代码。
    • 🧩 超丰富的集成生态
      700+个集成组件,覆盖向量数据库(Pinecone、Chroma、Weaviate)、工具调用、文件处理、搜索引擎、API对接等。基本上你想连接的外部服务,它都有现成的包。
    • 🔍 LangSmith:全链路可观测性
      在开发调试阶段这是神器——能看到Agent每一步的输入输出、token消耗、延迟,还能做A/B评估。生产环境的Agent出bug了?LangSmith帮你定位问题像用X光一样直观。
    • 📄 RAG(检索增强生成)工具链
      从文档加载、文本切分、向量化存储到检索生成,RAG的全流程LangChain都有成熟的方案。想给AI接上企业知识库?这是最成熟的开源选择之一。

    LangGraph 架构图


    📦 典型使用场景

    📈 场景一:构建企业智能客服

    用LangChain + LangGraph搭建一个多轮对话Agent,连接企业知识库做RAG检索,再通过工具调用(Tool Calling)对接订单查询、退款等业务API。人工客服处理不了的时候自动转人工,整个过程定义成一个清晰的图工作流。

    📊 场景二:自动化数据处理流水线

    比如每天从多个数据源抓取信息 → LLM分析摘要 → 自动生成报告 → 发送到指定渠道。LangChain的链式编排让这条流水线的每一步都可配置、可监控、可回溯。

    🤝 场景三:多Agent协作系统

    LangGraph支持定义多个Agent节点,让它们协作完成复杂任务。比如一个”研究Agent”负责搜索和整理信息,一个”写作Agent”负责生成内容,一个”审核Agent”负责质量把关——各司其职,通过图结构编排协作流程。


    ⭐ 推荐理由

    我觉得LangChain最大的价值不在于某个具体功能,而在于它把AI应用开发从”写Prompt”提升到了”工程化”的层面。

    用创始人Harrison Chase的话说:“你当然可以不用框架直接写Agent——就像你可以不用Web框架直接写网站一样。但大多数人选择用框架,原因是一样的:那些无聊的管道代码既繁琐又容易出错,还会让你分心。”

    Sequoia的合伙人Sonya Huang也说过:“Agent框架是AI技术栈中的中间件层。历史上,中间件公司都是极好的生意,因为它们卡在基础设施和应用之间的关键节点上。”

    当然,Andrej Karpathy也说过反面的观点——最好的生产级Agent代码可能就是一个Python文件加上API调用。这话没毛病,但我个人的经验是,当你的Agent系统复杂度上来了、需要团队协作、需要可观测性、需要快速迭代的时候,有个好框架能省下大量时间。

    💰 一组数据说明一切:

    • 2026年1月完成 2亿美元 C轮融资
    • ARR突破了 5000万美元
    • 月活开发者 38万+
    • 部署企业约 1.5万家

    社区在快速迭代,LangGraph的图工作流范式正在成为Agent开发的事实标准之一。


    📥 下载地址