标签: GitHub

  • 【开源推荐】OpenClaw:37.8万+ Stars!支持微信/QQ的全平台私人AI助手,数据完全本地存储

    【开源推荐】OpenClaw:37.8万+ Stars!支持微信/QQ的全平台私人AI助手,数据完全本地存储

    ⭐ 378K+ Stars
    TypeScript
    AI助手
    开源MIT

    📌 项目简介

    OpenClaw 是一款运行在你自己设备上的私人AI助手,支持在你已经使用的所有聊天平台上与你对话——包括微信、QQ、WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、Matrix等25+个平台

    OpenClaw 的愿景是让每个人都能拥有一个真正属于自己的AI助手——数据本地存储、跨平台无缝使用、支持语音唤醒和实时画布。项目由 OpenAI、GitHub、NVIDIA、Vercel 等机构赞助,自2025年11月发布以来迅速获得37.8万+ Star,是2026年最炙手可热的个人AI助手开源项目之一。

    🔧 安装要求和过程

    环境要求

    • 运行时:Node 24(推荐)或 Node 22.19+
    • 操作系统:Windows / macOS / Linux / Android / iOS
    • AI模型:支持 OpenAI、Anthropic、Gemini、DeepSeek、本地OAI模型等主流模型
    • 可选依赖:Docker(用于沙箱执行)、Discord/Slack Token(用于接入对应平台)

    快速安装(2步搞定)

    第一步:全局安装 OpenClaw

    npm install -g openclaw@latest
    # 或使用 pnpm
    pnpm add -g openclaw@latest

    第二步:运行引导向导,配置网关、工作区、频道和技能

    openclaw onboard –install-daemon

    安装完成后,OpenClaw 会以守护进程方式常驻后台(通过 launchd/systemd 管理),随时等待你的消息。

    测试是否运行正常

    # 查看网关状态
    openclaw gateway status

    # 发送测试消息
    openclaw message send –target +你的手机号 –message “Hello from OpenClaw”

    # 与AI助手对话
    openclaw agent –message “帮我写一个Python爬虫” –thinking high

    ⚠️ Windows用户注意:Windows 用户可以使用原生 Windows Hub companion 应用进行设置,支持系统托盘状态显示、聊天、节点模式和本地MCP模式。

    ✨ 核心功能

    🌐 1. 全平台频道支持,一个助手到处用

    OpenClaw 支持在你已经使用的所有平台上与AI助手对话,无需切换应用:

    • 国际平台:WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、IRC、Microsoft Teams、Matrix、LINE、Mattermost
    • 中国平台微信(WeChat)QQ、飞书(Feishu)
    • 其他:Twitch、Zalo、Nostr、Nextcloud Talk、Synology Chat、WebChat

    无论你在哪个平台发消息,OpenClaw 都能响应,真正实现”一个AI助手,全平台通用”。

    🎙️ 2. 语音唤醒 + 对话模式

    支持 Voice Wake(语音唤醒)Talk Mode(对话模式)

    • macOS / iOS:支持唤醒词触发,无需手动打开应用
    • Android:支持连续语音对话(基于ElevenLabs + 系统TTS降级方案)
    • 让你像和真人助理一样,用语音与AI自然交流

    🖼️ 3. 实时画布(Live Canvas)

    OpenClaw 提供 Agent驱动的实时可视化工作区,支持 A2UI协议。AI可以动态生成和修改界面元素,实现真正的”所见即所得”AI协作体验。

    比如在 macOS 上,AI可以帮你实时渲染图表、预览代码效果、可视化数据结构——所有这些都在一个动态画布上完成。

    🤖 4. 多Agent路由,隔离不同会话

    OpenClaw 支持 多Agent路由:可以将不同的频道/账号/联系人路由到隔离的Agent(独立工作区 + 独立会话),实现:

    • 工作账号和私人账号使用不同的AI配置
    • 不同项目使用独立的上下文和技能
    • 团队协作时每个人有专属的AI工作区

    🔌 5. 丰富工具生态 + MCP扩展支持

    OpenClaw 内置一流工具支持,并可通过 MCP(Model Context Protocol) 扩展:

    • 内置工具:浏览器自动化、实时画布、节点管理、定时任务(cron)、多会话管理、Discord/Slack操作
    • MCP扩展:兼容所有MCP服务器,可接入任意第三方工具
    • 技能市场ClawHub 提供大量社区贡献的技能包,一键安装

    🔒 6. 本地优先 + 沙箱安全

    OpenClaw 采用 本地优先(Local-first) 架构:

    • 所有数据存储在本地设备,不会上传到云端
    • 默认情况下,main 会话的工具有完整主机访问权限(因为你就是唯一用户)
    • 群组/频道场景可启用 沙箱模式(Docker/SSH/OpenShell后端),隔离非main会话的工具执行
    • 默认DM(私信)需配对验证,防止未知用户操控你的AI

    💡 典型使用场景

    场景一:跨平台个人AI助手

    无论你用的是微信、QQ、WhatsApp还是Telegram,都可以通过同一个AI助手处理任务——查资料、写代码、安排日程、管理邮件,全部在一个对话里完成。

    示例:在微信里对OpenClaw说”帮我总结今天的重要邮件”,AI会自动连接你的邮箱、提取关键信息并回复到微信。

    场景二:多项目AI工作区隔离

    如果你同时参与多个项目,可以为每个项目配置独立的Agent工作区,不同的上下文、不同的工具权限、不同的AI模型配置,互不干扰。

    示例:工作项目A使用Claude模型 + GitHub工具,个人项目B使用GPT模型 + 浏览器工具,两个项目的对话历史和配置完全隔离。

    场景三:语音驱动的家庭AI助理

    在 macOS/iOS/Android 上,通过语音唤醒词激活OpenClaw,进行语音对话。配合Home Assistant等智能家居平台,可以用语音控制家中设备。

    示例:说一句”Hey Claw,帮我关掉客厅的灯,并提醒我明天下午3点开会”,AI会自动完成这些操作。

    🌟 推荐理由

    • 真正的全平台覆盖:目前开源AI助手中,同时支持微信和QQ的极为罕见。OpenClaw 对国内用户非常友好,微信/QQ原生支持是最大亮点。
    • 本地优先,隐私安全:数据全部存在本地,无需担心隐私泄露。 compared to 云端AI助手(如ChatGPT App),OpenClaw让你真正”拥有”自己的AI。
    • 活跃的社区和赞助:OpenAI、GitHub、NVIDIA、Vercel 均为其赞助方,项目更新频繁(最近版本2026.6.6,几乎每天都有更新),长期维护有保障。
    • 架构先进,扩展性强:基于MCP协议、支持多Agent路由、沙箱隔离、实时画布,技术栈非常现代,适合开发者深度定制。
    • 37.8万Star不是偶然:项目2025年11月才创建,7个月内获得37.8万星,增长速度在AI开源项目中极为罕见,代表了真实的市场需求。

    个人使用感受:OpenClaw 最大的价值在于打破了AI助手的平台壁垒。以前要用AI助手,得打开特定的App或网页;现在无论你在微信、QQ还是Telegram,都能直接@你的AI助手。特别是对国内用户,微信/QQ的支持是巨大优势——这意味着你可以用最熟悉的方式,使用最强大的AI能力。如果你希望拥有一个真正”随时随地”的AI助手,OpenClaw 是目前最好的开源选择。

    📥 下载地址

    🔗 GitHub仓库:https://github.com/openclaw/openclaw(37.8万+ Stars)

    🌐 官方网站:https://openclaw.ai

    📖 官方文档:https://docs.openclaw.ai

    🚀 快速开始:https://docs.openclaw.ai/start/getting-started

    🔧 技能市场:https://clawhub.ai

    💬 Discord社区:https://discord.gg/clawd


    本文由自动化任务每日精选GitHub热门AI开源项目整理发布。项目数据截止2026年6月13日。

  • 【开源推荐】Agent-Reach:26.7K+ Stars!给AI Agent装上「全网眼睛」,免费读取Twitter/Reddit/YouTube/B站

    【开源推荐】Agent-Reach:26.7K+ Stars!给AI Agent装上「全网眼睛」,免费读取Twitter/Reddit/YouTube/B站

    ⭐ 26.7K+ Stars
    Python
    CLI工具

    📌 项目简介

    Agent-Reach 是一款为AI Agent提供全互联网内容访问能力的开源CLI工具,将Twitter、Reddit、YouTube、B站、小红书、抖音、GitHub、微信公众号等主流平台的信息获取能力封装为开箱即用的命令行工具,无需支付任何API费用

    AI Agent在信息获取上一直存在明显短板:无法直接访问社交平台、受限于API费用、配置复杂繁琐。Agent-Reach正是为解决这些痛点而生——它相当于给AI Agent一键装上了”全网眼睛”,让Claude Code、Cursor、OpenClaw等AI编程助手能够自由获取互联网上的实时信息。

    🔧 安装要求和过程

    环境要求

    • 操作系统:Windows / macOS / Linux
    • Python版本:3.8+
    • 依赖:可运行shell命令的AI Agent(Claude Code、Cursor、OpenClaw、Windsurf、Codex等)
    • 可选:Chrome浏览器(用于Cookie导出)

    快速安装(3步搞定)

    第一步:打开你的AI Agent(Claude Code/Cursor/OpenClaw等),输入以下指令:

    帮我安装 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md

    第二步:等待自动安装完成(工具会自动处理依赖、代理配置、Cookie登录等)

    第三步:安装完成后,对Agent说”测试一下Agent Reach”,验证各平台连通性

    ⚠️ OpenClaw用户注意:需先开启exec权限,执行 openclaw config set tools.profile "coding",或在 ~/.openclaw/openclaw.json 中设置 "tools": { "profile": "coding" },之后重启Gateway(openclaw gateway restart)并开启新对话。

    更新方法

    帮我更新 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/update.md

    ✨ 核心功能

    🌐 1. 开箱即用,无需任何配置

    以下平台安装后即可使用,无需API Key或账号配置:

    • 网页:直接读取任意网页内容,自动清理冗余HTML
    • YouTube:提取视频字幕、搜索视频
    • RSS:订阅并读取任意RSS/Atom源内容
    • 微信公众号:搜索内容、阅读全文(输出为Markdown格式)
    • 微博:获取热搜、用户动态、评论
    • V2EX:查看热门帖子、节点帖子、帖子详情+回复
    • 全网搜索:支持语义搜索,自动配置无需API Key

    🔑 2. 简单配置后解锁更多平台

    以下平台只需简单配置即可解锁:

    • GitHub:访问私有仓库、管理Issue/PR、操作Fork
    • X(Twitter):搜索推文、浏览时间线、发布推文
    • B站:提取本地字幕、搜索内容
    • Reddit:读取帖子和评论
    • 小红书:阅读内容、搜索、发帖互动
    • 抖音:视频解析、无水印下载
    • LinkedIn:获取Profile详情、公司页面、职位搜索
    • 小宇宙播客:播客音频转文字(基于Whisper转录,提供免费Key)

    🩺 3. 一键诊断,问题排查超简单

    执行 agent-reach doctor 命令即可自动检测各平台连通性,定位问题并给出修复方案,大幅降低运维成本。

    🔒 4. 隐私安全,Cookie本地存储

    用户Cookie仅存储在本地,不会上传或外泄,避免账号信息泄露风险。需要Cookie的平台(Twitter、小红书等),优先使用Chrome插件Cookie-Editor导出Cookie,发送给Agent即可完成配置。

    🔌 5. 极强兼容性,无缝衔接现有工作流

    支持所有可运行命令行的AI Agent,包括Claude Code、OpenClaw、Cursor、Windsurf、Codex等,安装后即刻生效,无需修改现有工作流。

    💡 典型使用场景

    场景一:AI Agent信息检索增强

    解决AI Agent无法访问社交平台、内容社区的问题。你可以让Agent获取X(Twitter)最新舆论、Reddit海外讨论、小红书真实种草内容、B站热门视频、公众号一手资讯等。

    示例:对Claude Code说”帮我搜索Twitter上关于GPT-5的最新讨论并总结”,Agent会通过Agent-Reach自动获取Twitter内容并分析。

    场景二:多平台内容聚合分析

    可同时对接多个内容平台,实现跨平台内容搜集、整理、分析,无需手动逐个平台操作。

    示例:让AI Agent”帮我收集B站、小红书、微博上关于AI编程助手的最新讨论”,Agent会自动从三个平台获取内容并汇总分析。

    场景三:低门槛AI工具扩展

    无技术背景的用户也可以快速让AI Agent具备全网信息获取能力,无需处理反爬、代理配置、环境调试等复杂工作。只需一句话指令,AI Agent即可完成安装配置。

    🌟 推荐理由

    • 极低使用门槛:无需手动处理工具选型、依赖安装、代理配置、Cookie登录、数据清洗等复杂流程,一句指令即可完成安装,非技术用户也可快速上手。
    • 完全免费开源:所有能力免费开放,无需支付API费用,可自由修改、扩展功能。MIT协议,商业使用也无顾虑。
    • 解决真实痛点:AI Agent的信息获取能力一直是短板,Agent-Reach恰好填补了这一空白,让AI Agent真正具备”感知互联网”的能力。
    • 活跃维护中:项目创建于2026年2月,至今仍保持活跃更新(最后更新2026年6月12日),社区反馈响应及时。
    • 支持平台广泛:覆盖15+主流内容平台,且持续增加中,基本涵盖国内外主要信息源。

    个人使用感受:Agent-Reach最大的价值在于极大地降低了AI Agent获取实时信息的能力门槛。以前要让AI获取Twitter或Reddit的信息,需要申请API、处理认证、写爬虫脚本,现在只需安装一个工具,对AI说一句话就能搞定。对于需要AI辅助调研、信息搜集的场景,这个工具堪称必备。

    📥 下载地址

    🔗 GitHub仓库:https://github.com/Panniantong/Agent-Reach

    🌐 官方网站:通过GitHub README中的安装链接获取

    📦 安装文档:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md

    💬 问题反馈:通过GitHub Issues提交


    本文由自动化任务每日精选GitHub热门AI开源项目整理发布。项目数据截止2026年6月13日。

  • 【开源推荐】chrome-devtools-mcp:43.5K+ Stars!Google官方出品,让AI编程助手直接操控Chrome浏览器

    【开源推荐】chrome-devtools-mcp:43.5K+ Stars!Google官方出品,让AI编程助手直接操控Chrome浏览器

    🔥 GitHub 热门 AI 开源项目

    chrome-devtools-mcp

    43.5K+ Stars · Google Chrome 官方团队出品 · MCP 协议 · 浏览器自动化

    📌 项目简介

    chrome-devtools-mcp 是 Google Chrome DevTools 团队官方开源的 MCP(Model Context Protocol)服务器,它将 Chrome 浏览器的完整调试能力通过标准化协议暴露给 AI 编程助手。借助它,Claude Code、Cursor、Copilot、Antigravity 等 AI 工具可以直接控制浏览器、抓取性能数据、执行自动化测试,真正实现”AI 懂浏览器”。

    ⚙️ 安装要求与过程

    环境要求
    • Node.js LTS 长期支持版
    • Google Chrome 稳定版或更新版本
    • npm 包管理工具
    快速安装(4步搞定)
    # 1. 在 MCP 客户端配置中添加(以 Claude Code 为例)
    claude mcp add chrome-devtools –scope user \
      npx chrome-devtools-mcp@latest

    # 2. 或者直接在 MCP 配置 JSON 中添加
    {
      “mcpServers”: {
        “chrome-devtools”: {
          “command”: “npx”,
          “args”: [“-y”, “chrome-devtools-mcp@latest”]
        }
      }

    # 3. 无头模式 + 精简模式(仅3个核心工具)
    args: [“-y”, “chrome-devtools-mcp@latest”, “–slim”, “–headless”]

    # 4. 验证安装
    在 AI 客户端中输入:
    “Check the performance of https://developers.chrome.com”

    ✨ 核心功能

    🔧 完整的浏览器自动化
    基于 Puppeteer 实现,支持点击、拖拽、表单填充、文件上传、弹窗处理等 10 类输入自动化操作,且自动等待操作结果,避免时序问题。

    📊 性能分析 & Lighthouse 审计
    录制 Chrome 性能追踪(trace),提取可落地的性能优化建议;集成 Lighthouse,一键完成 PWA、SEO、可访问性审计。

    🐛 深度调试能力
    查看网络请求详情、截取页面截图、获取控制台消息(支持源码映射栈追踪)、获取堆内存快照,调试能力媲美手动打开 DevTools。

    🔌 多客户端支持
    原生支持 Claude Code、VS Code Copilot、Cursor、Antigravity、Gemini CLI、Windsurf 等所有主流 AI 编程工具,配置即用。

    🛠️ 48+ 工具全覆盖
    提供输入自动化、导航、设备模拟、性能分析、网络调试、内存调试、Chrome 扩展操作等 6 大类 48 个工具,满足各类浏览器自动化需求。

    🚀 典型使用场景

    场景一:AI 辅助前端性能优化
    让 Claude Code 打开你的前端项目页面,自动录制性能追踪,分析长任务、布局抖动、网络瀑布流,并给出针对性的优化建议。整个过程无需手动操作 DevTools。

    场景二:E2E 自动化测试生成
    告诉 AI 助手”帮我测试登录流程”,它会自动操控浏览器完成用户名输入、密码填写、按钮点击,并验证跳转结果。比传统 E2E 测试框架更灵活,用例用自然语言描述即可。

    场景三:Web 截图 & 视觉回归
    需要批量截取页面截图?AI 助手可以自动控制浏览器遍历页面,截图并对比基线图片,快速发现视觉回归问题。配合 CI/CD 流水线,实现全自动视觉测试。

    💡 推荐理由

    chrome-devtools-mcp 最大的价值在于打通了 AI 与现实浏览器之间的最后一公里。以前 AI 编程助手只能改代码,改完还需要开发者手动打开浏览器验证;现在 AI 可以自己打开页面、重现 Bug、截取证据、甚至给出修复后的验证结果。

    作为 Google Chrome 团队官方出品的项目,它的可靠性和迭代速度都有保障。特别是 –slim 精简模式的设计非常贴心——如果你只需要基础的页面导航和截图,3 个工具就够用,不会让 AI 的上下文被大量工具描述占据。

    对于 daily 使用 AI 编程工具的开发者,这个项目几乎是一个”必装”的 MCP 服务器。它让 AI 从”代码生成器”进化成了”全栈开发助手”,值得每个前端/全栈工程师尝试。🌟

    📦 下载地址

    License: Apache-2.0 | 开发语言: TypeScript | 维护方: Google Chrome DevTools Team

  • 【开源推荐】CopilotKit:34.8K+ Stars!面向AI Agent与生成式UI的前端技术栈

    【开源推荐】CopilotKit:34.8K+ Stars!面向AI Agent与生成式UI的前端技术栈

    ⭐ GitHub 34.8K+ Stars · MIT 开源

    CopilotKit

    The Frontend Stack for Agents & Generative UI

    📌 项目简介

    CopilotKit 是专为 AI Agent生成式 UI 打造的前端技术栈,支持 React、Next.js、Angular、Vue、React Native 及 Slack 等多端场景。它不仅是 SDK,更是 AG-UI 协议 的发起方,已被 Google、LangChain、AWS、Microsoft 等主流厂商采用。

    🚀 核心功能

    ① 全场景聊天 UI

    完全可定制的聊天界面组件,支持消息流式传输、工具调用可视化、Agent 响应实时渲染,接入仅需几行代码。

    ② 生成式 UI(Generative UI)

    Agent 可在运行时根据用户意图动态生成、更新 UI 组件,支持三种模式:静态模式(AG-UI 协议)、声明式模式(A2UI)、开放式模式(MCP Apps)。

    ③ 共享状态层

    Agent 和 UI 组件可同时读写同一份状态,实现真正的双向交互——UI 可以驱动 Agent,Agent 也可以更新 UI。

    ④ 人在回路(Human-in-the-Loop)

    Agent 执行过程中可暂停,等待用户确认、修改输入后再继续,确保关键操作始终在人的掌控之下。

    ⑤ 自学习 Agent(Beta)

    基于人类反馈的持续学习(CLHF)能力,无需微调模型即可通过用户交互自动优化行为,支持按用户偏好个性化适配。

    ⚙️ 安装要求与步骤

    环境要求

    • Node.js 18+(React/Next.js 项目)
    • 一个 LLM API Key(OpenAI / Anthropic / Gemini 等)
    • 现有前端项目或新建 Next.js 项目

    ① 快速初始化项目(5分钟内启动)

    npx copilotkit@latest create

    按提示输入 LLM 密钥,自动完成项目脚手架搭建。

    ② 安装 Agent 技能包(支持 Claude Code / Cursor / Codex)

    npx copilotkit@latest skills install

    可重复运行,随时更新到最新版技能包。

    💡 典型使用场景

    🤖

    AI 聊天助手集成

    为现有 SaaS 产品嵌入智能聊天界面,支持流式输出和工具调用展示,用户体验媲美 ChatGPT。

    📊

    动态数据仪表盘

    Agent 根据用户问题动态生成图表和可视化组件,用户可与生成的内容实时交互。

    🔄

    跨平台 Agent 应用

    同一套 Agent 后端同时支持 Web、移动端和 Slack,无需重复开发,大幅降低维护成本。

    🌐 AG-UI 协议:Agent 与原生 UI 的桥梁

    CopilotKit 是 AG-UI 协议的发起方。该协议定义了 Agent 与工作流如何与用户端应用无缝连接,已被 Google、LangChain、AWS、Microsoft、Mastra、PydanticAI 等主流厂商采用。

    npx create-ag-ui-app my-agent-app

    ✨ 推荐理由

    如果你正在开发 AI Agent 产品,CopilotKit 几乎是前端层的最佳选择。它解决了 Agent 与 UI 之间的核心痛点——如何让 LLM 的推理过程优雅地呈现在用户界面上。

    最打动我的是它的 生成式 UI 能力:Agent 不再只能返回文字,而是可以动态生成真正可交互的 UI 组件。结合 AG-UI 协议,你的 Agent 可以无缝对接任意前端框架。

    另外,CopilotKit 对 人在回路 的支持也非常完善,这对于企业级应用场景至关重要——让 AI 处理繁琐操作,关键决策点由人确认,既提高效率又保障安全。

    适合人群:AI 产品前端开发者、SaaS 创业者、企业数字化转型团队。

  • 【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    crawl4ai - LLM友好网页爬虫工具

    crawl4ai – 专为LLM和AI Agent设计的网页爬虫工具 @reference_1@

    📌 项目简介

    crawl4ai 是一款专为LLM和AI Agent设计的开源网页爬虫工具,能将任意网页内容转换为干净的Markdown格式,可直接用于RAG、AI Agent、数据管道等场景,无需依赖任何付费API。

    68.3K+
    GitHub Stars

    Python
    开发语言

    v0.6+
    最新版本

    ⚙️
    安装要求和过程

    环境要求

    • Python ≥ 3.10
    • Playwright(用于异步浏览器控制)
    • 支持 Windows / macOS / Linux

    快速安装(4步搞定)

    # 第1步:安装 crawl4ai
    pip install -U crawl4ai
    # 第2步:配置浏览器依赖
    crawl4ai-setup
    # 第3步:验证安装
    crawl4ai-doctor
    # (可选)如 Playwright 报错,手动安装浏览器
    python -m playwright install chromium

    Docker 部署(生产推荐)

    # 拉取官方镜像
    docker pull unclecode/crawl4ai:latest
    # 启动容器
    docker run -d -p 11235:11235 –name crawl4ai –shm-size=1g unclecode/crawl4ai:latest
    # 访问监控面板
    http://localhost:11235/dashboard


    核心功能

    ① 智能 Markdown 生成

    生成结构清晰、格式准确的干净 Markdown,支持 Fit Markdown 启发式过滤,自动剔除无关噪音内容。支持 BM25 算法过滤,可提取核心信息,更适合 AI 处理。

    ② LLM 驱动的结构化数据提取

    支持所有 LLM(开源/闭源)驱动的结构化数据提取。内置多种分块策略,支持基于用户查询的语义内容匹配,可通过自定义 Schema 从重复页面模式中批量提取结构化 JSON。

    ③ 浏览器深度集成

    支持托管用户自有浏览器,通过 Chrome DevTools 协议实现远程浏览器控制。支持浏览器配置文件持久化(保存认证状态、Cookie),完美支持需要登录的网站爬取。

    ④ 动态页面与反爬对抗

    支持执行 JavaScript、等待异步动态内容加载、处理无限滚动页面。提供隐身模式模拟真实用户行为,支持自定义请求头、Cookie、User-Agent 和代理认证,有效绕过常见反爬限制。

    ⑤ Docker 一键部署 + API 服务

    提供优化后的 Docker 镜像,内置 FastAPI 服务,开箱即用。内置 JWT 令牌认证保障 API 安全,支持大规模生产环境部署,是构建数据采集基础设施的最佳选择。

    💡
    典型使用场景

    场景1:RAG 知识库数据准备

    将网页内容转换为干净 Markdown,作为 RAG 系统的知识库来源。crawl4ai 的 Fit Markdown 功能可自动过滤导航栏、广告、页脚等噪音,只保留核心正文,避免无关内容干扰大模型输出。配合深度爬取(BFS/DFS策略)可批量采集整个网站。

    场景2:AI Agent 实时信息获取工具

    将 crawl4ai 封装为 AI Agent 的工具函数,让 Agent 能够自主爬取所需网页内容。比如用户问”今天有哪些 AI 新闻?”,Agent 可自动爬取新闻网站并提取结构化信息,真正实现 AI 联网能力。

    场景3:大规模数据采集管道

    结合 Docker 部署、浏览器池、缓存机制,搭建大规模高并发网页数据采集系统。内置的浏览器配置文件持久化能力,可保存登录状态实现需要认证的网站批量采集,适合构建企业级数据采集基础设施。

    🚀 30秒快速开始

    Python 代码方式:
    import asyncio
    from crawl4ai import *

    async def main():
    async with AsyncWebCrawler() as crawler:
    result = await crawler.arun(url=”https://example.com”)
    print(result.markdown) # 获取干净 Markdown

    if __name__ == “__main__”:
    asyncio.run(main())

    CLI 命令行方式:
    crwl https://example.com -o markdown
    # 深度爬取,最多10个页面
    crwl https://docs.crawl4ai.com –deep-crawl bfs –max-pages 10

    💝
    推荐理由

    如果你正在构建 RAG 系统或 AI Agent,crawl4ai 是目前开源界最值得关注的网页数据采集工具。它解决了传统爬虫的两个核心痛点:

    第一,真正为 LLM 优化。 传统爬虫输出的是原始 HTML 或杂乱文本,需要大量后处理才能喂给大模型。crawl4ai 直接输出干净、结构化的 Markdown,内置的 Fit Markdown 功能可以智能过滤导航、广告等噪音,让 RAG 召回质量大幅提升。

    第二,对动态页面和反爬场景的支持非常完善。 基于 Playwright 的浏览器控制,可以处理 React/Vue 等前端框架渲染的页面,支持等待异步内容加载、处理无限滚动。隐身模式和浏览器指纹自定义功能,让我在采集一些有反爬机制的网站时也能稳定获取数据。

    最让我惊喜的是它的 Docker 部署方案。 几分钟就能搭建一个带 API 服务的爬取引擎,内置 JWT 认证,可以直接集成到现有数据管道中。对于需要大规模采集的场景,这比手写 Scrapy 爬虫效率高太多了。

    ⭐ 总之,如果你需要为 AI 应用添加网页数据获取能力,crawl4ai 是目前最成熟的开源选择,没有之一。

    📥 下载地址

    License: Apache 2.0 | 作者: UncleCode | 最近更新: 2026年6月

    💡 关注【开源推荐】系列,每周带你发现最值得关注的 AI 开源项目
    ⭐ 如果这篇文章对你有帮助,欢迎在 WordPress 点赞留言!

  • 【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    🔥 GitHub 热门 AI 开源项目

    autoresearch

    AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

    🤖 AI Agent
    🧠 深度学习
    ⚡ 单GPU
    🔬 自动研究

    📌项目简介

    autoresearch 是 AI 大神 Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员)开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验,自动修改代码、训练模型、评估结果,通宵跑完 100+ 实验,早上起来收报告。这不是科幻,是现在就能用的真实工具。

    ⚙️安装要求和过程

    1

    环境要求

    单张 NVIDIA GPU(测试过 H100)、Python 3.10+、uv 包管理器

    2

    快速安装(4步搞定)

    # 1. 安装 uv(如果还没有)
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
    # 2. 安装依赖
    uv sync
    
    # 3. 下载训练数据 + 训练 BPE 分词器(一次性,约2分钟)
    uv run prepare.py
    
    # 4. 手动跑一次训练实验(约5分钟)
    uv run train.py

    3

    启动 AI Agent 自主研究

    在仓库目录下启动 Claude Code / Codex 等 AI Agent(关闭所有权限确认),然后发送提示:

    Hi have a look at program.md and let's kick off a new experiment!
    let's do the setup first.

    4

    低配设备适配

    没有 H100?社区已有 macOSMLXWindows RTX 等 Fork,MacBook 也能跑!

    核心功能

    🤖

    AI Agent 自主研究

    Agent 自动修改 train.py,训练5分钟,检查 val_bpb 是否下降,保留或丢弃改动,不断迭代。你只需要睡前启动,早上收实验日志。

    ⏱️

    固定时间预算(公平对比)

    每次实验固定5分钟(wall clock),不管 Agent 怎么改模型架构、batch size,所有实验都可直接对比。约12次实验/小时,通宵可跑100+次。

    📁

    极简设计(只改一个文件)

    整个仓库只有3个核心文件:prepare.py(固定)、train.py(Agent 修改)、program.md(人类修改)。diff 清晰可审查,不会失控。

    🔌

    支持任意 AI Agent

    Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

    🌍

    活跃社区 Fork(多平台支持)

    macOS(M系列芯片)、Windows(RTX显卡)、MLX框架均有社区 Fork,低配设备也能体验 AI 自主研究。

    🚀典型使用场景

    🌙 场景一:夜间自动实验

    下班前启动 Agent,让它通宵自主实验。第二天早上,你会收到一份完整的实验日志,记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

    🔬 场景二:快速模型架构探索

    想尝试不同的注意力机制、优化器组合或模型深度?让 Agent 在固定时间预算内自动探索各种组合,快速找到最优配置,省去大量手工调参时间。

    📚 场景三:学习深度学习最佳实践

    即使是深度学习初学者,也可以阅读 Agent 的修改记录和实验日志,从中学习哪些改动有效、哪些无效,快速积累建模经验。

    💡推荐理由

    Karpathy 出品,必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简,整个训练代码只有一个 train.py,清晰到可以作为学习材料。

    固定5分钟时间预算的设计非常巧妙:不管怎么改模型,每次实验成本相同,结果可直接对比。这让 Agent 的”研究”变得可解释、可复现,而不是黑盒魔法。

    ⚠️ 注意:目前官方版本需要 NVIDIA GPU,低配设备建议使用社区 Fork。但无论如何,这个项目代表的”AI 自主研究”方向,值得每个 AI 从业者关注和思考。

    📦下载地址

    🔔 关注我们,每周分享最新 AI 开源项目!

    GitHub 热门 AI 项目持续更新中…

  • 【开源推荐】Skyvern:21.8K+ Stars!AI视觉浏览器自动化,让网页操作像对话一样自然

    【开源推荐】Skyvern:21.8K+ Stars!AI视觉浏览器自动化,让网页操作像对话一样自然

    Skyvern:21.8K+ Stars!AI 视觉浏览器自动化,让网页操作像对话一样自然

    基于 LLM + 计算机视觉 · 告别脆弱的 XPath 选择器 · 自适应任意网站布局

    📌 项目简介

    Skyvern 是一款基于大语言模型(LLM)和计算机视觉的开源浏览器自动化工具。与传统依赖 XPath/选择器的脆弱自动化脚本不同,Skyvern 通过 AI 视觉理解网页结构,自动适配任意网站布局变化,真正实现了”一次编写,随处运行”的浏览器自动化体验。项目在 GitHub 已获得 21,880+ Stars,是 AI RPA 领域的热门开源项目。

    21.8K+
    GitHub Stars

    64.4%
    WebBench 准确率 SOTA

    AGPL-3.0
    开源协议

    Playwright
    兼容增强 SDK

    ⚙️ 安装要求和过程

    方式一:pip 安装(推荐)

    环境要求:Python 3.11 / 3.12 / 3.13;Windows 用户需安装 Rust 运行时和 VS C++ 开发工具

    # 安装 Skyvern
    pip install "skyvern[all]"
    
    # 快速启动(默认 SQLite)
    skyvern quickstart
    
    # 如需 PostgreSQL
    skyvern quickstart --postgres

    方式二:Docker Compose(完全容器化)

    git clone https://github.com/Skyvern-AI/skyvern.git
    cd skyvern
    cp .env.example .env   # 编辑 .env 填入 LLM API Key
    docker compose up -d
    # 访问 http://localhost:8080

    方式三:Skyvern Cloud(免维护)

    直接访问 app.skyvern.com 注册使用,自带反机器人检测、代理网络、验证码破解等高级功能。

    ⭐ 核心功能

    ① AI 增强的浏览器操作
    通过 4 个核心 AI 指令(act / extract / validate / prompt)用自然语言驱动浏览器,无需手写选择器。同时兼容所有 Playwright 原生操作,支持”传统选择器 + AI 定位”混合模式。

    ② 可视化工作流编排
    提供无代码工作流构建器,支持浏览器任务、数据提取、循环、条件判断、HTTP 请求、自定义代码块等能力,非技术用户也能搭建复杂自动化流程。

    ③ 强大的认证与 2FA 支持
    内置密码管理器集成(Bitwarden / 1Password / LastPass),支持 TOTP 双因素认证(Google Authenticator / Authy)、邮件 2FA、短信 2FA,可自动化登录各类需认证的网站。

    ④ 多 LLM 兼容 + MCP 协议支持
    支持 OpenAI、Anthropic Claude、Azure OpenAI、AWS Bedrock、Gemini、Ollama、OpenRouter 及任何 OpenAI 兼容端点;同时支持 MCP 协议,可对接 Zapier、Make.com、N8N 等平台。

    ⑤ 实时浏览器直播与本地 Chrome 控制
    可实时直播浏览器视口画面便于调试;支持接入本地已安装的 Chrome(通过 CDP 调试协议),复用已有 Cookie、登录态和浏览器扩展,真正实现”人机协同”自动化。

    🚀 典型使用场景

    场景一:跨网站发票自动下载
    企业需要定期从多个供应商网站下载发票,传统 RPA 脚本逢网站改版即失效。使用 Skyvern,只需描述”登录各供应商网站,下载上月发票并保存到指定目录”,AI 即可自动适配不同网站布局完成任务,网站改版也无需维护脚本。

    场景二:批量联系表单提交
    市场团队需要在上百个网站的”联系我们”表单提交产品咨询。Skyvern 通过 AI 视觉理解每个表单的字段含义,自动填写并提交,无需为每个网站单独编写填表规则,效率提升 10 倍以上。

    场景三:求职申请自动填写
    在多个招聘平台投递简历时,Skyvern 可自动识别各平台的简历上传入口和表单字段,自动填写个人信息并提交申请,大幅减少重复性操作,让求职者专注于准备面试。

    💡 推荐理由

    作为一名经常需要与多个网站打交道的开发者,我深刻体会过传统浏览器自动化的痛点——XPath 一改,脚本全挂。Skyvern 最打动我的是它”用 AI 视觉理解网页”的思路:不再依赖固定的 DOM 选择器,而是由 LLM 实时分析页面视觉结构,真正做到了”布局无关”。

    另一个亮点是它与 Playwright 的深度兼容——你可以在同一个脚本里混合使用传统选择器(高性能)和 AI 操作(高适配),这种渐进式采用策略对已有自动化代码库的团队非常友好。加上对工作流编排、多 LLM 支持和企业级认证能力的覆盖,Skyvern 正在重新定义”AI + RPA”的边界。

    ⚠️ 注意:核心代码以 AGPL-3.0 开源,但反机器人检测等高级功能仅在托管云服务中提供。如果只是内部使用,完全够用;如果用于商业产品,建议评估云服务的许可方案。

    📌 更多 GitHub 热门 AI 开源项目介绍,请持续关注本站「开源项目」栏目
  • 【开源推荐】markitdown:150K+ Stars!微软开源文档转Markdown神器,LLM管道必备

    【开源推荐】markitdown:150K+ Stars!微软开源文档转Markdown神器,LLM管道必备

    MICROSOFT 开源

    markitdown

    150K+ Stars · 将任意文档一键转换为 Markdown

    Python 3.10+
    MIT 开源
    LLM 友好
    📌 项目简介

    markitdown 是微软出品的一款轻量级 Python 工具,支持将 PDF、PowerPoint、Word、Excel、HTML、CSV、JSON、音频、视频等 数十种文件格式 统一转换为 Markdown 格式,是大模型文档处理管道中的核心基础设施。

    安装要求与过程

    环境要求
    • Python 3.10 及以上版本
    • 推荐使用虚拟环境(venv / uv / conda)
    • pip 21.0+(用于安装可选依赖组)
    快速安装(全格式支持)
    # 全量安装(推荐)
    pip install 'markitdown[all]'
    
    # 命令行直接使用
    markitdown document.pdf > output.md
    
    # Python API 使用
    from markitdown import MarkItDown
    md = MarkItDown()
    result = md.convert("document.pdf")
    print(result.text_content)

    按需安装(减少依赖体积)
    pip install 'markitdown[pdf, docx, pptx]'   # 仅 PDF/Word/PPT
    pip install 'markitdown[youtube-transcription]'  # 仅 YouTube 字幕

    核心功能

    📄 多格式支持
    PDF、Word、PPT、Excel、HTML、CSV、JSON、XML、EPUB、ZIP,覆盖办公全场景

    🖼️ 图片 & 音频
    图片 EXIF 元数据提取 + OCR,音频语音转写,视频字幕自动获取

    🤖 LLM 集成
    可调用 GPT-4V 等大模型为图片/幻灯片生成描述,增强多模态理解

    🔌 插件扩展
    支持第三方插件(如 markitdown-ocr),社区插件标签 #markitdown-plugin

    ☁️ Azure 集成
    支持 Azure Document Intelligence 和 Azure Content Understanding,企业级文档解析能力

    典型使用场景

    场景一:RAG 知识库文档预处理

    在构建 RAG(检索增强生成)应用时,需要将企业内部的 PDF 手册、Word 文档、PowerPoint 课件统一转换为 Markdown,再切片嵌入向量数据库。markitdown 一条命令批量处理,保留标题层级和表格结构,大幅提升检索精度。

    for f in docs/*.pdf; do
      markitdown "$f" -o "md/${f%.pdf}.md"
    done

    场景二:LLM 文档理解管道

    将用户上传的任意格式文档(简历、合同、报告)转换为 Markdown 后传给 LLM 进行分析、摘要或信息提取。markitdown 的 Markdown 输出对 Token 消耗远低于原始二进制格式,降低成本。

    from markitdown import MarkItDown
    md = MarkItDown()
    result = md.convert("contract.docx")
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role":"user","content":f"摘要:{result.text_content}"}]
    )

    💡 推荐理由

    作为一名经常和 LLM 打交道的开发者,markitdown 已经成为我工具箱里的常驻成员。它的价值在于把”任意文档”变成”LLM 能理解的文本”,这在大模型应用开发中是一个高频且痛点的需求。

    最让我惊喜的是它的格式保留能力——转换后的 Markdown 仍然保留表格结构、标题层级和链接,这直接决定了 RAG 检索的质量。相比之下,很多同类工具转换后就只剩纯文本了。

    来自微软 AutoGen 团队的维护保证,加上 150K+ Stars 的社区验证,这款工具的可靠性和迭代速度都非常值得信赖。如果你正在做任何涉及文档处理的大模型应用,markitdown 绝对是不二之选。

    由 AI 自动整理,更多开源项目介绍持续更新中 🚀

  • 【开源推荐】awesome-mcp-servers:82.7K+ Stars!MCP生态最全服务器资源集合

    【开源推荐】awesome-mcp-servers:82.7K+ Stars!MCP生态最全服务器资源集合

    【开源推荐】awesome-mcp-servers:82.7K+ Stars!MCP生态最全服务器资源集合

    ⭐ GitHub 82.7K+ Stars
    🔌 MCP生态必备

    📌 项目简介

    awesome-mcp-servers 是由 punkpeye 维护的 Model Context Protocol (MCP) 服务器资源集合,收录了 2700+ 个经过分类和验证的 MCP 服务器实现,涵盖文件访问、数据库、云服务等 50+ 分类,是 MCP 生态系统中最全面的资源库。

    🎯 核心亮点

    📦

    2700+ 服务器收录

    涵盖文件、数据库、云服务、开发工具等 50+ 分类,每个服务器都经过验证,质量有保障。

    🔌

    MCP 官方推荐

    作为 MCP 生态的权威资源集合,被 Anthropic 官方文档引用,是开发者接入 MCP 的首选参考。

    🏗️

    分类清晰易检索

    按功能、编程语言、部署方式多维度分类,支持中文文档(README-zh.md),中文开发者友好。

    🚀

    持续更新活跃

    社区驱动,每日更新新服务器。截至 2026 年 6 月已收录 2700+ 服务器,仍在快速增长中。

    📚 热门 MCP 服务器分类

    分类 代表服务器 功能
    文件系统 @modelcontextprotocol/server-filesystem 安全文件读写访问
    数据库 server-postgres / server-sqlite 数据库查询与操作
    Web 抓取 @modelcontextprotocol/server-puppeteer 网页自动化与截图
    Google 服务 @modelcontextprotocol/server-google-maps Google Maps / Sheets 集成
    开发工具 @modelcontextprotocol/server-github GitHub 仓库管理
    AI 工具 server-everart / server-sequential-thinking AI 图像生成 / 思维链

    ⚙️ 快速开始:使用 MCP 服务器

    # 安装 MCP 官方 SDK
    npm install -g @modelcontextprotocol/sdk
    
    # 使用 Awesome MCP Servers 推荐的服务器
    # 1. 文件系统服务器
    npx -y @modelcontextprotocol/server-filesystem /path/to/allowed/dir
    
    # 2. Google Sheets 服务器
    npx -y @modelcontextprotocol/server-google-sheets
    
    # 3. 在 Claude Desktop 中配置
    # 编辑 ~/Library/Application Support/Claude/claude_desktop_config.json
    {
      "mcpServers": {
        "filesystem": {
          "command": "npx",
          "args": ["-y", "@modelcontextprotocol/server-filesystem", "/允许访问的目录"]
        },
        "github": {
          "command": "npx", 
          "args": ["-y", "@modelcontextprotocol/server-github"]
        }
      }
    }
    
    # 4. 重启 Claude Desktop,即可使用 MCP 工具
    

    💡 典型使用场景

    场景1:AI 助手访问本地文件

    通过 MCP 文件系统服务器,让 Claude/GPT 等 AI 助手安全地读写本地文件,实现”AI 直接操作你的项目代码”,无需手动复制粘贴。

    场景2:AI 自动操作 GitHub

    配置 GitHub MCP 服务器后,AI 助手可以直接创建 Issue、提交 PR、审查代码。让 AI 真正成为你的 编程搭档

    场景3:数据库连接与查询

    通过 Postgres/MySQL MCP 服务器,让 AI 直接查询数据库、生成报表。自然语言转 SQL 不再需要中间层,AI 直接操作数据库。

    💬 推荐理由

    如果你正在关注 MCP(Model Context Protocol),这个项目是你必收藏的资源指南。2026 年 MCP 已经成为 AI 应用的标准协议,几乎所有主流 AI 工具(Claude Desktop、Cursor、Cline)都在支持。

    这个集合的价值在于:你不需要到处找”有没有 XXX 功能的 MCP 服务器”,来这里搜索就好了。2700+ 服务器 覆盖了几乎所有你能想到的场景。

    特别推荐它的 中文文档(README-zh.md),对国内开发者非常友好。如果你正在构建 AI 应用并需要接入外部工具,先从这里找现成的 MCP 服务器,能省大量开发时间。

    📌 本文由自动化任务采集整理,数据截至 2026 年 6 月

    🏷️ 标签:MCP · AI Agent · 资源集合 · 开发工具

  • 【开源推荐】Goose:48.7K+ Stars!Linux Foundation 开源AI智能体,会动手的编程助手

    【开源推荐】Goose:48.7K+ Stars!Linux Foundation 开源AI智能体,会动手的编程助手

    Goose Logo

    Goose – 开源AI智能体 · Linux Foundation AAIF

    📦 项目简介

    Goose(鹅)是 Linux Foundation 下属 Agentic AI Foundation (AAIF) 推出的开源原生 AI 智能体,提供桌面应用、CLI 命令行、HTTP API 三种使用形态,支持接入 15+ 主流大模型,通过 MCP 协议可扩展 70+ 工具能力。核心引擎使用 Rust 构建,兼具高性能与内存安全。

    48.7K+
    GitHub Stars

    5.1K+
    Forks

    3
    使用形态

    70+
    MCP 扩展工具

    ⚙️ 安装要求和过程

    环境要求

    • 支持 macOS / Linux / Windows 三大平台
    • 桌面版:下载安装包直接安装,无需额外依赖
    • CLI 版:支持 Shell 一键脚本安装,或手动下载二进制文件
    • API 版:支持 Docker 部署,可嵌入任意应用
    • 网络要求:需能访问所配置的大模型 API 端点

    快速安装 · CLI 版(推荐开发者)

    # macOS / Linux 一键安装
    curl -fsSL https://github.com/aaif-goose/goose/releases/download/stable/download_cli.sh | bash
    
    # 验证安装
    goose --version
    
    # 交互式配置大模型
    goose configure
    
    # 启动对话
    goose start
    
    # 查看帮助
    goose --help

    桌面版安装

    # 1. 访问官网下载页面
    https://goose-docs.ai/docs/getting-started/installation
    
    # 2. 选择对应平台(macOS / Windows / Linux)
    # 3. 下载安装包,按引导完成安装
    # 4. 首次启动会引导配置大模型服务商和 MCP 扩展

    🚀 核心功能

    🖥️ 三合一使用形态

    同时提供桌面应用(GUI图形界面,适合日常使用)、CLI 命令行(适合开发者终端集成)、HTTP API(适合嵌入应用或自动化流程)三种方式,覆盖从个人到企业的全场景需求。

    🤖 15+ 大模型服务商支持

    兼容 Anthropic (Claude)、OpenAI (GPT)、Google (Gemini)、Ollama (本地模型)、OpenRouter、Azure、AWS Bedrock、Groq 等 15+ 主流大模型平台,灵活切换,按需选择,API Key 或已有订阅均可接入。

    🔌 MCP 协议扩展(70+ 工具)

    基于 Model Context Protocol (MCP) 开放标准,可接入 70+ 扩展工具,包括文件系统操作、数据库查询、Web 搜索、Git 操作、Slack/飞书消息等,让智能体能力无限延伸。

    🏗️ Rust 高性能核心

    核心引擎使用 Rust 编写(代码占比 64.3%),内存安全、运行高效,支持长时间稳定运行。前端界面使用 TypeScript(29.2%),兼顾性能与开发效率。Apache 2.0 开源协议。

    📦 自定义分发

    支持基于 Goose 构建自定义分发版本,可预配置大模型服务商、MCP 扩展、品牌信息,适合企业内部分发或构建专属 AI 助手产品。

    💡 典型使用场景

    场景一:AI 辅助全栈开发

    在 CLI 模式下,Goose 可以直接参与代码编写、调试、测试、依赖管理全流程。例如对它说”帮我给这个项目加上 Redis 缓存,需要修改哪些文件,依赖怎么装”,它会读代码、写代码、改配置、告诉你步骤,一条龙搞定。相比 GitHub Copilot 只做代码补全,Goose 可以自主执行命令、创建文件、运行测试,是一个真正能”动手”的编程助手。

    场景二:研究 & 自动化工作流

    配置好 Web 搜索和文档读取的 MCP 工具后,Goose 可以自动完成资料检索、信息汇总、方案对比等研究任务。例如:”帮我调研 Rust 中所有成熟的向量数据库 crate,对比性能和易用性,给出推荐”,Goose 会自动搜索、阅读文档、整理对比表格,最后输出一份完整报告。

    场景三:企业知识库问答助手

    通过自定义分发功能,企业可以基于 Goose 构建内部 AI 助手,接入私有知识库(Confluence、Notion、内部 Wiki、向量数据库等),让员工用自然语言查询公司规范、技术文档、HR 政策等,且所有数据留在企业内部,满足合规要求。

    ✨ 推荐理由

    Goose 最打动我的一点是它的「真正可执行」能力——不是只给你建议,而是真的能动手帮你做。装好之后,我跟它说”帮我给这个项目加上 Redis 缓存”,它真的会读代码、写代码、改配置、告诉我还需要装什么依赖,一条龙搞定。

    另一个亮点是不绑定任何一家大模型厂商。你可以今天用 Claude,明天换 Gemini,后天试 Ollama 本地模型,配置随时切换,数据都在自己手里。加上 MCP 协议的支持,扩展能力几乎是无限的。

    作为 Linux Foundation 旗下的开源项目,Goose 的代码完全透明,社区活跃,迭代迅速。如果你在找一个能真正帮你干活的 AI 助手,而不是只会聊天的玩具,Goose 绝对值得一试。

    技术栈:Rust (64.3%) · TypeScript (29.2%) · JavaScript (1.6%) |
    协议:Apache 2.0 |
    组织:Linux Foundation AAIF |
    今日 Trending:GitHub 日榜