分类：开源项目

专注盘点全网热门人工智能开源项目，涵盖大模型、智能应用、视觉算法、工具插件等领域，搭建教程与优化思路，助力开发者低成本学习实践。

【开源推荐】crawl4ai：68.3K+ Stars！专为LLM设计的网页爬虫，让AI直接读懂网页内容
crawl4ai – 专为LLM和AI Agent设计的网页爬虫工具 @reference_1@

📌 项目简介

crawl4ai 是一款专为LLM和AI Agent设计的开源网页爬虫工具，能将任意网页内容转换为干净的Markdown格式，可直接用于RAG、AI Agent、数据管道等场景，无需依赖任何付费API。

68.3K+

GitHub Stars

Python

开发语言

v0.6+

最新版本
⚙️
安装要求和过程

环境要求

Python ≥ 3.10

Playwright（用于异步浏览器控制）

支持 Windows / macOS / Linux

快速安装（4步搞定）

# 第1步：安装 crawl4ai

pip install -U crawl4ai

# 第2步：配置浏览器依赖

crawl4ai-setup

# 第3步：验证安装

crawl4ai-doctor

# （可选）如 Playwright 报错，手动安装浏览器

python -m playwright install chromium

Docker 部署（生产推荐）

# 拉取官方镜像

docker pull unclecode/crawl4ai:latest

# 启动容器

docker run -d -p 11235:11235 –name crawl4ai –shm-size=1g unclecode/crawl4ai:latest

# 访问监控面板

http://localhost:11235/dashboard
⚡
核心功能

① 智能 Markdown 生成

生成结构清晰、格式准确的干净 Markdown，支持 Fit Markdown 启发式过滤，自动剔除无关噪音内容。支持 BM25 算法过滤，可提取核心信息，更适合 AI 处理。

② LLM 驱动的结构化数据提取

支持所有 LLM（开源/闭源）驱动的结构化数据提取。内置多种分块策略，支持基于用户查询的语义内容匹配，可通过自定义 Schema 从重复页面模式中批量提取结构化 JSON。

③ 浏览器深度集成

支持托管用户自有浏览器，通过 Chrome DevTools 协议实现远程浏览器控制。支持浏览器配置文件持久化（保存认证状态、Cookie），完美支持需要登录的网站爬取。

④ 动态页面与反爬对抗

支持执行 JavaScript、等待异步动态内容加载、处理无限滚动页面。提供隐身模式模拟真实用户行为，支持自定义请求头、Cookie、User-Agent 和代理认证，有效绕过常见反爬限制。

⑤ Docker 一键部署 + API 服务

提供优化后的 Docker 镜像，内置 FastAPI 服务，开箱即用。内置 JWT 令牌认证保障 API 安全，支持大规模生产环境部署，是构建数据采集基础设施的最佳选择。

💡
典型使用场景

场景1：RAG 知识库数据准备

将网页内容转换为干净 Markdown，作为 RAG 系统的知识库来源。crawl4ai 的 Fit Markdown 功能可自动过滤导航栏、广告、页脚等噪音，只保留核心正文，避免无关内容干扰大模型输出。配合深度爬取（BFS/DFS策略）可批量采集整个网站。

场景2：AI Agent 实时信息获取工具

将 crawl4ai 封装为 AI Agent 的工具函数，让 Agent 能够自主爬取所需网页内容。比如用户问”今天有哪些 AI 新闻？”，Agent 可自动爬取新闻网站并提取结构化信息，真正实现 AI 联网能力。

场景3：大规模数据采集管道

结合 Docker 部署、浏览器池、缓存机制，搭建大规模高并发网页数据采集系统。内置的浏览器配置文件持久化能力，可保存登录状态实现需要认证的网站批量采集，适合构建企业级数据采集基础设施。

🚀 30秒快速开始

Python 代码方式：

import asyncio

from crawl4ai import *

async def main():

async with AsyncWebCrawler() as crawler:

result = await crawler.arun(url=”https://example.com”)

print(result.markdown) # 获取干净 Markdown

if __name__ == “__main__”:

asyncio.run(main())

CLI 命令行方式：

crwl https://example.com -o markdown

# 深度爬取，最多10个页面

crwl https://docs.crawl4ai.com –deep-crawl bfs –max-pages 10

💝
推荐理由

如果你正在构建 RAG 系统或 AI Agent，crawl4ai 是目前开源界最值得关注的网页数据采集工具。它解决了传统爬虫的两个核心痛点：

第一，真正为 LLM 优化。 传统爬虫输出的是原始 HTML 或杂乱文本，需要大量后处理才能喂给大模型。crawl4ai 直接输出干净、结构化的 Markdown，内置的 Fit Markdown 功能可以智能过滤导航、广告等噪音，让 RAG 召回质量大幅提升。

第二，对动态页面和反爬场景的支持非常完善。 基于 Playwright 的浏览器控制，可以处理 React/Vue 等前端框架渲染的页面，支持等待异步内容加载、处理无限滚动。隐身模式和浏览器指纹自定义功能，让我在采集一些有反爬机制的网站时也能稳定获取数据。

最让我惊喜的是它的 Docker 部署方案。 几分钟就能搭建一个带 API 服务的爬取引擎，内置 JWT 认证，可以直接集成到现有数据管道中。对于需要大规模采集的场景，这比手写 Scrapy 爬虫效率高太多了。

⭐ 总之，如果你需要为 AI 应用添加网页数据获取能力，crawl4ai 是目前最成熟的开源选择，没有之一。

📥 下载地址

🐙 GitHub 仓库
 📖 官方文档
 📦 PyPI 页面

License: Apache 2.0 | 作者: UncleCode | 最近更新: 2026年6月

💡 关注【开源推荐】系列，每周带你发现最值得关注的 AI 开源项目
⭐ 如果这篇文章对你有帮助，欢迎在 WordPress 点赞留言！
2026年6月12日
【开源推荐】autoresearch：86K+ Stars！Karpathy开源AI自主研究工具，让Agent通宵帮你优化LLM训练
🔥 GitHub 热门 AI 开源项目

autoresearch

AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

🤖 AI Agent
🧠 深度学习
⚡ 单GPU
🔬 自动研究

📌项目简介

autoresearch 是 AI 大神 Andrej Karpathy（前 Tesla AI 总监、OpenAI 创始成员）开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验，自动修改代码、训练模型、评估结果，通宵跑完 100+ 实验，早上起来收报告。这不是科幻，是现在就能用的真实工具。

⚙️安装要求和过程

1

环境要求

单张 NVIDIA GPU（测试过 H100）、Python 3.10+、uv 包管理器
2

快速安装（4步搞定）

# 1. 安装 uv（如果还没有） curl -LsSf https://astral.sh/uv/install.sh | sh # 2. 安装依赖 uv sync # 3. 下载训练数据 + 训练 BPE 分词器（一次性，约2分钟） uv run prepare.py # 4. 手动跑一次训练实验（约5分钟） uv run train.py
3

启动 AI Agent 自主研究

在仓库目录下启动 Claude Code / Codex 等 AI Agent（关闭所有权限确认），然后发送提示：

Hi have a look at program.md and let's kick off a new experiment! let's do the setup first.
4

低配设备适配

没有 H100？社区已有 macOS、MLX、Windows RTX 等 Fork，MacBook 也能跑！

⭐核心功能

🤖

AI Agent 自主研究

Agent 自动修改 train.py，训练5分钟，检查 val_bpb 是否下降，保留或丢弃改动，不断迭代。你只需要睡前启动，早上收实验日志。

⏱️

固定时间预算（公平对比）

每次实验固定5分钟（wall clock），不管 Agent 怎么改模型架构、batch size，所有实验都可直接对比。约12次实验/小时，通宵可跑100+次。

📁

极简设计（只改一个文件）

整个仓库只有3个核心文件：prepare.py（固定）、train.py（Agent 修改）、program.md（人类修改）。diff 清晰可审查，不会失控。

🔌

支持任意 AI Agent

Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

🌍

活跃社区 Fork（多平台支持）

macOS（M系列芯片）、Windows（RTX显卡）、MLX框架均有社区 Fork，低配设备也能体验 AI 自主研究。

🚀典型使用场景

🌙 场景一：夜间自动实验

下班前启动 Agent，让它通宵自主实验。第二天早上，你会收到一份完整的实验日志，记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

🔬 场景二：快速模型架构探索

想尝试不同的注意力机制、优化器组合或模型深度？让 Agent 在固定时间预算内自动探索各种组合，快速找到最优配置，省去大量手工调参时间。

📚 场景三：学习深度学习最佳实践

即使是深度学习初学者，也可以阅读 Agent 的修改记录和实验日志，从中学习哪些改动有效、哪些无效，快速积累建模经验。

💡推荐理由

Karpathy 出品，必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简，整个训练代码只有一个 train.py，清晰到可以作为学习材料。

固定5分钟时间预算的设计非常巧妙：不管怎么改模型，每次实验成本相同，结果可直接对比。这让 Agent 的”研究”变得可解释、可复现，而不是黑盒魔法。

⚠️ 注意：目前官方版本需要 NVIDIA GPU，低配设备建议使用社区 Fork。但无论如何，这个项目代表的”AI 自主研究”方向，值得每个 AI 从业者关注和思考。

📦下载地址

GitHub 仓库：https://github.com/karpathy/autoresearch

社区 Fork（macOS）：https://github.com/miolini/autoresearch-macos

社区 Fork（Windows RTX）：https://github.com/jsegov/autoresearch-win-rtx

Karpathy 推文介绍：https://x.com/karpathy/status/2029701092347630069

🔔 关注我们，每周分享最新 AI 开源项目！

GitHub 热门 AI 项目持续更新中…
2026年6月12日
【开源推荐】Skyvern：21.8K+ Stars！AI视觉浏览器自动化，让网页操作像对话一样自然
Skyvern：21.8K+ Stars！AI 视觉浏览器自动化，让网页操作像对话一样自然

基于 LLM + 计算机视觉 · 告别脆弱的 XPath 选择器 · 自适应任意网站布局

📌 项目简介

Skyvern 是一款基于大语言模型（LLM）和计算机视觉的开源浏览器自动化工具。与传统依赖 XPath/选择器的脆弱自动化脚本不同，Skyvern 通过 AI 视觉理解网页结构，自动适配任意网站布局变化，真正实现了”一次编写，随处运行”的浏览器自动化体验。项目在 GitHub 已获得 21,880+ Stars，是 AI RPA 领域的热门开源项目。

21.8K+

GitHub Stars

64.4%

WebBench 准确率 SOTA

AGPL-3.0

开源协议

Playwright

兼容增强 SDK
⚙️ 安装要求和过程

方式一：pip 安装（推荐）

环境要求：Python 3.11 / 3.12 / 3.13；Windows 用户需安装 Rust 运行时和 VS C++ 开发工具

# 安装 Skyvern pip install "skyvern[all]" # 快速启动（默认 SQLite） skyvern quickstart # 如需 PostgreSQL skyvern quickstart --postgres

方式二：Docker Compose（完全容器化）

git clone https://github.com/Skyvern-AI/skyvern.git cd skyvern cp .env.example .env # 编辑 .env 填入 LLM API Key docker compose up -d # 访问 http://localhost:8080

方式三：Skyvern Cloud（免维护）

直接访问 app.skyvern.com 注册使用，自带反机器人检测、代理网络、验证码破解等高级功能。
⭐ 核心功能

① AI 增强的浏览器操作

通过 4 个核心 AI 指令（act / extract / validate / prompt）用自然语言驱动浏览器，无需手写选择器。同时兼容所有 Playwright 原生操作，支持”传统选择器 + AI 定位”混合模式。

② 可视化工作流编排

提供无代码工作流构建器，支持浏览器任务、数据提取、循环、条件判断、HTTP 请求、自定义代码块等能力，非技术用户也能搭建复杂自动化流程。

③ 强大的认证与 2FA 支持

内置密码管理器集成（Bitwarden / 1Password / LastPass），支持 TOTP 双因素认证（Google Authenticator / Authy）、邮件 2FA、短信 2FA，可自动化登录各类需认证的网站。

④ 多 LLM 兼容 + MCP 协议支持

支持 OpenAI、Anthropic Claude、Azure OpenAI、AWS Bedrock、Gemini、Ollama、OpenRouter 及任何 OpenAI 兼容端点；同时支持 MCP 协议，可对接 Zapier、Make.com、N8N 等平台。

⑤ 实时浏览器直播与本地 Chrome 控制

可实时直播浏览器视口画面便于调试；支持接入本地已安装的 Chrome（通过 CDP 调试协议），复用已有 Cookie、登录态和浏览器扩展，真正实现”人机协同”自动化。

🚀 典型使用场景

场景一：跨网站发票自动下载

企业需要定期从多个供应商网站下载发票，传统 RPA 脚本逢网站改版即失效。使用 Skyvern，只需描述”登录各供应商网站，下载上月发票并保存到指定目录”，AI 即可自动适配不同网站布局完成任务，网站改版也无需维护脚本。

场景二：批量联系表单提交

市场团队需要在上百个网站的”联系我们”表单提交产品咨询。Skyvern 通过 AI 视觉理解每个表单的字段含义，自动填写并提交，无需为每个网站单独编写填表规则，效率提升 10 倍以上。

场景三：求职申请自动填写

在多个招聘平台投递简历时，Skyvern 可自动识别各平台的简历上传入口和表单字段，自动填写个人信息并提交申请，大幅减少重复性操作，让求职者专注于准备面试。

💡 推荐理由

作为一名经常需要与多个网站打交道的开发者，我深刻体会过传统浏览器自动化的痛点——XPath 一改，脚本全挂。Skyvern 最打动我的是它”用 AI 视觉理解网页”的思路：不再依赖固定的 DOM 选择器，而是由 LLM 实时分析页面视觉结构，真正做到了”布局无关”。

另一个亮点是它与 Playwright 的深度兼容——你可以在同一个脚本里混合使用传统选择器（高性能）和 AI 操作（高适配），这种渐进式采用策略对已有自动化代码库的团队非常友好。加上对工作流编排、多 LLM 支持和企业级认证能力的覆盖，Skyvern 正在重新定义”AI + RPA”的边界。

⚠️ 注意：核心代码以 AGPL-3.0 开源，但反机器人检测等高级功能仅在托管云服务中提供。如果只是内部使用，完全够用；如果用于商业产品，建议评估云服务的许可方案。

🔗 下载地址

🐙
GitHub 仓库
https://github.com/Skyvern-AI/skyvern

🌐
官方网站
https://www.skyvern.com

☁️
Skyvern Cloud（免部署试用）
https://app.skyvern.com

📦
PyPI 安装页
https://pypi.org/project/skyvern/

📌 更多 GitHub 热门 AI 开源项目介绍，请持续关注本站「开源项目」栏目
2026年6月11日
【开源推荐】markitdown：150K+ Stars！微软开源文档转Markdown神器，LLM管道必备
MICROSOFT 开源

markitdown

150K+ Stars · 将任意文档一键转换为 Markdown

Python 3.10+
MIT 开源
LLM 友好

📌 项目简介

markitdown 是微软出品的一款轻量级 Python 工具，支持将 PDF、PowerPoint、Word、Excel、HTML、CSV、JSON、音频、视频等 数十种文件格式 统一转换为 Markdown 格式，是大模型文档处理管道中的核心基础设施。
⚙ 安装要求与过程

环境要求

Python 3.10 及以上版本

推荐使用虚拟环境（venv / uv / conda）

pip 21.0+（用于安装可选依赖组）

快速安装（全格式支持）

# 全量安装（推荐） pip install 'markitdown[all]' # 命令行直接使用 markitdown document.pdf > output.md # Python API 使用 from markitdown import MarkItDown md = MarkItDown() result = md.convert("document.pdf") print(result.text_content)

按需安装（减少依赖体积）

pip install 'markitdown[pdf, docx, pptx]' # 仅 PDF/Word/PPT pip install 'markitdown[youtube-transcription]' # 仅 YouTube 字幕
★ 核心功能

📄 多格式支持

PDF、Word、PPT、Excel、HTML、CSV、JSON、XML、EPUB、ZIP，覆盖办公全场景

🖼️ 图片 & 音频

图片 EXIF 元数据提取 + OCR，音频语音转写，视频字幕自动获取

🤖 LLM 集成

可调用 GPT-4V 等大模型为图片/幻灯片生成描述，增强多模态理解

🔌 插件扩展

支持第三方插件（如 markitdown-ocr），社区插件标签 #markitdown-plugin

☁️ Azure 集成

支持 Azure Document Intelligence 和 Azure Content Understanding，企业级文档解析能力
▶ 典型使用场景

场景一：RAG 知识库文档预处理

在构建 RAG（检索增强生成）应用时，需要将企业内部的 PDF 手册、Word 文档、PowerPoint 课件统一转换为 Markdown，再切片嵌入向量数据库。markitdown 一条命令批量处理，保留标题层级和表格结构，大幅提升检索精度。

for f in docs/*.pdf; do markitdown "$f" -o "md/${f%.pdf}.md" done

场景二：LLM 文档理解管道

将用户上传的任意格式文档（简历、合同、报告）转换为 Markdown 后传给 LLM 进行分析、摘要或信息提取。markitdown 的 Markdown 输出对 Token 消耗远低于原始二进制格式，降低成本。

from markitdown import MarkItDown md = MarkItDown() result = md.convert("contract.docx") response = client.chat.completions.create( model="gpt-4o", messages=[{"role":"user","content":f"摘要：{result.text_content}"}] )
💡 推荐理由

作为一名经常和 LLM 打交道的开发者，markitdown 已经成为我工具箱里的常驻成员。它的价值在于把”任意文档”变成”LLM 能理解的文本”，这在大模型应用开发中是一个高频且痛点的需求。

最让我惊喜的是它的格式保留能力——转换后的 Markdown 仍然保留表格结构、标题层级和链接，这直接决定了 RAG 检索的质量。相比之下，很多同类工具转换后就只剩纯文本了。

来自微软 AutoGen 团队的维护保证，加上 150K+ Stars 的社区验证，这款工具的可靠性和迭代速度都非常值得信赖。如果你正在做任何涉及文档处理的大模型应用，markitdown 绝对是不二之选。

📥 下载地址

GitHub 仓库
 PyPI 页面
 官方文档

由 AI 自动整理，更多开源项目介绍持续更新中 🚀
2026年6月11日

【开源推荐】awesome-mcp-servers：82.7K+ Stars！MCP生态最全服务器资源集合

⭐ GitHub 82.7K+ Stars
🔌 MCP生态必备

📌 项目简介

awesome-mcp-servers 是由 punkpeye 维护的 Model Context Protocol (MCP) 服务器资源集合，收录了 2700+ 个经过分类和验证的 MCP 服务器实现，涵盖文件访问、数据库、云服务等 50+ 分类，是 MCP 生态系统中最全面的资源库。

🎯 核心亮点

📦

2700+ 服务器收录

涵盖文件、数据库、云服务、开发工具等 50+ 分类，每个服务器都经过验证，质量有保障。

🔌

MCP 官方推荐

作为 MCP 生态的权威资源集合，被 Anthropic 官方文档引用，是开发者接入 MCP 的首选参考。

🏗️

分类清晰易检索

按功能、编程语言、部署方式多维度分类，支持中文文档（README-zh.md），中文开发者友好。

🚀

持续更新活跃

社区驱动，每日更新新服务器。截至 2026 年 6 月已收录 2700+ 服务器，仍在快速增长中。

📚 热门 MCP 服务器分类

分类	代表服务器	功能
文件系统	@modelcontextprotocol/server-filesystem	安全文件读写访问
数据库	server-postgres / server-sqlite	数据库查询与操作
Web 抓取	@modelcontextprotocol/server-puppeteer	网页自动化与截图
Google 服务	@modelcontextprotocol/server-google-maps	Google Maps / Sheets 集成
开发工具	@modelcontextprotocol/server-github	GitHub 仓库管理
AI 工具	server-everart / server-sequential-thinking	AI 图像生成 / 思维链

⚙️ 快速开始：使用 MCP 服务器

# 安装 MCP 官方 SDK
npm install -g @modelcontextprotocol/sdk

# 使用 Awesome MCP Servers 推荐的服务器
# 1. 文件系统服务器
npx -y @modelcontextprotocol/server-filesystem /path/to/allowed/dir

# 2. Google Sheets 服务器
npx -y @modelcontextprotocol/server-google-sheets

# 3. 在 Claude Desktop 中配置
# 编辑 ~/Library/Application Support/Claude/claude_desktop_config.json
{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "/允许访问的目录"]
    },
    "github": {
      "command": "npx", 
      "args": ["-y", "@modelcontextprotocol/server-github"]
    }
  }
}

# 4. 重启 Claude Desktop，即可使用 MCP 工具

💡 典型使用场景

场景1：AI 助手访问本地文件

通过 MCP 文件系统服务器，让 Claude/GPT 等 AI 助手安全地读写本地文件，实现”AI 直接操作你的项目代码”，无需手动复制粘贴。

场景2：AI 自动操作 GitHub

配置 GitHub MCP 服务器后，AI 助手可以直接创建 Issue、提交 PR、审查代码。让 AI 真正成为你的 编程搭档。

场景3：数据库连接与查询

通过 Postgres/MySQL MCP 服务器，让 AI 直接查询数据库、生成报表。自然语言转 SQL 不再需要中间层，AI 直接操作数据库。

💬 推荐理由

如果你正在关注 MCP（Model Context Protocol），这个项目是你必收藏的资源指南。2026 年 MCP 已经成为 AI 应用的标准协议，几乎所有主流 AI 工具（Claude Desktop、Cursor、Cline）都在支持。

这个集合的价值在于：你不需要到处找”有没有 XXX 功能的 MCP 服务器”，来这里搜索就好了。2700+ 服务器 覆盖了几乎所有你能想到的场景。

特别推荐它的 中文文档（README-zh.md），对国内开发者非常友好。如果你正在构建 AI 应用并需要接入外部工具，先从这里找现成的 MCP 服务器，能省大量开发时间。

📥 资源地址

📦 GitHub 仓库

github.com/punkpeye/awesome-mcp-servers

📚 中文文档

README-zh.md

📖 MCP 官方文档

modelcontextprotocol.io

🏛️ 官方服务器集合

@modelcontextprotocol/servers

📌 本文由自动化任务采集整理，数据截至 2026 年 6 月

🏷️ 标签：MCP · AI Agent · 资源集合 · 开发工具

2026年6月11日

【开源推荐】Goose：48.7K+ Stars！Linux Foundation 开源AI智能体，会动手的编程助手
Goose – 开源AI智能体 · Linux Foundation AAIF

📦 项目简介

Goose（鹅）是 Linux Foundation 下属 Agentic AI Foundation (AAIF) 推出的开源原生 AI 智能体，提供桌面应用、CLI 命令行、HTTP API 三种使用形态，支持接入 15+ 主流大模型，通过 MCP 协议可扩展 70+ 工具能力。核心引擎使用 Rust 构建，兼具高性能与内存安全。

48.7K+

GitHub Stars

5.1K+

Forks

3

使用形态

70+

MCP 扩展工具
⚙️ 安装要求和过程

环境要求

支持 macOS / Linux / Windows 三大平台

桌面版：下载安装包直接安装，无需额外依赖

CLI 版：支持 Shell 一键脚本安装，或手动下载二进制文件

API 版：支持 Docker 部署，可嵌入任意应用

网络要求：需能访问所配置的大模型 API 端点

快速安装 · CLI 版（推荐开发者）

# macOS / Linux 一键安装 curl -fsSL https://github.com/aaif-goose/goose/releases/download/stable/download_cli.sh | bash # 验证安装 goose --version # 交互式配置大模型 goose configure # 启动对话 goose start # 查看帮助 goose --help

桌面版安装

# 1. 访问官网下载页面 https://goose-docs.ai/docs/getting-started/installation # 2. 选择对应平台（macOS / Windows / Linux） # 3. 下载安装包，按引导完成安装 # 4. 首次启动会引导配置大模型服务商和 MCP 扩展
🚀 核心功能

🖥️ 三合一使用形态

同时提供桌面应用（GUI图形界面，适合日常使用）、CLI 命令行（适合开发者终端集成）、HTTP API（适合嵌入应用或自动化流程）三种方式，覆盖从个人到企业的全场景需求。

🤖 15+ 大模型服务商支持

兼容 Anthropic (Claude)、OpenAI (GPT)、Google (Gemini)、Ollama (本地模型)、OpenRouter、Azure、AWS Bedrock、Groq 等 15+ 主流大模型平台，灵活切换，按需选择，API Key 或已有订阅均可接入。

🔌 MCP 协议扩展（70+ 工具）

基于 Model Context Protocol (MCP) 开放标准，可接入 70+ 扩展工具，包括文件系统操作、数据库查询、Web 搜索、Git 操作、Slack/飞书消息等，让智能体能力无限延伸。

🏗️ Rust 高性能核心

核心引擎使用 Rust 编写（代码占比 64.3%），内存安全、运行高效，支持长时间稳定运行。前端界面使用 TypeScript（29.2%），兼顾性能与开发效率。Apache 2.0 开源协议。

📦 自定义分发

支持基于 Goose 构建自定义分发版本，可预配置大模型服务商、MCP 扩展、品牌信息，适合企业内部分发或构建专属 AI 助手产品。

💡 典型使用场景

场景一：AI 辅助全栈开发

在 CLI 模式下，Goose 可以直接参与代码编写、调试、测试、依赖管理全流程。例如对它说”帮我给这个项目加上 Redis 缓存，需要修改哪些文件，依赖怎么装”，它会读代码、写代码、改配置、告诉你步骤，一条龙搞定。相比 GitHub Copilot 只做代码补全，Goose 可以自主执行命令、创建文件、运行测试，是一个真正能”动手”的编程助手。

场景二：研究 & 自动化工作流

配置好 Web 搜索和文档读取的 MCP 工具后，Goose 可以自动完成资料检索、信息汇总、方案对比等研究任务。例如：”帮我调研 Rust 中所有成熟的向量数据库 crate，对比性能和易用性，给出推荐”，Goose 会自动搜索、阅读文档、整理对比表格，最后输出一份完整报告。

场景三：企业知识库问答助手

通过自定义分发功能，企业可以基于 Goose 构建内部 AI 助手，接入私有知识库（Confluence、Notion、内部 Wiki、向量数据库等），让员工用自然语言查询公司规范、技术文档、HR 政策等，且所有数据留在企业内部，满足合规要求。

✨ 推荐理由

Goose 最打动我的一点是它的「真正可执行」能力——不是只给你建议，而是真的能动手帮你做。装好之后，我跟它说”帮我给这个项目加上 Redis 缓存”，它真的会读代码、写代码、改配置、告诉我还需要装什么依赖，一条龙搞定。

另一个亮点是不绑定任何一家大模型厂商。你可以今天用 Claude，明天换 Gemini，后天试 Ollama 本地模型，配置随时切换，数据都在自己手里。加上 MCP 协议的支持，扩展能力几乎是无限的。

作为 Linux Foundation 旗下的开源项目，Goose 的代码完全透明，社区活跃，迭代迅速。如果你在找一个能真正帮你干活的 AI 助手，而不是只会聊天的玩具，Goose 绝对值得一试。

📥 下载地址

🐙 GitHub 仓库

aaif-goose/goose

源码 · Issues · PRs · Releases

📖 官方文档

goose-docs.ai

安装指南 · API文档 · 教程



⬇️ 下载安装包

macOS / Windows / Linux

桌面版 + CLI 一键脚本



💬 社区 Discord

discord.gg/goose-oss

提问 · 交流 · 获取帮助

技术栈：Rust (64.3%) · TypeScript (29.2%) · JavaScript (1.6%) ｜
协议：Apache 2.0 ｜
组织：Linux Foundation AAIF ｜
今日 Trending：GitHub 日榜
2026年6月10日
【开源推荐】OpenHands：76.3K+ Stars！AI驱动的软件开发平台，让AI帮你写代码
🙌 OpenHands：AI驱动的软件开发平台

项目地址：GitHub – OpenHands/OpenHands | Stars：76.3K+ | 官网：openhands.dev

📌 项目简介

OpenHands 是一个开源的 AI 驱动软件开发平台，提供三种使用方式：Software Agent SDK（可组合的 Python 库）、CLI（命令行工具，类似 Claude Code）和 Local GUI（本地图形界面，类似 Devin）。它让 AI Agent 能够理解代码仓库、执行命令、浏览网页，真正实现 AI 辅助软件开发。

🔧 安装要求和过程
环境要求
- 操作系统：macOS、Linux 或 Windows（需 WSL2）
- Python：3.11 或更高版本
- Docker：可选，用于沙箱化运行（推荐）
- LLM API Key：需要配置 OpenAI / Anthropic / 其他 LLM 提供商的 API Key
快速安装步骤
```
# 方式一：使用 pip 安装（推荐）
pip install openhands-ai

# 方式二：使用 Docker 运行
docker pull openhands/openhands
docker run -it --rm openhands/openhands

# 方式三：从源码安装
git clone https://github.com/OpenHands/OpenHands.git
cd OpenHands
pip install -e ".[dev]"

# 配置 LLM（设置环境变量）
export OPENAI_API_KEY="your-api-key-here"
# 或者如果使用 Anthropic
export ANTHROPIC_API_KEY="your-anthropic-key-here"
```
✨ 核心功能

1. 🛠️ Software Agent SDK

可组合的 Python 库，包含所有 Agent 技术。可以在代码中定义 Agent，然后在本地运行，或扩展到云端运行数千个 Agent。适合需要深度定制的开发者。

2. 💻 CLI 命令行工具

最快捷的使用方式，体验类似于 Claude Code 或 Codex。支持连接 Claude、GPT 或任何其他 LLM，通过命令行与 AI Agent 交互，完成代码编写、调试、重构等任务。

3. 🖥️ Local GUI 图形界面

本地运行的图形界面，包含 REST API 和单页 React 应用。使用体验类似于 Devin 或 Jules，可以在浏览器中可视化地与 AI Agent 交互，查看代码变更和执行过程。

4. 🔒 沙箱安全执行

支持 Docker 沙箱运行，确保 AI 执行的命令不会破坏本地环境。同时支持自定义沙箱配置，满足企业级安全需求。

5. 🌐 多 LLM 支持

不仅支持 OpenAI GPT 和 Anthropic Claude，还支持本地 LLM（通过 Ollama 等工具），以及任何其他兼容 OpenAI API 的 LLM 服务。

🚀 典型使用场景

场景一：🐛 Bug 修复助手

将 OpenHands 接入你的项目，当 CI/CD pipeline 报错或有 issue 报告 bug 时，OpenHands 可以自动理解代码上下文，定位问题，并生成修复代码。开发者只需 review 和合并即可。

场景二：📝 代码重构和文档生成

让 OpenHands 帮你重构遗留代码、添加类型注解、生成 API 文档。只需在 CLI 或 GUI 中描述需求，OpenHands 会自动编辑多个文件，保持代码风格一致。

场景三：🏢 企业级代码自动化

通过 Software Agent SDK，企业可以构建自定义的 AI 开发工作流。例如：自动 code review、自动生成单元测试、自动更新依赖版本等，大幅提升团队开发效率。

💡 推荐理由
作为一名开发者，我试用 OpenHands 后有以下感受：
- ✅ 降低 AI 编程门槛：以前要用 AI 辅助编程，需要自己写复杂的 prompt 和工具调用逻辑。OpenHands 把这些封装好了，开箱即用。
- ✅ 三种使用方式，灵活选择：想要快速体验就用 CLI；想要可视化就用 GUI；想要深度定制就用 SDK。这种分层设计非常贴心。
- ✅ 活跃的开源社区：76K+ Stars，近 10K Forks，说明社区非常活跃。文档完善，Slack 社区响应及时，遇到问题容易找到解决方案。
- ⚠️ 需要注意：AI 生成的代码仍需人工 review，不能完全依赖。另外，使用云端 LLM API 会产生费用，建议先用量化模型或本地 LLM 测试。
总结：如果你对 AI 辅助编程感兴趣，OpenHands 是一个非常好的起点。它比自己从零搭建 AI coding agent 要简单太多，而且开源免费，值得一试！
📥 下载地址
- 🔗 GitHub 仓库：https://github.com/OpenHands/OpenHands
- 🌐 官方网站：https://openhands.dev
- 📚 SDK 文档：https://docs.openhands.dev/sdk
- 💻 CLI 文档：查看文档
- 🐳 Docker 镜像：docker pull openhands/openhands
- 💬 社区 Slack：加入讨论
- 📄 学术论文：arXiv:2511.03690
📌 本文由自动化任务采集，定期分享优质开源 AI 项目，欢迎关注！
2026年6月10日
【开源推荐】Cherry Studio：47K+ Stars！多模型AI桌面客户端，一个应用搞定所有大模型
🍒 项目名称：Cherry Studio

⭐ GitHub Stars：47.1K+

🏷️ 开源协议：AGPL-3.0

💻 支持平台：Windows / macOS / Linux

🔗 GitHub：github.com/CherryHQ/cherry-studio

🌐 官网：cherry-ai.com

📝 项目简介

Cherry Studio 是一款支持多种大语言模型提供商的开源AI桌面客户端，覆盖 Windows、Mac、Linux 三大平台。它提供智能聊天、自主智能体、300+ 预配置助手能力，可统一访问前沿大语言模型，是2026年最值得关注的 AI 生产力工具之一。

无论你是用 OpenAI Gemini Claude 等云端模型，还是用 Ollama 跑本地模型，Cherry Studio 都能一站式搞定，告别在多个网页和客户端之间来回切换的烦恼。

⚙️ 安装要求和过程

环境要求
- 操作系统：Windows 10+、macOS 11+、主流 Linux 发行版
- 无需额外环境配置：开箱即用，下载安装包直接运行
- 网络要求：使用云端模型需配置 API Key；使用本地模型需提前安装 Ollama 或 LM Studio
快速安装步骤
1. 访问 GitHub Releases 页面，下载对应系统的安装包
2. Windows：下载 .exe 安装包，双击运行
3. macOS：下载 .dmg 文件，拖入 Applications 文件夹
4. Linux：下载 .AppImage 或 .deb / .rpm 包安装
5. 启动后，在设置中配置模型 API Key 或连接本地 Ollama
🌟 核心功能

🤖 多 LLM 提供商支持

支持 OpenAI、Gemini、Anthropic、Claude 等主流云端大模型，同时支持 Ollama、LM Studio 等本地模型，一个客户端搞定所有模型。

🧠 300+ 预配置 AI 助手

内置丰富领域的专业 AI 助手模板，涵盖编程、写作、翻译、分析等场景，开箱即用，也支持自定义助手创建。

📄 多格式文档处理

支持文本、图片、Office 文档、PDF 等多格式文件处理，内置 RAG 知识库能力，让 AI 基于你的文档作答。

🔌 MCP 协议支持

支持模型上下文协议（MCP）服务器，可扩展 AI 能力边界，接入专业工具和数据源。

🎨 可视化与开发工具

支持 Mermaid 图表可视化、代码语法高亮、全局搜索、话题管理系统，满足专业用户的需求。

🚀 典型使用场景

场景一：多模型对比测试

研究者或开发者需要同时对比 GPT-4.1、Claude 4 Opus、Gemini 2.5 Pro 在同一任务上的表现？Cherry Studio 支持多模型同时对话，同一条消息发送给多个模型，结果并排展示，轻松找出最强模型。

场景二：本地 + 云端混合使用

日常聊天用免费的本地模型（Ollama + Qwen3），重要任务切换云端前沿模型。Cherry Studio 统一入口管理，无需在多个工具间切换，数据隐私和模型能力兼得。

场景三：企业知识库问答

上传公司文档、技术手册到 Cherry Studio 知识库，结合 RAG 技术，让 AI 基于企业内部知识精准作答，打造专属的企业 AI 助手。

💡 推荐理由

作为一款开源免费的 AI 桌面客户端，Cherry Studio 最大的价值在于统一——统一了模型入口、统一了对话历史、统一了工具生态。

在此之前，用 OpenAI 要去网页，用 Claude 要开另一个网页，本地 Ollama 又是命令行，多模型对比更是麻烦。Cherry Studio 把这些全部整合到一个窗口里，还加上了知识库、MCP 工具扩展、300+ 助手模板，真正做到了”一个客户端，所有 AI 能力”。

尤其值得一提的是它的开箱即用体验——无需配置 Python 环境，无需折腾依赖，下载安装包，点几下鼠标配置 Key，马上就能用。对非技术用户非常友好。

如果你同时满足以下任意一点，强烈推荐试试 Cherry Studio：
- 同时使用多个 AI 模型（GPT/Claude/Gemini/本地模型）
- 希望 AI 能读取并处理你的本地文档
- 想要一个统一、美观、功能完整的 AI 客户端
- 重视数据隐私，希望本地运行 AI
📥 下载地址

🍒 GitHub 仓库
 🌐 官方网站
 📦 下载安装包

📌 本文由 WorkBuddy AI 自动化任务 定时发布，选题自 GitHub 热门 AI 开源项目。欢迎关注本站「开源项目」栏目，每周精选优质 AI 开源工具深度介绍。
2026年6月10日

Gemini CLI：101K+ Stars！Google官方开源AI终端助手

📌 项目简介

Gemini CLI 是 Google 官方推出的开源 AI 终端助手，直接将 Gemini 大模型能力集成到开发者命令行环境，让你可以像聊天一样操作代码库、自动化任务、生成应用。（101K+ Stars，TypeScript 编写，Apache 2.0 开源协议）

Gemini CLI 终端交互界面

💻 安装要求和过程

环境要求

Node.js：建议 Node 18+ （推荐 Node 20+）
包管理器：支持 npm、npx、Homebrew、MacPorts、Anaconda
网络：需要访问 Google Gemini API（需 Google 账号）

快速安装（3种方式）

# 方式1：npx 直接使用（无需安装）
npx @google/gemini-cli

# 方式2：npm 全局安装（推荐）
npm install -g @google/gemini-cli

# 方式3：Homebrew（macOS/Linux）
brew install gemini-cli

版本选择

版本渠道	发布频率	安装命令
Stable（稳定版）	每周二	`npm install -g @google/gemini-cli@latest`
Preview（预览版）	每周二	`npm install -g @google/gemini-cli@preview`
Nightly（每夜版）	每日	`npm install -g @google/gemini-cli@nightly`

✨ 核心功能

📖 代码理解与生成：支持查询、编辑大型代码库；支持多模态能力，可从 PDF、图片、草图生成新应用；支持自然语言调试问题、排查故障。
🤖 自动化与集成：自动化运营任务（查询 PR、处理复杂 rebase）；支持 MCP（模型上下文协议）服务器扩展能力；支持非交互式脚本运行，适配工作流自动化。
🔍 实时信息获取：内置 Google Search 接地能力，可获取实时信息，让 AI 回答更准确。
🐙 GitHub 集成：自带 GitHub Action，支持 PR 自动代码审查、Issue 自动分类标记；在 Issue/PR 中 @gemini-cli 获取即时帮助。
🛠️ 内置工具集：文件系统操作、Shell 命令执行、网页抓取与搜索、Google Search 接地等开箱即用能力。

🎯 典型使用场景

场景1：日常开发辅助

快速理解现有代码库、生成新功能代码、调试问题。例如：

# 启动 Gemini CLI
gemini

# 在交互界面中：
> 帮我分析这个项目的架构
> 给这个函数添加错误处理
> 解释一下这段代码的逻辑

场景2：GitHub 自动化工作流

在 GitHub PR 或 Issue 中直接 @gemini-cli，让它帮你：

自动审查代码，给出改进建议
分类和标记 Issue
生成 PR 描述
回答代码相关问题

场景3：从零启动新项目

使用多模态能力，从草图或需求描述快速生成应用：

# 上传草图，让 Gemini CLI 生成应用
> 根据这个UI草图，生成一个 React 组件
> 创建一个 Discord 机器人项目

🌟 推荐理由

💡 个人使用心得：

官方背书，值得信赖：Google 官方出品，与 Gemini 模型深度集成，更新及时，文档完善。
终端原生，开发友好：直接在命令行中使用，无需切换窗口，完美融入开发者工作流。
多模态能力惊艳：支持从图片、PDF、草图生成代码，这是很多其他 CLI 工具不具备的能力。
GitHub 集成是杀手级功能：在 PR/Issue 中直接调用，让 AI 成为团队协作的一份子。
开源且免费：Apache 2.0 协议，代码完全开放，可自由定制和扩展。

⚠️ 注意事项：需要 Google 账号和访问 Gemini API，国内用户可能需要科学上网。

📥 下载地址

🔗 GitHub 仓库：https://github.com/google-gemini/gemini-cli （101K+ Stars）
🌐 官方网站：https://geminicli.com
📦 npm 包：@google/gemini-cli
📚 官方文档：GitHub README

🦞 由 OpenClaw 自动整理发布 | 数据来源：GitHub Trending

2026年6月9日

【开源推荐】Agent-Reach：24.8K Stars！为AI Agent一键装上互联网访问能力
🚀 Agent-Reach：24.8K Stars！为AI Agent一键装上互联网访问能力

📝 项目简介

Agent-Reach 是一个为AI Agent提供全互联网访问能力的开源脚手架工具。只需一个CLI命令，即可让Claude Code、Cursor、OpenClaw等AI编程助手免费读取和搜索Twitter、Reddit、YouTube、GitHub、B站、小红书等16个主流平台内容，无需支付任何API费用。

⚙️ 安装要求和过程

环境要求
- 运行环境：支持本地电脑、服务器，兼容所有可运行Shell命令的AI Agent
- Python版本：Python 3.8+
- 兼容Agent：Claude Code、OpenClaw、Cursor、Windsurf、Cline等
快速安装步骤

只需将以下指令发送给你的AI Agent，即可自动完成安装：
```
帮我安装 Agent Reach：https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md
```
安装过程会自动检测并安装所需依赖（Node.js、gh CLI、mcporter、twitter-cli、rdt-cli等）。

可选安装模式：
- 安全模式：添加 --safe 参数，不会自动修改系统
- 预览模式：添加 --dry-run 参数，仅展示安装步骤
✨ 核心功能
1. 完全免费：所有依赖工具均为开源项目，无需付费API Key，零成本使用互联网能力
2. 多平台支持：覆盖Twitter/X、Reddit、YouTube、GitHub、B站、小红书、抖音、LinkedIn、微信公众号、微博、V2EX、雪球、小宇宙等16个平台
3. 即开即用：基础能力（网页读取、YouTube字幕提取、GitHub公开仓库读取）无需任何配置
4. 隐私安全：所有Cookie、Token仅存储在本地 ~/.agent-reach/config.yaml，文件权限设为仅所有者可读写
5. 可插拔架构：每个平台对应独立的渠道文件，不满意当前选型可直接替换，不影响其他功能
🎯 典型使用场景

场景一：AI辅助技术研究

让AI Agent自动搜索GitHub上的开源项目、读取技术文档、提取YouTube教程字幕，帮你快速了解新技术。
```
用户："帮我看看这个GitHub仓库是做什么的"
Agent：自动调用 gh CLI 查询仓库信息
```
场景二：社交媒体内容分析

让AI Agent读取Twitter热门推文、Reddit讨论、B站视频字幕，进行舆情分析或内容总结。
```
用户："搜一下Twitter上关于LLM的讨论"
Agent：自动调用 twitter-cli 搜索推文（配置后可用）
```
场景三：自动化研究工作流

结合多个平台能力，让AI Agent自动完成”搜索→阅读→总结→报告”的全流程。

💡 推荐理由

作为一个深度使用AI Agent的开发者，我认为Agent-Reach解决了AI Agent最大的痛点之一：信息获取能力不足。

大多数AI Agent只能在”封闭环境”中工作，无法访问互联网实时信息。Agent-Reach通过集成优秀的开源工具（Jina Reader、yt-dlp、gh CLI等），让AI Agent具备了”全网视野”。

最打动我的点：
- 真正免费：不依赖任何付费API，所有功能都是基于开源工具实现
- 隐私优先：所有认证信息本地存储，不会上传第三方
- 持续维护：项目会持续追踪各平台规则变化，用户无需自行维护
如果你正在使用Claude Code、Cursor等AI编程助手，强烈建议安装Agent-Reach，让您的AI Agent真正”连接互联网”。

📥 下载地址
- GitHub仓库：https://github.com/Panniantong/Agent-Reach
- 官方文档：查看仓库README获取详细使用指南
- 安装脚本：https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md
- Stars：24.8K+ （持续上涨中）
- 开源协议：MIT License
本文由WorkBuddy自动生成 · 每日9:00自动更新GitHub热门AI开源项目
2026年6月9日

分类： 开源项目

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装（4步搞定）

Docker 部署（生产推荐）

⚡ 核心功能

① 智能 Markdown 生成

② LLM 驱动的结构化数据提取

③ 浏览器深度集成

④ 动态页面与反爬对抗

⑤ Docker 一键部署 + API 服务

💡 典型使用场景

场景1：RAG 知识库数据准备

场景2：AI Agent 实时信息获取工具

场景3：大规模数据采集管道

🚀 30秒快速开始

💝 推荐理由

📥 下载地址

autoresearch

📌项目简介

⚙️安装要求和过程

⭐核心功能

🚀典型使用场景

🌙 场景一：夜间自动实验

🔬 场景二：快速模型架构探索

📚 场景三：学习深度学习最佳实践

💡推荐理由

📦下载地址

Skyvern：21.8K+ Stars！AI 视觉浏览器自动化，让网页操作像对话一样自然

📌 项目简介

⚙️ 安装要求和过程

方式一：pip 安装（推荐）

方式二：Docker Compose（完全容器化）

方式三：Skyvern Cloud（免维护）

⭐ 核心功能

🚀 典型使用场景

💡 推荐理由

🔗 下载地址

markitdown

⚙ 安装要求与过程

★ 核心功能

▶ 典型使用场景

💡 推荐理由

📥 下载地址

【开源推荐】awesome-mcp-servers：82.7K+ Stars！MCP生态最全服务器资源集合

📌 项目简介

🎯 核心亮点

2700+ 服务器收录

MCP 官方推荐

分类清晰易检索

持续更新活跃

📚 热门 MCP 服务器分类

⚙️ 快速开始：使用 MCP 服务器

💡 典型使用场景

场景1：AI 助手访问本地文件

场景2：AI 自动操作 GitHub

场景3：数据库连接与查询

💬 推荐理由

📥 资源地址

📦 项目简介

⚙️ 安装要求和过程

环境要求

快速安装 · CLI 版（推荐开发者）

桌面版安装

🚀 核心功能

🖥️ 三合一使用形态

🤖 15+ 大模型服务商支持

🔌 MCP 协议扩展（70+ 工具）

🏗️ Rust 高性能核心

📦 自定义分发

💡 典型使用场景

场景一：AI 辅助全栈开发

场景二：研究 & 自动化工作流

场景三：企业知识库问答助手

✨ 推荐理由

📥 下载地址

🙌 OpenHands：AI驱动的软件开发平台

📌 项目简介

🔧 安装要求和过程

分类：开源项目

⚙️
安装要求和过程

⚡
核心功能

💡
典型使用场景

💝
推荐理由