标签： LLM

andrej-karpathy/skills：144.5k Stars！基于Karpathy编程哲学的Claude Code技能集合，让AI帮你避开编程陷阱
🎯 项目简介

andrej-karpathy/skills 是一个基于Andrej Karpathy（前OpenAI创始成员、特斯拉AI前主管）总结的LLM编程陷阱而创建的Claude Code技能集合，拥有超过14.4万Stars，帮助AI编程助手避免常见错误，提升代码质量。

💻 安装要求和过程

环境要求
- Claude Code 或兼容的AI编程助手
- 支持技能导入功能
快速安装
```
# 克隆仓库
git clone https://github.com/multica-ai/andrej-karpathy-skills.git

# 进入目录
cd andrej-karpathy-skills

# 将 CLAUDE.md 文件复制到你的项目根目录
# Claude Code 会自动读取该文件作为行为规则
```
✨ 核心功能
1. 🎯 避免LLM编程陷阱：基于Karpathy总结的常见错误模式，帮助AI生成更可靠的代码
2. 📝 最佳实践集成：内置经过验证的编程模式和架构决策
3. 🔧 Claude Code优化：专门为Claude Code调优的技能集合
4. 🚀 提升代码质量：减少调试时间，提高代码可维护性
5. 📚 持续更新：跟随LLM能力演进，持续添加新的最佳实践
🎨 典型使用场景

场景1：AI辅助代码审查

在代码审查阶段，让Claude Code加载这些技能，自动识别代码中的潜在问题，如性能陷阱、安全漏洞、反模式等。

场景2：学习LLM编程

对于刚开始使用AI辅助编程的开发者，这个项目是一个完美的”避坑指南”，帮助你理解LLM在编程时的常见失误。

场景3：团队标准化

在团队中统一配置这些技能，确保所有成员在使用AI编程助手时遵循相同的最佳实践。

💡 推荐理由

Andrej Karpathy作为深度学习领域的先驱，其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能，让每个开发者都能受益于顶级专家的见解。

特别适合：
- 频繁使用Claude Code或其他AI编程助手的开发者
- 希望提升AI生成代码质量的团队
- 对LLM编程能力边界感兴趣的研究者
这个项目最打动我的是其实用性——不是空洞的理论，而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。

📥 下载地址
- GitHub仓库：https://github.com/multica-ai/andrej-karpathy-skills
- Star数：144.5k+ ⭐
- 开源协议：未指定（仅单个CLAUDE.md文件）
如果你正在使用Claude Code或其他AI编程助手，强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知！
2026年5月22日
2026年5月大模型排行：Kimi K2.6登顶，国产模型强势崛起

排行榜出来了

CSDN和稀土掘金刚发布了2026年5月AI大模型全景报告，结果有点意思。国产模型Kimi K2.6（月之暗面）以94.3分登顶榜首，DeepSeek V4以93.8分紧随其后。OpenAI的GPT-5排在第三，得分93.5。

前六名依次是：Kimi K2.6（94.3分）、DeepSeek V4（93.8分）、OpenAI GPT-5（93.5分）、Claude 4 Opus（93.1分）、Google Gemini Ultra 3.0（92.7分）、阿里Qwen3-235B（92.4分）。

国产模型在数学推理、长上下文和中文处理方面优势明显。Kimi K2.5在TaxEval v2税务评估准确率达到74.2%，超越OpenAI和Anthropic旗下所有模型。

竞争激烈到什么程度

排名靠前的15个模型在各项基准测试中性能差距只有3个百分点。这意味着什么？意思是大家的水平越来越接近，哪怕一分两分的差距都可能改变排名。

中国AI日均词元调用量已经突破140万亿，较年初增长超过40%。这个数据说明，国产大模型的规模化落地正在加速。不只是榜单上的分数好看，实际使用量也在快速增长。

一个新的趋势：端侧AI

榜单之外，还有一个值得关注的趋势：端侧AI。小米刚开源了MiMo-V2.5，支持手机端本地运行百亿参数大模型。这会降低对云端算力的依赖，也让AI在手机上的应用变得更实用。

端侧AI的好处很明显：响应速度快、不需要一直联网、隐私数据不需要传到云端。当然，手机上的算力有限，能跑的模型大小和复杂度也受限。这是一个平衡。

这意味着什么

国产大模型在这份榜单上的表现，说明一个事实：在AI这个赛道上，中国公司已经不是追赶者，而是竞争者，甚至在某些领域已经是领跑者。

数学推理、长上下文处理、中文理解，这些原本是GPT和Claude的强项，现在国产模型不仅追上来了，还在某些 Benchmark 上超过了他们。这对国内做AI应用的开发者来说，是个好消息——你可以选择一个更懂中文、更便宜、性能还不错的国产模型。

至于端侧AI的兴起，可能会改变未来AI应用的形态。不是所有任务都需要传到云端处理，手机本地能搞定的，就本地搞定。这会催生一批新的应用场景和硬件创新。

📎 原文来源：每日人工智能资讯｜2026年5月大模型排行：Kimi K2.6居首

2026年5月22日
RAGFlow：基于深度文档理解的开源RAG引擎，让AI精准理解你的文档

## 📖 项目简介

**RAGFlow** 是一款基于**深度文档理解（DeepDoc）**的开源 RAG（检索增强生成）引擎。它能够结合大语言模型（LLM），从各种复杂格式的数据中精准提取知识，为 AI 应用提供可靠的问答能力。无论你是个人开发者还是企业团队，RAGFlow 都能帮你构建专属的知识库问答系统。

**GitHub Star:** 81k+ ⭐
**最新版本:** v0.25.5 (2026年5月)
**开源协议:** Apache-2.0

—

## 🔧 安装要求和过程

### 环境要求

| 环境项 | 最低配置 |
|——–|———-|
| **CPU** | ≥ 4核 |
| **内存** | ≥ 16 GB |
| **磁盘** | ≥ 50 GB |
| **Docker版本** | ≥ 24.0.0 |
| **Docker Compose** | ≥ v2.26.1 |

**⚠️ 重要：** 需确保系统参数 `vm.max_map_count` ≥ 262144

“`bash
# 临时生效
sudo sysctl -w vm.max_map_count=262144

# 永久生效
echo “vm.max_map_count=262144” >> /etc/sysctl.conf
“`

### 快速安装（Docker部署）

**1. 克隆仓库**
“`bash
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
“`

**2. 启动服务（CPU版本）**
“`bash
docker compose -f docker-compose.yml up -d
“`

**3. 访问服务**
服务启动后，浏览器访问 `http://服务器IP地址`（默认端口80）

**4. 配置LLM**
在 `service_conf.yaml.template` 中配置你使用的LLM厂商和对应的API_KEY

**💡 提示：** 如需GPU加速，修改 `.env` 文件设置 `DEVICE=gpu`

—

## ⚡ 核心功能

### 1️⃣ 高质量数据处理
基于**深度文档理解（DeepDoc）**技术，从格式复杂的非结构化数据中提取知识，支持Word、PPT、Excel、TXT、图片、扫描件、网页等多种异构数据源。

### 2️⃣ 智能分块与可视化
提供丰富的模板化分块选项，分块逻辑可解释、可调整。支持分块可视化，允许用户人工干预优化，确保知识切分的精准性。

### 3️⃣ 降低幻觉，可追溯来源
回答附带**可追溯的引用来源**，支持查看关键参考信息。可视化展示文本分块逻辑，大幅提升结果可信度。

### 4️⃣ 自动化RAG工作流
适配个人和大型企业的RAG编排需求，支持自定义配置LLM和嵌入模型，支持多路召回+融合重排，提供直观的API，可无缝集成到业务系统中。

### 5️⃣ Agent能力与生态集成
支持**Agent工作流**、**MCP协议**、**记忆（Memory）功能**。最新版本已支持 DeepSeek v4、Gemini 3 Pro、GPT-5 系列模型，并支持 Confluence、Notion、Discord、Google Drive 等数据源同步。

—

## 🎯 典型使用场景

### 场景1：企业知识库问答
**问题：** 企业内部文档分散，员工查找信息困难
**解决方案：** 使用 RAGFlow 构建统一知识库，上传公司文档、手册、规范，员工通过自然语言提问即可快速获取准确答案，并附带原文引用。

### 场景2：技术文档智能检索
**问题：** 技术文档篇幅长，开发者难以快速定位关键信息
**解决方案：** 将 API 文档、开发手册导入 RAGFlow，结合 LLM 实现智能问答，开发者可以直接询问”如何在XXX中实现YYY功能”，系统会返回精准的代码段和说明。

### 场景3：个人学习笔记管理
**问题：** 学习资料繁多，复习时难以高效检索
**解决方案：** 将课程笔记、论文、书籍导入 RAGFlow，构建个人知识助手，随时提问巩固知识点，实现智能化学习。

—

## 💡 推荐理由

作为一名 AI 开发者和内容创作者，我为什么强烈推荐 RAGFlow？

**1. 真正理解复杂文档**
不同于简单的文本切片，RAGFlow 的**深度文档理解**能力可以识别表格、公式、多栏布局等复杂结构，这在处理技术文档和学术论文时特别有用。

**2. 可视化的分块调试**
很多 RAG 系统的痛点是”黑盒分块”，你不知道文档是怎么被切分的。RAGFlow 提供**分块可视化**，让你可以直观看到知识切分效果，并手动调整，这大大提升了问答质量。

**3. 开源且活跃**
81k+ Star，Apache-2.0 协议，社区非常活跃。相比闭源的商业 RAG 服务，你可以完全掌控数据安全，也能根据需求定制功能。

**4. 完整的 Agent 能力**
最新版本支持 Agent 工作流和记忆功能，不仅能回答问题，还能执行复杂任务，比如”帮我总结本周所有文档的更新内容”。

**5. 部署简单**
一条 `docker compose` 命令就能跑起来，对新手非常友好。同时也支持源码部署，方便深度定制。

—

## 📥 下载地址

– **GitHub 仓库：** https://github.com/infiniflow/ragflow
– **官方网站：** https://ragflow.io
– **云服务入口：** https://cloud.ragflow.io
– **官方文档：** https://ragflow.io/docs/dev/
– **中文文档：** https://ragflow.com.cn/docs
– **Discord 社区：** https://discord.gg/NjYzJD3GM3

—

## 🏷️ 相关标签

`RAG` `RAGFlow` `AI` `LLM` `AI Agent` `开源项目` `知识库` `检索增强生成`

—

**📌 系列文章：** 本文是”GitHub热门AI开源项目介绍”系列的第10期。欢迎关注我的博客，获取更多 AI 开源项目的深度介绍！

2026年5月22日
LlamaIndex：49.5k Stars！领先的大模型数据框架，让AI理解你的私有数据
🦙 LlamaIndex

49.5k Stars！领先的大模型数据框架，让AI理解你的私有数据

⭐ 49.5k Stars
🔧 数据框架
📚 RAG引擎

💡 项目简介

LlamaIndex 是用于构建智能体（agentic）应用的开源框架，提供数据接入、结构化组织、检索增强接口等完整能力。它核心解决如何用私有数据增强LLM能力的问题——LLM本身基于公开数据预训练，无法直接获取用户私有数据，而LlamaIndex提供完整工具链，实现私有数据的接入、结构化、检索增强全流程。

目前LlamaIndex已在GitHub获得49,514 Stars，是构建RAG（检索增强生成）应用的首选框架之一。无论是新手还是高级开发者，都能找到适合自己的API层级。
⚙️ 安装要求和过程

环境要求

• Python版本：3.8+
• 依赖管理：pip
• 可选：OpenAI API Key（使用OpenAI模型时）

快速安装

# 新手快速上手（推荐） pip install llama-index # 高级用户自定义安装 pip install llama-index-core # 核心框架 pip install llama-index-llms-openai # OpenAI集成 pip install llama-index-llms-ollama # Ollama本地模型集成 pip install llama-index-embeddings-huggingface # HuggingFace嵌入模型
✨ 核心功能

📥 多源数据接入

提供数据连接器，支持接入API、PDF、文档、SQL等各类数据源和格式。无论是本地文件还是在线服务，都能轻松整合。

🗂️ 数据结构化组织

支持构建索引、知识图谱等结构，让数据可被LLM高效使用。提供多种索引类型：向量索引、树形索引、列表索引等。

🔍 高级检索与查询接口

输入LLM提示词，即可返回检索到的上下文和知识增强后的输出。支持多种检索策略：向量检索、关键词检索、混合检索等。

🔧 灵活扩展性

支持自定义所有核心模块，适配不同场景需求。提供300+集成包（LlamaHub），覆盖LLM、嵌入模型、向量存储等组件。

🤖 多模型兼容

支持OpenAI、本地Ollama、HuggingFace等各类LLM和嵌入模型。无需修改代码即可切换底层模型，真正实现解耦。

🚀 典型使用场景

1️⃣ 企业知识库问答系统

将公司文档、PDF、API文档等私有数据接入LlamaIndex，构建智能问答系统，让员工快速获取准确信息。支持多用户、权限管理、对话历史等高级功能。

2️⃣ 个人第二大脑

整合个人笔记、文章、代码注释等，构建个性化AI助手，实现智能检索和知识管理。配合LlamaParse，甚至能解析扫描版PDF和图片。

3️⃣ RAG应用快速原型

利用LlamaIndex的高阶API，仅需5行代码即可完成数据接入和查询，快速验证RAG应用想法。适合创业团队快速MVP验证。

💡 推荐理由

🎯 完美的平衡：LlamaIndex是我接触过的最优雅的RAG框架之一。它完美平衡了易用性和灵活性——新手可以用5行代码快速上手，高级用户又能深度定制每个组件。

🔌 强大的生态：特别是它对各类LLM和向量存储的广泛支持（300+集成包），让你可以轻松切换不同的技术栈而无需重写代码。LlamaHub让集成变得像pip install一样简单。

📖 优秀的文档：它的文档详尽、社区活跃，几乎能找到所有常见问题的解决方案。从入门教程到高级进阶，覆盖全链路。

🚀 企业级能力：配套的企业级文档智能处理平台LlamaParse，支持130+种文档格式解析，让非结构化文档的结构化处理变得轻而易举。

📥 下载地址

🔗 相关链接

• GitHub仓库：https://github.com/run-llama/llama_index
• 官方文档：https://developers.llamaindex.ai
• LlamaParse（企业文档OCR）：https://cloud.llamaindex.ai
• PyPI安装：pip install llama-index

📌 开源协议

LlamaIndex 使用 MIT License，允许商用、修改、分发，非常适合企业和个人开发者使用。

📌 本文属于「开源项目」系列，持续介绍GitHub上的优质AI开源项目，欢迎关注！

🔥 下期预告：更多精彩AI开源项目即将上线，敬请期待…
2026年5月20日
Andrej Karpathy官宣加入Anthropic，OpenAI联合创始人为何选择竞对
5月19日，AI圈被一条推文炸开了锅——Andrej Karpathy在X上官宣了自己加入Anthropic的消息。这位OpenAI的联合创始人、特斯拉前AI负责人，选择在这时候加入Claude的缔造者，让不少人感到意外。

「我认为LLM前沿领域接下来的几年会特别关键。我很兴奋能加入这里的团队，重新回到研发一线。」——Andrej Karpathy

他到底是谁

karpathy在AI圈子里的分量，不需要太多介绍。他是OpenAI的创始成员之一，早年深耕深度学习和计算机视觉，2017年被马斯克挖去特斯拉，一手搭建了FSD（全自动驾驶）和Autopilot的核心团队。2022年离开特斯拉后，他短暂回归OpenAI一年，2024年又出来创立了Eureka Labs，想用AI助手做教育。

他还有一门非常出名的在线课程《Neural Networks: Zero to Hero》，教学生从零开始用代码实现神经网络，在YouTube上有一大批忠实观众。可以说，他是少数几个既能搞懂大模型理论、又能真正把大规模训练跑起来的人。

Andrej Karpathy（图源：San Francisco Chronicle / Getty Images）

在Anthropic做什么

Karpathy本周正式入职Anthropic，在Nick Joseph的带领下专注于预训练（pre-training）方向。预训练是构建前沿模型最烧钱、最吃算力的阶段，直接决定了Claude的核心知识和能力上限。

Anthropic方面还透露，Karpathy会着手组建一个专门的团队，研究方向是用Claude来加速预训练研究本身。这个思路很清晰——用AI来研究AI，用更强的模型来帮自己训练下一代模型，形成研发飞轮。

为什么是现在

Anthropic在这个时间点挖来Karpathy，信号很明确：他们相信AI辅助的研发，而不仅仅是堆算力，才是接下来和OpenAI、Google竞争的关键。能同时懂LLM理论和大尺度训练实践的研究者，圈子里掰着手指头数得过来，Karpathy是一个。

至于他创立的Eureka Labs，目前还没有进一步的消息。Karpathy在自己的帖子里也提到，他对教育的热情不会消失，未来会找时间继续这件事。
- OpenAI联合创始人身份，深度参与GPT早期研发
- 特斯拉FSD团队缔造者，大规模AI落地经验
- 顶级AI教育者，Zero to Hero课程影响数十万开发者
- 唯一同时深度参与过OpenAI和特斯拉AI全栈的领军人物
同一天，Anthropic还宣布了另一位重磅人才的加入：网络安全老将Chris Rohlf加入了前沿红队（frontier red team）。Rohlf在Yahoo的”The Paranoids”安全团队成名，后来在Meta待了六年，职业生涯跨度超过20年。他在X上写道：「我们有一个真正的机会，用AI大幅改善网络安全」，并认为此刻加入Anthropic是正确的选择。

两则人事消息同一天公布，怎么看都像是Anthropic在Google I/O期间的一次精准人才公关。不管是巧合还是刻意为之，Anthropic正在用行动告诉外界：他们不仅在模型能力上追，在人才吸引上也一点不虚。

📎 原文来源：TechCrunch – OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team
2026年5月20日
AnythingLLM：60.3k Stars！全功能AI生产力加速器，隐私优先的本地知识库方案
📦 项目简介

AnythingLLM 是一款全功能一体化AI生产力加速器，默认本地运行、隐私优先。它将LLM聊天、RAG文档检索、AI代理、多模态支持完美集成在一个应用中，让你无需复杂配置即可拥有属于自己的私有AI助手。

⚙️ 安装要求和过程
环境要求

桌面版：Windows/macOS/Linux，直接下载安装包

Docker版：Docker 20.10+，2GB+ RAM

支持LLM：OpenAI、Ollama、LM Studio、Google Gemini、Anthropic等40+模型

向量数据库：LanceDB（默认）、PGVector、Pinecone、Chroma等
# 快速安装 – Docker方式

docker pull mintplexlabs/anythingllm:latest

docker run -d -p 3001:3001 –name anythingllm mintplexlabs/anythingllm:latest

# 桌面版直接下载

访问 https://anythingllm.com/download 下载对应系统安装包

⭐ 核心功能

📚 RAG文档对话

支持PDF、TXT、DOCX等多种文档格式，内置RAG（检索增强生成）能力，让AI精准理解你的文档内容。

🤖 内置AI代理

自动执行网页浏览、工作流自动化等复杂任务，支持无代码代理构建器，最多可降低80%的token消耗。

🔌 全面MCP兼容

完全兼容MCP（模型上下文协议），可对接外部工具，扩展AI能力边界。

👥 多用户权限管理

Docker版本支持多用户权限管理，适合团队共享知识库，保护企业知识产权。

🎨 多模态支持

支持多模态LLM（闭源/开源模型均兼容），支持语音转文本、文本转语音、音视频转录。

💡 典型使用场景

🏠

个人知识管理

本地搭建私有知识库，对话查询个人文档、笔记，隐私数据完全本地存储，无需担心数据外泄。

🏢

企业团队使用

多用户权限管理，团队共享知识库，控制不同用户的访问权限，保护企业核心知识资产。

🔧

AI应用开发

基于完整开发者API、MCP兼容性，快速构建自定义AI应用，对接现有业务系统。

🌐

网站智能客服

通过嵌入聊天组件，在网站部署AI客服，基于企业私有文档回答问题，提升用户满意度。

💝 推荐理由

说实话，我用过很多AI工具和知识库方案，但AnythingLLM是唯一让我觉得”这就是我想要的”的产品。它的设计理念非常清晰：隐私优先、本地运行、开箱即用。

我最喜欢它的RAG文档对话功能。你可以把PDF、Word、TXT文档直接拖进去，它就能基于这些文档回答问题。比起那些需要把数据上传到云端的方案，AnythingLLM让我感觉数据完全在自己掌控之中。

另外，它的MCP兼容性也非常棒，可以对接各种外部工具，让AI的能力不断扩展。如果你正在寻找一个隐私安全、功能全面、易于部署的AI生产力工具，AnythingLLM绝对值得一试！

📥 下载地址

🔗 官方网站：https://anythingllm.com

📚 官方文档：https://docs.anythingllm.com

💻 GitHub仓库：https://github.com/Mintplex-Labs/anything-llm

📥 桌面版下载：https://anythingllm.com/download

🔥 项目亮点总结
60.3k+ Stars |
隐私优先 |
本地运行 |
MCP兼容
2026年5月20日
RAGFlow：80.8k Stars！开源RAG引擎，让AI精准理解你的文档

📚 RAGFlow

80.8k Stars！开源RAG引擎，让AI精准理解你的文档

⭐ 80.8k Stars
🔧 RAG引擎
📄 深度文档理解

💡 项目简介

RAGFlow 是一款基于深度文档理解构建的开源 RAG（检索增强生成）引擎，由 InfiniFlow 团队开发。它可以为各种规模的企业及个人提供一套精简的 RAG 工作流，把”大模型+企业知识库”的门槛直接干到地面。

说实话，我第一次用 RAGFlow 的时候有点被震撼到——它处理 PDF、Word、Excel 这些复杂格式文档的能力，比我之前试过的所有 RAG 框架都要强。关键是它有可视化分块界面，你能看到每个文本块是怎么切的，哪里出了问题直接改，不用盲目调参。

🚀 核心功能

📑 深度文档理解

支持 PDF、Word、Excel、PPT、图片、扫描件等复杂格式，能从非结构化数据中提取精准知识。表格、图表、多栏布局都能正确解析，真正做到了”看懂”文档。

🔍 高质量RAG管道

内置多路召回 + 融合重排，支持可视化文本分块，生成结果附带可追溯的引用来源。不再出现”幻觉”回答，每个答案都有据可依。

🤖 Agent + MCP 支持

内置 Agent 工作流，支持 MCP 协议接入，可对接 OpenClaw 等 AI Agent 平台。还能接入 Confluence、Notion、Google Drive 等数据源，一键同步知识库。

🔧 多种部署方式

支持 Docker 一键部署（推荐），也支持源码启动。兼容 DeepSeek v4、Gemini 3 Pro、GPT-5 系列等主流大模型，自带 embedding 模型。

⚙️ 安装要求与过程

环境要求

• CPU ≥ 4核
• 内存 ≥ 16 GB
• 磁盘 ≥ 50 GB
• Docker ≥ 24.0.0 & Docker Compose ≥ v2.26.1
• 系统参数要求：vm.max_map_count ≥ 262144

# 1. 克隆仓库
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker

# 2. 启动服务（CPU版）
docker compose -f docker-compose.yml up -d

# 3. 查看日志确认启动成功
docker logs -f docker-ragflow-cpu-1

# 4. 浏览器访问 http://服务器IP
# 出现 Running on all addresses 即成功！

💼 典型使用场景

🏢 企业知识库问答

把公司的产品文档、技术手册、HR政策全部喂给 RAGFlow，员工直接用自然语言提问，AI 能精准定位到具体文档段落并给出答案，还附带引用来源。比传统关键词搜索强太多了。

📚 个人学习助手

上传教材、论文、技术书籍，让 AI 帮你梳理知识点、回答思考题。RAGFlow 对 PDF 的解析特别到位，公式、表格、图表都能正确识别，学习效率高了不少。

🤖 AI Agent 知识底座

通过 MCP 协议把 RAGFlow 接入 OpenClaw 或 AutoGPT，让 AI Agent 在执行任务时可以实时检索你的私有知识库。相当于给 Agent 装了一个”外挂大脑”。

🌟 推荐理由

我觉得 RAGFlow 最打动我的一点，是它把”可视化”做到了极致。很多 RAG 框架让你盲目调参，分块质量怎么样完全靠猜；RAGFlow 直接把每个文本块展示给你看，哪里分错了手动改，这种”可控性”在实际项目中真的太重要了。

另外它的文档解析能力确实一流，我试过把一本 500 页的技术书丢进去，公式、代码块、表格全都识别对了，召回准确率相当能打。如果你正在搭建企业知识库或者给 AI Agent 接知识底座，RAGFlow 绝对值得一试。⭐

📥 下载地址

📦 GitHub 仓库
 🌐 官方网站
 📚 官方文档
 ☁️ 云服务

📌 本文由 AI 自动采集整理，更多开源项目介绍持续更新中…

Tags: RAGFlow · RAG · 知识库 · 开源AI

2026年5月19日
LangChain：百万Stars的AI Agent工程平台，构建智能应用的万能积木
说实话，第一次接触LangChain的时候，我觉得这名字起得太绝了——把语言模型像链条一样串联起来，不就是它干的事嘛？

从2022年底发布到现在，这个框架已经突破了100万 GitHub Stars，月活开发者超过38万，大约1.5万家企业在用它构建AI应用。在AI Agent开发领域，LangChain基本上就是”基础设施”级别的存在。

🚀 项目简介

LangChain 是一个开源的AI Agent工程平台，让开发者能够用模块化的方式构建LLM驱动的应用程序。它的核心理念很简单：把AI应用开发中那些重复的”管道工作”标准化，让你专注于真正需要解决的问题。

创始人是Harrison Chase，项目在2022年10月首次发布。如今LangChain已经从最初的”链式调用”模式进化成了完整的Agent工程平台，旗下包括LangGraph（图工作流引擎）、LangSmith（可观测性平台）和LangGraph Cloud（托管部署服务）。

⚙️ 安装要求和过程
💻 环境要求
- Python 3.9+ 或 Node.js 18+
- 至少一个LLM API Key（OpenAI、Anthropic、Google等）
📦 快速安装
```
# Python版本
pip install langchain langchain-openai

# Node.js版本
npm install langchain @langchain/openai
```
🧪 30秒上手示例
```
from langchain.chat_models import init_chat_model

# 一行初始化模型，支持随时切换供应商
model = init_chat_model("openai:gpt-4o")
result = model.invoke("LangChain是什么？")
print(result.content)
```
就这么简单。重点是 init_chat_model 这个函数——你换模型只需要改一个字符串，从 openai:gpt-4o 到 anthropic:claude-sonnet 到 google:gemini，代码不用动。
💡 核心功能
- 🔀 LangGraph：图工作流引擎
  LangChain目前最核心的子项目。把Agent的行为定义成有状态图——节点是处理步骤，边是流转规则。支持循环执行、条件分支、并行处理，还有人工介入（human-in-the-loop）的检查点。
- 🔄 模型无关的抽象层
  写一次代码，换个模型参数就能跑。不管是GPT、Claude还是Gemini，甚至本地部署的Llama，LangChain的抽象层让你不需要为每个模型写适配代码。
- 🧩 超丰富的集成生态
  700+个集成组件，覆盖向量数据库（Pinecone、Chroma、Weaviate）、工具调用、文件处理、搜索引擎、API对接等。基本上你想连接的外部服务，它都有现成的包。
- 🔍 LangSmith：全链路可观测性
  在开发调试阶段这是神器——能看到Agent每一步的输入输出、token消耗、延迟，还能做A/B评估。生产环境的Agent出bug了？LangSmith帮你定位问题像用X光一样直观。
- 📄 RAG（检索增强生成）工具链
  从文档加载、文本切分、向量化存储到检索生成，RAG的全流程LangChain都有成熟的方案。想给AI接上企业知识库？这是最成熟的开源选择之一。
📦 典型使用场景

📈 场景一：构建企业智能客服

用LangChain + LangGraph搭建一个多轮对话Agent，连接企业知识库做RAG检索，再通过工具调用（Tool Calling）对接订单查询、退款等业务API。人工客服处理不了的时候自动转人工，整个过程定义成一个清晰的图工作流。

📊 场景二：自动化数据处理流水线

比如每天从多个数据源抓取信息 → LLM分析摘要 → 自动生成报告 → 发送到指定渠道。LangChain的链式编排让这条流水线的每一步都可配置、可监控、可回溯。

🤝 场景三：多Agent协作系统

LangGraph支持定义多个Agent节点，让它们协作完成复杂任务。比如一个”研究Agent”负责搜索和整理信息，一个”写作Agent”负责生成内容，一个”审核Agent”负责质量把关——各司其职，通过图结构编排协作流程。

⭐ 推荐理由

我觉得LangChain最大的价值不在于某个具体功能，而在于它把AI应用开发从”写Prompt”提升到了”工程化”的层面。

用创始人Harrison Chase的话说：“你当然可以不用框架直接写Agent——就像你可以不用Web框架直接写网站一样。但大多数人选择用框架，原因是一样的：那些无聊的管道代码既繁琐又容易出错，还会让你分心。”

Sequoia的合伙人Sonya Huang也说过：“Agent框架是AI技术栈中的中间件层。历史上，中间件公司都是极好的生意，因为它们卡在基础设施和应用之间的关键节点上。”

当然，Andrej Karpathy也说过反面的观点——最好的生产级Agent代码可能就是一个Python文件加上API调用。这话没毛病，但我个人的经验是，当你的Agent系统复杂度上来了、需要团队协作、需要可观测性、需要快速迭代的时候，有个好框架能省下大量时间。
💰 一组数据说明一切：
- 2026年1月完成 2亿美元 C轮融资
- ARR突破了 5000万美元
- 月活开发者 38万+
- 部署企业约 1.5万家
社区在快速迭代，LangGraph的图工作流范式正在成为Agent开发的事实标准之一。
📥 下载地址
- 🏠 GitHub仓库：https://github.com/langchain-ai/langchain
- 📖 官方文档：https://python.langchain.com/
- 🔧 LangGraph文档：https://langchain-ai.github.io/langgraph/
- 🌐 LangSmith平台：https://smith.langchain.com/
2026年5月18日
Meta的Avocado熟了吗？内测多个变体模型，发布却一拖再拖

Meta的下一代大模型Avocado，这个名字听着就挺接地气，但它的开发进度可一点都不”熟”。本来计划今年3月发布，结果内部测试发现性能跟不上Google、OpenAI和Anthropic的顶尖模型，发布时间至少推迟到了今年5月——也就是眼下这个月。

多个变体同时测，Meta自己也没拿定主意

从Meta AI的界面里挖出来的内部信息显示，他们正在同时测试好几个不同版本的Avocado。有个9B参数的小型版本，叫Avocado 9B；还有一个带”agent”和”sub-agent”标签的变体，叫Avocado Mango，支持图像生成，算是个多模态版本。

除此之外，还有Avocado TOMM（”Tool of many models”，基于Avocado的工具调用版本）、Avocado Thinking 5.6（最新版的思考模型），以及一个只做文本对话的版本叫Paricado。多个不同尺寸的候选版本同时测试，看起来Meta自己也还在纠结，到底哪个配置最终能端上台面。

内部流出的系统指令显示，Avocado能调用各种内部工具，某些情况下能解出早先Llama模型搞不定的复杂数学题——只不过这些题，Gemini 3和GPT 5早在几个月前就已经能解了。

性能不够，Gemini来凑

这件事已经严重到了什么程度？Meta的AI领导层据传已经讨论过临时授权使用Google的Gemini技术。目前Meta AI内部已经在做A/B测试，把一部分请求路由到Gemini模型上跑。这种做法说明，Meta在Avocado成熟之前，打算用外部模型来填补能力缺口。

对于一家砸了重金要做”世界顶级AI”的公司来说，要靠竞争对手的模型来撑场面，这多少有点尴尬。但换个角度看，这种务实的做法也能理解——总不能让用户一直用着落后于时代的Llama 3等模型吧。

从开源到闭源，Meta的AI路线大转弯

Avocado另一个值得关注的动向是，Meta正在告别过去几年力推的开源路线。Avocado预计会以闭源形式发布，只提供API和托管服务，不再像Llama系列那样开放权重。这个转弯不可谓不大，背后自然是CEO扎克伯格对”超级智能”的执念在驱动。

对于Facebook、Instagram和WhatsApp上那几亿Meta AI的用户来说，Avocado即便追不上前沿竞品，至少也会比现在基于Llama的回复有明显提升。问题是，Meta会不会选择一个相对低调的时机悄悄上线这些改进，还是非要等一个够排场的发布时刻？目前还没有人能给出准信。

截至本文发布，Avocado的具体发布日期仍然没有官宣。对于关注Meta AI动向的人来说，不妨盯着点这个月的动静——毕竟，”至少5月”这个说法，留给Meta的时间已经不多了。

📎 原文来源：Exclusive: Meta tests Avocado 9B and Avocado Mango Agent – Testing Catalog

2026年5月18日
不用改提示词，直接调模型“大脑”：DeepSeek-V4-Flash让LLM Steering回归实用
跟AI打交道的人大概都有这种体验：你在系统提示词里写了800字约束模型的语气、风格和立场，结果对话进行到第三轮，模型就开始放飞自我了。提示词能影响的只是模型的输入端，模型内部怎么处理、怎么生成，你管不着。

但现在有一种替代方案正在重新回到聚光灯下——LLM Steering（大语言模型引导）。这不是什么新概念，早在Anthropic做Golden Gate Claude的时候就引发过关注。只是以前它太重了，需要A100级别的GPU和PyTorch加TransformerLens，普通开发者根本玩不起。而DeepSeek-V4-Flash加上一个叫DwarfStar 4的工具，把这个门槛降到了单张RTX 4090就能跑。

Steering到底是什么，跟提示词有什么区别

打个比方。提示词就像你给一个人写了张纸条：”请你用简洁的语气回答”，这个人看了纸条，可能前两句照做了，聊着聊着又回到啰嗦的老样子。Steering则像你直接拧了这个人脑子里一个名为”简洁度”的旋钮，每一句话都说出来之前，这个旋钮都在生效。

技术上的实现也不复杂。Steering的核心是对比对（Contrast Pair）——让模型分别处理两个条件，比如”简洁回答”和”详细回答”，记录某一层激活值的差异，算出平均差值作为”简洁方向向量”。之后在正常的推理过程中，把这个向量加到对应层的激活值上，模型的输出就会不自觉地偏向简洁。

提示词管的是输入，Steering管的是过程。前者是”请你这样做”，后者是”我帮你这样做”。每个token生成时都在施加影响，所以效果在整个输出中保持一致。

为什么以前没流行起来

Steering概念好是好，但有三个硬伤一直挡在前面。第一，它只适用于开源模型——你需要访问模型内部每一层的激活值，而OpenAI和Anthropic的API不可能给你这个权限。第二，以前做激活值分析需要搭建PyTorch + TransformerLens的完整环境，硬件起步就是A100。第三，大多数Steering能实现的效果，其实用提示词也能凑合达到，多花几行字就完事了。

所以之前Steering基本是大厂实验室的自留地，Anthropic拿它做可解释性研究，学术界拿它写论文，一线开发者完全用不上。

DeepSeek-V4-Flash + DwarfStar 4改变了什么

两个关键因素。DeepSeek-V4-Flash本身就是一个针对推理效率优化过的模型，能在相对有限的显存上运行，同时保持了不错的推理质量。而DwarfStar 4是llama.cpp的一个分支，专门为特定模型系列加了激活值钩子，把”提取和注入激活值”这个操作简化到了几乎一条命令就能完成。

这意味着什么？以前你需要一个有A100的实验室和一整套PyTorch环境，现在你只需要一张4090和几行命令就能跑完整个Steering实验的流程。门槛的降低是数量级的。

能拿它干什么
- 语气一致性：让模型在长对话中始终维持特定的语气和风格，不会漂移
- 领域偏移：不用微调，就让模型的输出偏向金融、医疗或法律风格（但只影响表达框架，不影响事实准确性）
- 安全防护：构建安全拒绝向量，在推理时注入作为轻量级护栏
- 上下文压缩：把原本需要大量token描述的约束条件压缩成一个向量，省出上下文窗口
不过也别太乐观。Sean Goedecke在他那篇广为流传的文章里提到，Steering目前还有明显的局限性：你很难精确理解一个激活值差异到底编码了什么信息，副效应可能出现在不相关的任务上，而且在一个领域构建的向量未必能迁移到另一个领域。

从黑盒喊话到白盒调参

Bagua AI的文章里有一个观点我觉得很到位：过去几年，行业一直在把LLM当黑盒，用提示词从外面”喊”它。Steering的复兴代表了一个转变——我们从外部喊话，变成从内部调参。这不仅仅是效率优化，而是机械可解释性（Mechanistic Interpretability）走向工业化应用的第一步。

对实际做开发的团队来说，Steering目前最直接的价值在于替代那些越来越臃肿的系统提示词。与其花500个token约束模型行为，不如提取一个向量注入进去，既省上下文窗口又稳定。这个账，但凡做过复杂Agent系统的人都会算。

竞争壁垒正在从”提示词工程”转向”理解内部表征”。谁能读懂模型的激活空间，谁就能更好地控制模型。这项技能在未来可能比写prompt值钱得多。

📎 原文来源：DeepSeek-V4-Flash means LLM steering is interesting again – Sean Goedecke ｜ LLM Steering Vectors 2026 – braindetox ｜ DeepSeek-V4-Flash Revitalizes LLM Steering – Bagua AI
2026年5月17日

标签： LLM

🎯 项目简介

💻 安装要求和过程

环境要求

快速安装

✨ 核心功能

🎨 典型使用场景

场景1：AI辅助代码审查

场景2：学习LLM编程

场景3：团队标准化

💡 推荐理由

📥 下载地址

排行榜出来了

竞争激烈到什么程度

一个新的趋势：端侧AI

这意味着什么

他到底是谁

在Anthropic做什么

为什么是现在

📦 项目简介

⚙️ 安装要求和过程

环境要求

⭐ 核心功能

📚 RAG文档对话

🤖 内置AI代理

🔌 全面MCP兼容

👥 多用户权限管理

🎨 多模态支持

💡 典型使用场景

个人知识管理

企业团队使用

AI应用开发

网站智能客服

💝 推荐理由

📥 下载地址

🚀 项目简介

⚙️ 安装要求和过程

💡 核心功能

📦 典型使用场景

⭐ 推荐理由

📥 下载地址

多个变体同时测，Meta自己也没拿定主意

性能不够，Gemini来凑

从开源到闭源，Meta的AI路线大转弯

Steering到底是什么，跟提示词有什么区别

为什么以前没流行起来

DeepSeek-V4-Flash + DwarfStar 4改变了什么

能拿它干什么

从黑盒喊话到白盒调参