博客

发改委出手了：人工智能立法研究启动，”人工智能+”正在加速落地
发改委出手了：人工智能立法研究启动，”人工智能+”正在加速落地

5月22日，国家发改委召开5月份新闻发布会，新闻发言人李超透露了一个重要信号：官方正在开展人工智能立法研究，要强化安全治理能力建设，让人工智能朝着有益、安全、公平的方向发展。

这话听起来有点宏观，但实际影响会很深远。想想看，AI现在到处都是，从手机里的语音助手到医院的辅助诊断，从自动驾驶到金融风控，到处都在用。但规则跟不上技术，就会出问题——数据泄露、算法歧视、AI生成内容乱七八糟……所以立法不是”要不要”的问题，是”什么时候出台、怎么制定才合理”的问题。

“这也是中国人工智能发展的一大突出特征——在保持快速发展的同时，确保自主可控、向善发展、行稳致远，让全体人民共享人工智能发展成果。”

“人工智能+”已经在路上

发布会上还介绍了”人工智能+”行动的进展。目前官方已经出台了制造、医疗、能源等十多个行业的专项政策文件，政策体系正在不断完善。

更有意思的是，国家发改委会同有关部门在制造、医疗、交通等领域布局了一批国家人工智能应用中试基地。这些基地是干嘛的？简单说，就是让AI技术从实验室走到试验场、从工厂走到市场的”中转站”，提供算力、数据、场景这些关键要素支撑，大幅缩短转化周期、降低落地成本。

国家发改委5月份新闻发布会现场（图片来源：中国新闻网）

已经有落地案例了

举个具体的例子：医疗领域的中试基地孵化出了一款叫“蚂蚁阿福”的AI应用，可以提供就医陪诊、辅助诊断、家医随访等智能服务。这款应用已经在十多个省市的医疗机构落地，让更多居民享受到智能、优质、便利的健康体验。

你看，AI不是只在大厂实验室里跑模型、刷榜单，它真的在走进医院、走进社区，开始影响普通人的生活。这才是”人工智能+”想要达到的效果。

接下来还要做什么？

李超还透露了两个重要计划：
- 出台配套文件：官方正在谋划出台加快”人工智能+”落地的配套文件，进一步加大要素保障。
- 打造标杆应用：持续推动央国企开放高价值应用场景，面向各行业领域和各地方打造人工智能标杆应用，加快引导人工智能融入生产、经营、管理等各方面各环节。
这意味着什么？意味着接下来会有更多实际的应用场景被开放出来，AI技术会更快地渗透到各行各业。对于做AI应用的创业公司来说，这是个好消息——有政策支持、有场景开放、有要素保障，落地会更容易。

回过头看，人工智能立法研究、”人工智能+”行动、应用中试基地、配套文件……这一套组合拳打下来，中国AI的发展路径已经很清晰了：既要快，也要稳；既要创新，也要安全；既要技术突破，也要普惠共享。

📎 原文来源：中国新闻网 – 国家发改委：正开展人工智能立法研究
2026年5月22日
andrej-karpathy/skills：144.5k Stars！基于Karpathy编程哲学的Claude Code技能集合，让AI帮你避开编程陷阱
🎯 项目简介

andrej-karpathy/skills 是一个基于Andrej Karpathy（前OpenAI创始成员、特斯拉AI前主管）总结的LLM编程陷阱而创建的Claude Code技能集合，拥有超过14.4万Stars，帮助AI编程助手避免常见错误，提升代码质量。

💻 安装要求和过程

环境要求
- Claude Code 或兼容的AI编程助手
- 支持技能导入功能
快速安装
```
# 克隆仓库
git clone https://github.com/multica-ai/andrej-karpathy-skills.git

# 进入目录
cd andrej-karpathy-skills

# 将 CLAUDE.md 文件复制到你的项目根目录
# Claude Code 会自动读取该文件作为行为规则
```
✨ 核心功能
1. 🎯 避免LLM编程陷阱：基于Karpathy总结的常见错误模式，帮助AI生成更可靠的代码
2. 📝 最佳实践集成：内置经过验证的编程模式和架构决策
3. 🔧 Claude Code优化：专门为Claude Code调优的技能集合
4. 🚀 提升代码质量：减少调试时间，提高代码可维护性
5. 📚 持续更新：跟随LLM能力演进，持续添加新的最佳实践
🎨 典型使用场景

场景1：AI辅助代码审查

在代码审查阶段，让Claude Code加载这些技能，自动识别代码中的潜在问题，如性能陷阱、安全漏洞、反模式等。

场景2：学习LLM编程

对于刚开始使用AI辅助编程的开发者，这个项目是一个完美的”避坑指南”，帮助你理解LLM在编程时的常见失误。

场景3：团队标准化

在团队中统一配置这些技能，确保所有成员在使用AI编程助手时遵循相同的最佳实践。

💡 推荐理由

Andrej Karpathy作为深度学习领域的先驱，其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能，让每个开发者都能受益于顶级专家的见解。

特别适合：
- 频繁使用Claude Code或其他AI编程助手的开发者
- 希望提升AI生成代码质量的团队
- 对LLM编程能力边界感兴趣的研究者
这个项目最打动我的是其实用性——不是空洞的理论，而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。

📥 下载地址
- GitHub仓库：https://github.com/multica-ai/andrej-karpathy-skills
- Star数：144.5k+ ⭐
- 开源协议：未指定（仅单个CLAUDE.md文件）
如果你正在使用Claude Code或其他AI编程助手，强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知！
2026年5月22日
2026年5月大模型排行：Kimi K2.6登顶，国产模型强势崛起

排行榜出来了

CSDN和稀土掘金刚发布了2026年5月AI大模型全景报告，结果有点意思。国产模型Kimi K2.6（月之暗面）以94.3分登顶榜首，DeepSeek V4以93.8分紧随其后。OpenAI的GPT-5排在第三，得分93.5。

前六名依次是：Kimi K2.6（94.3分）、DeepSeek V4（93.8分）、OpenAI GPT-5（93.5分）、Claude 4 Opus（93.1分）、Google Gemini Ultra 3.0（92.7分）、阿里Qwen3-235B（92.4分）。

国产模型在数学推理、长上下文和中文处理方面优势明显。Kimi K2.5在TaxEval v2税务评估准确率达到74.2%，超越OpenAI和Anthropic旗下所有模型。

竞争激烈到什么程度

排名靠前的15个模型在各项基准测试中性能差距只有3个百分点。这意味着什么？意思是大家的水平越来越接近，哪怕一分两分的差距都可能改变排名。

中国AI日均词元调用量已经突破140万亿，较年初增长超过40%。这个数据说明，国产大模型的规模化落地正在加速。不只是榜单上的分数好看，实际使用量也在快速增长。

一个新的趋势：端侧AI

榜单之外，还有一个值得关注的趋势：端侧AI。小米刚开源了MiMo-V2.5，支持手机端本地运行百亿参数大模型。这会降低对云端算力的依赖，也让AI在手机上的应用变得更实用。

端侧AI的好处很明显：响应速度快、不需要一直联网、隐私数据不需要传到云端。当然，手机上的算力有限，能跑的模型大小和复杂度也受限。这是一个平衡。

这意味着什么

国产大模型在这份榜单上的表现，说明一个事实：在AI这个赛道上，中国公司已经不是追赶者，而是竞争者，甚至在某些领域已经是领跑者。

数学推理、长上下文处理、中文理解，这些原本是GPT和Claude的强项，现在国产模型不仅追上来了，还在某些 Benchmark 上超过了他们。这对国内做AI应用的开发者来说，是个好消息——你可以选择一个更懂中文、更便宜、性能还不错的国产模型。

至于端侧AI的兴起，可能会改变未来AI应用的形态。不是所有任务都需要传到云端处理，手机本地能搞定的，就本地搞定。这会催生一批新的应用场景和硬件创新。

📎 原文来源：每日人工智能资讯｜2026年5月大模型排行：Kimi K2.6居首

2026年5月22日
谷歌I/O 2026：Gemini Spark来了，AI智能体时代正式开启

谷歌的AI大跃进

昨天凌晨1点，谷歌I/O大会又在加州山景城拉开帷幕。CEO皮查伊开场就甩出一组数字：过去12个月，谷歌处理的Token量达到3.2千万亿个，同比增长7倍。Gemini应用的月活用户突破9亿。这些数字背后，是谷歌把AI智能体全面塞进所有产品的野心。

这场发布会的核心逻辑很清楚：Gemini不再只是那个你打开对话框才能聊天的助手，它要变成一个持续运行、跨应用执行任务的智能代理。你可以理解为，谷歌想把AI从”工具”升级为”同事”。

Gemini将从一个对话助手进化为持续运行的全天候AI代理，可以替你追踪信息、生成内容、调用工具，甚至直接完成下单和操作流程。

几个值得关注的发布

AskYouTube功能会在YouTube里加入聊天机器人式交互界面。你可以通过自然语言找到符合搜索意图的视频片段，直接跳转过去。这个功能预计今年夏天在美国扩大推广范围。

DocsLive功能支持用户通过语音与Google Docs互动，不需要输入提示词。演示中，Gemini可以自动提取演讲要点，还能从Google Drive和Gmail调取信息，辅助用户高效创建和编辑文档。

Gemini 3.5 Flash模型是这次发布的重头戏。谷歌称其生成速度是其他前沿模型的四倍，专为复杂任务和现实开发场景设计。在AI代理和编码工具领域，这个速度优势会让它更有竞争力。

Gemini Spark是基于Gemini 3.5运行的全天候个人AI助手。即使你的电脑关闭，它也可以继续工作。这是谷歌对OpenAI的ChatGPT和Anthropic的Claude直接发起的挑战。

硬件和基础设施布局

谷歌在AI基础设施上的投入也在加速。2026年，谷歌AI相关支出预计达到1800亿-1900亿美元。最新一代TPU（张量处理单元）TPU8分为两类，分别用于大规模AI训练和快速响应用户请求。

还有AndroidXR智能眼镜，谷歌预告会与GentleMonster、WarbyParker和三星合作推出这款硬件。分为语音交互和信息投影两种形式，用户可以通过眼镜完成导航、下单等操作。

这意味着什么

谷歌这次发布会传递的信号很明确：AI智能体不再是概念，而是要全面落地到每个人的日常工作中。从搜索、文档、视频到购物，谷歌想把AI渗透进你数字生活的每一个角落。

对于用户来说，这意味着更便捷的体验。但对于谷歌的竞争对手来说，这意味着更激烈的竞争。OpenAI、Anthropic、Meta，大家都在抢这个”AI智能体”的入口。2026年的AI赛道，会比去年更精彩。

📎 原文来源：2026年谷歌I/O大会全景解析：AI助手Spark与Gemini 3.5全面升级

2026年5月22日
AI智能体有了”交通规则”：三部门联合发文背后

AI智能体有了”交通规则”：三部门联合发文背后

AI智能体现在有多火？你打开手机，可能已经跟好几个智能体打过交道了——帮你订外卖的、帮你写邮件的、帮你规划路线的。它们不再是聊天框里只会”说话”的AI，而是能真正”干活”的数字员工。但问题也随之而来：谁来规范这些智能体的行为？如果智能体做错了决策，责任算谁的？

三部门同时出手，不是偶然

5月8日，国家网信办、国家发展改革委、工业和信息化部三家一起，联合印发了一份文件——《智能体规范应用与创新发展实施意见》。这份文件的全名听起来很官方，但翻译成人话就是：智能体这个东西，既要让它发展，也要给它立规矩。

为什么是这三家？很好理解。网信办管内容和网络安全，发改委管产业规划和投资，工信部管技术和制造业。智能体这个东西，既涉及内容安全，又涉及产业发展，还涉及技术底座，三家联合出手，说明这件事已经被放到了一个相当重要的位置。

《实施意见》给智能体下了一个明确的定义：具备自主感知、记忆、决策、交互与执行能力的智能系统。它不是”聊天机器人”那么简单，它是能自主行动的AI。

智能体的权限边界，终于有人提了

这份文件里，有一个细节特别值得注意。它要求厘清三类决策的边界：仅限用户本人决策的、需由用户授权决策的、智能体可以自主决策的。这个区分，之前在国内政策文件里很少见到。

举个例子，你让智能体帮你订一张机票，它该不该自己决定买哪一班？如果你事先授权了预算范围和出发时间，它就可以自主决策。但如果你让它不仅订机票，还顺便决定你要不要请年假，这就越界了。文件要做的，就是把这类边界划清楚。

19个场景，智能体要”上岗”了

文件提出了一个具体目标：围绕科学研究、产业发展、提振消费、民生福祉、社会治理这5个方向，推出19个典型应用场景。这意味着，智能体很快就会出现在这些领域里——可能在帮你做科研文献梳理，可能在帮你优化供应链，也可能在帮你处理政务服务。

还有一个量化目标：新一代智能终端、智能体等应用普及率要超过70%。这个数字听起来很激进，但考虑到智能手机普及率早就超过这个数，智能体达到70%渗透率，也许比我们想象的要快。

规范和创新，能不能兼得

这份文件的全名里既有”规范应用”，又有”创新发展”，表面上看起来是两件矛盾的事。但实际上，规范的目的不是为了限制，而是为了让行业走得更稳。你想想，如果智能体出了几次重大安全事故，整个行业都可能被”一刀切”叫停。提前把规矩立好，反而是对创新的保护。

对于做智能体产品的公司来说，这份文件释放了一个明确信号：国家是支持你们干的，但得按规矩来。那些还在灰色地带试探的产品，可能要重新检查一下自己的合规性了。

📎 原文来源：三部门发文规范AI智能体发展规范与创新并举 — 财新网

2026年5月22日
Spotify的AI野心：让你一键生成专属播客

Spotify的AI野心：让你一键生成专属播客

Spotify过去给人的印象，就是一个让你听听音乐、刷刷播客的平台。你消费别人做好的内容，它负责推荐和播放。但这个模式正在发生改变。最近Spotify连着推出了几项AI新功能，核心逻辑只有一个：让你从内容的消费者，变成创作者。

Spotify正在将AI播客生成功能直接集成到应用中

用AI把任意主题变成播客

新功能的核心是”个人播客生成”。你只需要输入一个提示词，或者丢给它一个链接、一份PDF文档、一段文字，AI就能帮你生成一段专属播客音频，存到你的Spotify库里。想每天听一份关于你所在城市的简报，顺带提醒你喜欢的歌手有没有开演唱会？直接说就行。想用5分钟搞懂经济学的基础概念？也可以。

更灵活的是，你还可以挑选音色。AI生成的声音不再是那种千篇一律的”机器人播报感”，而是可以选一个你喜欢的风格。Spotify显然研究过市面上已有的产品——Google的NotebookLM、ElevenLabs的阅读器，还有前NotebookLM开发者做的Huxe——它把这些产品的优点整合到了一起。

不只是手机，还有桌面端

除了在手机应用里生成播客，Spotify还做了一个叫Spotify Labs Studio的桌面端应用。这个应用可以读取你的邮箱和日历，自动生成个性化简报。想象一下，每天早上打开电脑，一段为你定制的播客已经在那里等着你，内容是你今天要参加的会议要点、你关注的行业动态、你可能错过的邮件摘要。这种体验，之前你可能只在科幻电影里见过。

Spotify的野心很明显：它不想只做一个”播放器”，它想成为你获取个性化信息的第一入口。

AI问答上线，播客也能”对话”了

另一个新功能是AI驱动的问答。目前向美国、瑞典和爱尔兰的付费用户开放。你在听播客的时候，碰到不懂的概念，或者想深入了解某个话题，直接问AI就行。它会的不仅仅是”解释一下这段内容”，还能根据你的提问推荐相关播客。这个功能的逻辑，跟谷歌前几天在YouTube上线的Ask YouTube AI搜索很像。

为什么Spotify要急着推这些功能？数据给了它信心。过去一年，在Spotify上收听视频播客的用户数量同比增长了50%。用户已经不满足于”被动收听”，他们想要更多互动、更多个性化。AI问答和AI播客生成，就是为了让用户把更多时间花在Spotify里。

创作者也能赚钱了

Spotify没忘了播客创作者。新推出的创作者赞助工具，可以帮他们管理品牌合作；付费订阅功能则让创作者能靠独家内容赚钱。这个套路，Instagram、Facebook、Snapchat早就跑通了。Spotify只是晚了一步，但赶上了。

回过头看，Spotify这一步走得挺聪明。播客市场已经卷了好几年，单纯靠”更多内容”来拉新，边际效应越来越低。让用户自己能生成内容、让AI帮用户更好地理解内容，这两条路加起来，才是一个平台真正该做的”生态”。唯一的问题是，你会不会真的每天让AI给你生成一段播客？还是说，你更愿意自己动手？答案可能因人而异，但Spotify已经把工具递到了你手里。

📎 原文来源：Spotify adds AI-powered Q&A and briefing generation features to podcasts — TechCrunch

2026年5月22日
阿里千问Qwen3.7-Max发布：从对话模型到工程代理的关键一跃

三个月连更三次，千问在争什么

5月20日，阿里巴巴在杭州发布了千问新一代旗舰模型Qwen3.7-Max。如果只看标题，这像是一次常规的模型迭代——但从最近三个月的节奏来看，千问正在以不太常见的速度连续推出新版本。

3月20日，Qwen3.5-Max-Preview亮相；4月20日，Qwen3.6-Max-Preview发布；5月20日，Qwen3.7-Max正式登场。三个月、三个大版本，这个节奏即便放在全球大模型厂商里也不算慢。背后反映的是一个明确判断：模型竞争的重点正在转移，从”谁的参数大、榜单分数高”，转向”模型能不能真正进入工作流，稳定执行复杂任务”。

Agent能力成了新的主战场

Qwen3.7-Max延续了千问3.x系列的一个明显转向：强化Agent能力。这不是一个抽象的方向——具体体现在编程、长上下文、工具调用、跨框架兼容和长程任务处理这几个维度上。

在第三方机构Arena的全球大模型盲测总榜中，Qwen3.7-Max超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与GPT、Claude、Gemini等国际顶尖模型接近，位列国产模型第一。

Qwen3.7-Max在MCP-Atlas、MCP-Mark、SkillBench等现实能力测试中表现优异，超过GLM-5.1、Kimi-K2.6等模型，创下国产模型新高。

编程智能体能力的提升尤为明显。在SWE-Pro、SWE-Multilingual、Terminal Bench 2.0-Terminus等测评中，Qwen3.7-Max较Qwen3.6-Plus有大幅提升，并超过了DeepSeek-v4-pro-Max、Claude-Opus4.6、Kimi-K2.6等模型。

一次完整的工程任务：35小时、上千次工具调用

阿里内部做了一个挺有说服力的测试：把千问3.7放到一个陌生的新硬件平台上（平头哥真武M890），任务是优化一个生产级注意力内核算子。

模型没有现成的性能profile，没有硬件文档，也没有示例实现——只拿到了任务描述、SGLang+Triton参考代码和评测脚本。在这个环境中，千问3.7连续工作了35小时，执行了数百次内核评估和上千次工具调用，完成了代码编写、编译、性能分析和迭代优化的完整流程。最终，内核速度在参考实现基础上提升了一个数量级。

更值得注意的细节是：在连续运行30小时后，模型仍然能发现新的优化空间。这说明它并不是在完成一次性的指令执行，而是在较长时间内保持了目标感，能根据反馈调整路径。

这个测试背后的意图很明显：当大模型具备较强的推理、编程和工具调用能力，并被放入真实的工程环境中，它有机会承担过去需要专业工程师长时间推进的复杂任务。

阿里的真正优势：场景和基础设施

千问的特殊性在于，阿里拥有大量真实的业务和基础设施场景。芯片（平头哥）、云（阿里云）、数据库、电商、物流、支付、出行、本地生活——这些都可以为Agent提供复杂的任务环境。场景既能测试模型，也能为模型迭代提供反馈数据。

2026年3月，阿里成立了Alibaba Token Hub（ATH），由吴泳铭直接负责。这个调整的背景是：企业使用AI的方式正在变化。过去买的是算力时长，现在消耗的是Token——模型处理任务、生成内容、调用工具、完成工作的能力，最终都会体现在Token使用上。

公开信息显示，阿里AI模型和应用服务ARR已突破80亿元，百炼MaaS开发平台客户数截至2026年3月同比增长8倍，覆盖电商、金融、制造等多个行业。

在这个布局里，Qwen3.7-Max不只是一次模型能力更新，而是阿里把”芯—云—模型—推理”这条链路进一步打通的一个节点。模型越强、推理越快、成本越低，Agent越容易在企业中规模化应用——这个逻辑决定了下一阶段大模型竞争的重心。

📎 原文来源：阿里发布新一代千问旗舰模型Qwen3.7-Max，登顶最佳国产模型 — InfoQ

2026年5月22日
SpaceX IPO招股书曝光：火箭、AI算力与火星殖民的赌局

火箭还能赚钱，但马斯克的棋盘远不止于此

SpaceX终于把IPO招股书摆上了台面。这家24年前由马斯克创立的航空航天公司，计划在纳斯达克上市，股票代码定为”SPCX”。估值1.75万亿美元——如果不是后续马斯克的薪酬包里藏着7.5万亿美元的市值目标，这个数字已经够夸张了。

招股书里写得很直白：SpaceX已经找到了”人类历史上最大的可落地总目标市场”，规模28.5万亿美元，其中22.7万亿归功于AI的”企业应用场景”。这句话基本把底牌亮出来了——火箭是手段，轨道AI算力枢纽才是棋盘。

SpaceX的火箭业务只是开始，AI算力枢纽才是终极目标（图源：Getty Images）

星链养活了现在，星舰押注未来

招股书披露了一些硬数据。星链订阅用户已达1000万，年营收超过110亿美元，占SpaceX总营收的一半以上。但另一边，SpaceX 2025年亏损约49亿美元，成立以来累计亏损已超过370亿美元。

钱主要烧在两个地方：星舰（Starship）和AI。2025年航天业务板块为星舰项目投入30亿美元，2026年第一季度又砸了9.3亿美元。SpaceX的判断是，星舰有望把进入轨道的成本降低99%以上——如果这事成了，轨道AI数据中心、太空制造、月球基地这些现在看起来像科幻的东西，才有规模化的可能。

星舰最早本周将进行第12次试射。SpaceX在招股书中表示，预计2026年下半年开始执行轨道载荷投送任务，如果顺利，同年下半年用星舰发射下一代V2移动卫星，2027年发射月球版星链。

xAI并入之后，AI部门的亏损还在扩大

2025年马斯克把xAI并入了SpaceX，Grok聊天机器人也随之进入上市公司体系。结果不算理想：2025年SpaceX约60%的资本支出投向了AI部门，金额约200亿美元。这块业务去年仍亏损数十亿美元，营收增长约22%，远低于一线AI实验室的公开增速。

但招股书里的叙事是另一套逻辑：轨道AI算力、太空数据中心、月球和火星的制造设施——这些设想被打包成了”28.5万亿美元总目标市场”的一部分。投资者买不买账，取决于信不信这套叙事能在未来十年落地。

马斯克的薪酬包：2万亿美元只是中途站

IPO之后，马斯克将担任SpaceX的CEO、CTO和董事会主席，持有93.6%的B类股（每股10票投票权），掌握85.1%的投票权。IPO后这个比例会下降，但仍将保持在50%以上。

今年年初马斯克获得了一份新的薪酬包：如果SpaceX市值达到7.5万亿美元，并且在火星建立拥有至少100万居民的永久人类殖民地，他将最多获得10亿股B类股。如果公司建成每年可提供”100太瓦计算能力”的太空数据中心，他还能拿到更多股份。

这些目标听起来像在开玩笑，但招股书白纸黑字写着的。这份IPO招股书里既有很具说服力的商业数据（星链1000万用户、110亿美元营收），也有很度超前的设想（星舰地面交通系统、太空旅游、小行星采矿）。市场买不买账，几个月内就能见分晓。

📎 原文来源：The SpaceX IPO filing is filled with AI bets, Starship dreams, and Elon Musk at the center — TechCrunch

2026年5月22日
RAGFlow：基于深度文档理解的开源RAG引擎，让AI精准理解你的文档

## 📖 项目简介

**RAGFlow** 是一款基于**深度文档理解（DeepDoc）**的开源 RAG（检索增强生成）引擎。它能够结合大语言模型（LLM），从各种复杂格式的数据中精准提取知识，为 AI 应用提供可靠的问答能力。无论你是个人开发者还是企业团队，RAGFlow 都能帮你构建专属的知识库问答系统。

**GitHub Star:** 81k+ ⭐
**最新版本:** v0.25.5 (2026年5月)
**开源协议:** Apache-2.0

—

## 🔧 安装要求和过程

### 环境要求

| 环境项 | 最低配置 |
|——–|———-|
| **CPU** | ≥ 4核 |
| **内存** | ≥ 16 GB |
| **磁盘** | ≥ 50 GB |
| **Docker版本** | ≥ 24.0.0 |
| **Docker Compose** | ≥ v2.26.1 |

**⚠️ 重要：** 需确保系统参数 `vm.max_map_count` ≥ 262144

“`bash
# 临时生效
sudo sysctl -w vm.max_map_count=262144

# 永久生效
echo “vm.max_map_count=262144” >> /etc/sysctl.conf
“`

### 快速安装（Docker部署）

**1. 克隆仓库**
“`bash
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
“`

**2. 启动服务（CPU版本）**
“`bash
docker compose -f docker-compose.yml up -d
“`

**3. 访问服务**
服务启动后，浏览器访问 `http://服务器IP地址`（默认端口80）

**4. 配置LLM**
在 `service_conf.yaml.template` 中配置你使用的LLM厂商和对应的API_KEY

**💡 提示：** 如需GPU加速，修改 `.env` 文件设置 `DEVICE=gpu`

—

## ⚡ 核心功能

### 1️⃣ 高质量数据处理
基于**深度文档理解（DeepDoc）**技术，从格式复杂的非结构化数据中提取知识，支持Word、PPT、Excel、TXT、图片、扫描件、网页等多种异构数据源。

### 2️⃣ 智能分块与可视化
提供丰富的模板化分块选项，分块逻辑可解释、可调整。支持分块可视化，允许用户人工干预优化，确保知识切分的精准性。

### 3️⃣ 降低幻觉，可追溯来源
回答附带**可追溯的引用来源**，支持查看关键参考信息。可视化展示文本分块逻辑，大幅提升结果可信度。

### 4️⃣ 自动化RAG工作流
适配个人和大型企业的RAG编排需求，支持自定义配置LLM和嵌入模型，支持多路召回+融合重排，提供直观的API，可无缝集成到业务系统中。

### 5️⃣ Agent能力与生态集成
支持**Agent工作流**、**MCP协议**、**记忆（Memory）功能**。最新版本已支持 DeepSeek v4、Gemini 3 Pro、GPT-5 系列模型，并支持 Confluence、Notion、Discord、Google Drive 等数据源同步。

—

## 🎯 典型使用场景

### 场景1：企业知识库问答
**问题：** 企业内部文档分散，员工查找信息困难
**解决方案：** 使用 RAGFlow 构建统一知识库，上传公司文档、手册、规范，员工通过自然语言提问即可快速获取准确答案，并附带原文引用。

### 场景2：技术文档智能检索
**问题：** 技术文档篇幅长，开发者难以快速定位关键信息
**解决方案：** 将 API 文档、开发手册导入 RAGFlow，结合 LLM 实现智能问答，开发者可以直接询问”如何在XXX中实现YYY功能”，系统会返回精准的代码段和说明。

### 场景3：个人学习笔记管理
**问题：** 学习资料繁多，复习时难以高效检索
**解决方案：** 将课程笔记、论文、书籍导入 RAGFlow，构建个人知识助手，随时提问巩固知识点，实现智能化学习。

—

## 💡 推荐理由

作为一名 AI 开发者和内容创作者，我为什么强烈推荐 RAGFlow？

**1. 真正理解复杂文档**
不同于简单的文本切片，RAGFlow 的**深度文档理解**能力可以识别表格、公式、多栏布局等复杂结构，这在处理技术文档和学术论文时特别有用。

**2. 可视化的分块调试**
很多 RAG 系统的痛点是”黑盒分块”，你不知道文档是怎么被切分的。RAGFlow 提供**分块可视化**，让你可以直观看到知识切分效果，并手动调整，这大大提升了问答质量。

**3. 开源且活跃**
81k+ Star，Apache-2.0 协议，社区非常活跃。相比闭源的商业 RAG 服务，你可以完全掌控数据安全，也能根据需求定制功能。

**4. 完整的 Agent 能力**
最新版本支持 Agent 工作流和记忆功能，不仅能回答问题，还能执行复杂任务，比如”帮我总结本周所有文档的更新内容”。

**5. 部署简单**
一条 `docker compose` 命令就能跑起来，对新手非常友好。同时也支持源码部署，方便深度定制。

—

## 📥 下载地址

– **GitHub 仓库：** https://github.com/infiniflow/ragflow
– **官方网站：** https://ragflow.io
– **云服务入口：** https://cloud.ragflow.io
– **官方文档：** https://ragflow.io/docs/dev/
– **中文文档：** https://ragflow.com.cn/docs
– **Discord 社区：** https://discord.gg/NjYzJD3GM3

—

## 🏷️ 相关标签

`RAG` `RAGFlow` `AI` `LLM` `AI Agent` `开源项目` `知识库` `检索增强生成`

—

**📌 系列文章：** 本文是”GitHub热门AI开源项目介绍”系列的第10期。欢迎关注我的博客，获取更多 AI 开源项目的深度介绍！

2026年5月22日
英伟达最新财报：数据中心营收暴涨92%，AI算力军备竞赛远未结束

英伟达刚交出了一份让整个科技圈屏息的财报：2027财年第一季度，总营收816亿美元，其中数据中心业务752亿美元，同比增长92%。这个数字背后，是全世界对AI算力近乎贪婪的需求。

英伟达AI芯片是这轮AI浪潮的核心基础设施 | 图片来源：The Verge

数字背后的信号

92%的同比增速，放在任何行业都是惊人的数字，但在英伟达身上，这已经变成了某种”常态”。过去两年，每次财报发布，市场都在问同一个问题：这个增速还能维持多久？每次英伟达都用实际行动回答：还能更猛。

这次财报里有个细节值得拎出来说：下一代Vera Rubin AI芯片将在今年第三季度按计划推出。这意味着英伟达的产品迭代节奏没有放慢，它并不打算给竞争对手留喘息的空间。

“Vera Rubin AI芯片将在今年下半年按计划推出，从第三季度开始。”

不是所有人的好消息

财报里也藏着一个不太好的消息：受RAM短缺和价格上涨影响，英伟达的PC销量有所下滑。这说明AI算力扩张的代价正在向消费端传导——内存价格上涨，最终买单的是普通消费者。

更大的背景是，全球各大科技公司正在上演一场前所未有的数据中心军备竞赛。微软、谷歌、亚马逊、Meta，每一家都在疯狂砸钱建数据中心，而每一座新数据中心的心脏，都是英伟达的GPU。这个局面短期内看不到结束的迹象。

竞争者在哪里

AMD在追赶，英特尔在重新布局，谷歌TPU、亚马逊Trainium、微软Maia都在推自己的AI芯片。但现实是，英伟达的护城河不止是芯片性能，更是CUDA生态——全世界绝大多数AI框架和模型，都是围绕CUDA开发的。换芯片意味着重写大量代码，没几家公司真的愿意这么做。

Vera Rubin芯片如果在第三季度如期推出，英伟达的领先优势还会继续扩大。对于AI创业公司和研究者来说，这意味着算力成本可能继续下降——但对英伟达的竞争对手来说，窗口正在快速关闭。

📎 原文来源：Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year (The Verge)

2026年5月22日

博客

发改委出手了：人工智能立法研究启动，”人工智能+”正在加速落地

“人工智能+”已经在路上

已经有落地案例了

接下来还要做什么？

🎯 项目简介

💻 安装要求和过程

环境要求

快速安装

✨ 核心功能

🎨 典型使用场景

场景1：AI辅助代码审查

场景2：学习LLM编程

场景3：团队标准化

💡 推荐理由

📥 下载地址

排行榜出来了

竞争激烈到什么程度

一个新的趋势：端侧AI

这意味着什么

谷歌的AI大跃进

几个值得关注的发布

硬件和基础设施布局

这意味着什么

AI智能体有了”交通规则”：三部门联合发文背后

三部门同时出手，不是偶然

智能体的权限边界，终于有人提了

19个场景，智能体要”上岗”了

规范和创新，能不能兼得

Spotify的AI野心：让你一键生成专属播客

用AI把任意主题变成播客

不只是手机，还有桌面端

AI问答上线，播客也能”对话”了

创作者也能赚钱了

三个月连更三次，千问在争什么

Agent能力成了新的主战场

一次完整的工程任务：35小时、上千次工具调用

阿里的真正优势：场景和基础设施

火箭还能赚钱，但马斯克的棋盘远不止于此

星链养活了现在，星舰押注未来

xAI并入之后，AI部门的亏损还在扩大

马斯克的薪酬包：2万亿美元只是中途站

数字背后的信号

不是所有人的好消息

竞争者在哪里