博客

  • 发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    5月22日,国家发改委召开5月份新闻发布会,新闻发言人李超透露了一个重要信号:官方正在开展人工智能立法研究,要强化安全治理能力建设,让人工智能朝着有益、安全、公平的方向发展。

    这话听起来有点宏观,但实际影响会很深远。想想看,AI现在到处都是,从手机里的语音助手到医院的辅助诊断,从自动驾驶到金融风控,到处都在用。但规则跟不上技术,就会出问题——数据泄露、算法歧视、AI生成内容乱七八糟……所以立法不是”要不要”的问题,是”什么时候出台、怎么制定才合理”的问题。

    “这也是中国人工智能发展的一大突出特征——在保持快速发展的同时,确保自主可控、向善发展、行稳致远,让全体人民共享人工智能发展成果。”

    “人工智能+”已经在路上

    发布会上还介绍了”人工智能+”行动的进展。目前官方已经出台了制造、医疗、能源等十多个行业的专项政策文件,政策体系正在不断完善。

    更有意思的是,国家发改委会同有关部门在制造、医疗、交通等领域布局了一批国家人工智能应用中试基地。这些基地是干嘛的?简单说,就是让AI技术从实验室走到试验场、从工厂走到市场的”中转站”,提供算力、数据、场景这些关键要素支撑,大幅缩短转化周期、降低落地成本。

    国家发改委新闻发布会
    国家发改委5月份新闻发布会现场(图片来源:中国新闻网)

    已经有落地案例了

    举个具体的例子:医疗领域的中试基地孵化出了一款叫“蚂蚁阿福”的AI应用,可以提供就医陪诊、辅助诊断、家医随访等智能服务。这款应用已经在十多个省市的医疗机构落地,让更多居民享受到智能、优质、便利的健康体验。

    你看,AI不是只在大厂实验室里跑模型、刷榜单,它真的在走进医院、走进社区,开始影响普通人的生活。这才是”人工智能+”想要达到的效果。


    接下来还要做什么?

    李超还透露了两个重要计划:

    • 出台配套文件:官方正在谋划出台加快”人工智能+”落地的配套文件,进一步加大要素保障。
    • 打造标杆应用:持续推动央国企开放高价值应用场景,面向各行业领域和各地方打造人工智能标杆应用,加快引导人工智能融入生产、经营、管理等各方面各环节。

    这意味着什么?意味着接下来会有更多实际的应用场景被开放出来,AI技术会更快地渗透到各行各业。对于做AI应用的创业公司来说,这是个好消息——有政策支持、有场景开放、有要素保障,落地会更容易。

    回过头看,人工智能立法研究、”人工智能+”行动、应用中试基地、配套文件……这一套组合拳打下来,中国AI的发展路径已经很清晰了:既要快,也要稳;既要创新,也要安全;既要技术突破,也要普惠共享。

  • andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    🎯 项目简介

    andrej-karpathy/skills 是一个基于Andrej Karpathy(前OpenAI创始成员、特斯拉AI前主管)总结的LLM编程陷阱而创建的Claude Code技能集合,拥有超过14.4万Stars,帮助AI编程助手避免常见错误,提升代码质量。


    💻 安装要求和过程

    环境要求

    • Claude Code 或兼容的AI编程助手
    • 支持技能导入功能

    快速安装

    # 克隆仓库
    git clone https://github.com/multica-ai/andrej-karpathy-skills.git
    
    # 进入目录
    cd andrej-karpathy-skills
    
    # 将 CLAUDE.md 文件复制到你的项目根目录
    # Claude Code 会自动读取该文件作为行为规则

    ✨ 核心功能

    1. 🎯 避免LLM编程陷阱:基于Karpathy总结的常见错误模式,帮助AI生成更可靠的代码
    2. 📝 最佳实践集成:内置经过验证的编程模式和架构决策
    3. 🔧 Claude Code优化:专门为Claude Code调优的技能集合
    4. 🚀 提升代码质量:减少调试时间,提高代码可维护性
    5. 📚 持续更新:跟随LLM能力演进,持续添加新的最佳实践

    🎨 典型使用场景

    场景1:AI辅助代码审查

    在代码审查阶段,让Claude Code加载这些技能,自动识别代码中的潜在问题,如性能陷阱、安全漏洞、反模式等。

    场景2:学习LLM编程

    对于刚开始使用AI辅助编程的开发者,这个项目是一个完美的”避坑指南”,帮助你理解LLM在编程时的常见失误。

    场景3:团队标准化

    在团队中统一配置这些技能,确保所有成员在使用AI编程助手时遵循相同的最佳实践。


    💡 推荐理由

    Andrej Karpathy作为深度学习领域的先驱,其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能,让每个开发者都能受益于顶级专家的见解。

    特别适合:

    • 频繁使用Claude Code或其他AI编程助手的开发者
    • 希望提升AI生成代码质量的团队
    • 对LLM编程能力边界感兴趣的研究者

    这个项目最打动我的是其实用性——不是空洞的理论,而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。


    📥 下载地址


    如果你正在使用Claude Code或其他AI编程助手,强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知!

  • 2026年5月大模型排行:Kimi K2.6登顶,国产模型强势崛起

    排行榜出来了

    CSDN和稀土掘金刚发布了2026年5月AI大模型全景报告,结果有点意思。国产模型Kimi K2.6(月之暗面)以94.3分登顶榜首,DeepSeek V4以93.8分紧随其后。OpenAI的GPT-5排在第三,得分93.5。

    前六名依次是:Kimi K2.6(94.3分)、DeepSeek V4(93.8分)、OpenAI GPT-5(93.5分)、Claude 4 Opus(93.1分)、Google Gemini Ultra 3.0(92.7分)、阿里Qwen3-235B(92.4分)。

    国产模型在数学推理、长上下文和中文处理方面优势明显。Kimi K2.5在TaxEval v2税务评估准确率达到74.2%,超越OpenAI和Anthropic旗下所有模型。

    竞争激烈到什么程度

    排名靠前的15个模型在各项基准测试中性能差距只有3个百分点。这意味着什么?意思是大家的水平越来越接近,哪怕一分两分的差距都可能改变排名。

    中国AI日均词元调用量已经突破140万亿,较年初增长超过40%。这个数据说明,国产大模型的规模化落地正在加速。不只是榜单上的分数好看,实际使用量也在快速增长。

    一个新的趋势:端侧AI

    榜单之外,还有一个值得关注的趋势:端侧AI。小米刚开源了MiMo-V2.5,支持手机端本地运行百亿参数大模型。这会降低对云端算力的依赖,也让AI在手机上的应用变得更实用。

    端侧AI的好处很明显:响应速度快、不需要一直联网、隐私数据不需要传到云端。当然,手机上的算力有限,能跑的模型大小和复杂度也受限。这是一个平衡。


    这意味着什么

    国产大模型在这份榜单上的表现,说明一个事实:在AI这个赛道上,中国公司已经不是追赶者,而是竞争者,甚至在某些领域已经是领跑者。

    数学推理、长上下文处理、中文理解,这些原本是GPT和Claude的强项,现在国产模型不仅追上来了,还在某些 Benchmark 上超过了他们。这对国内做AI应用的开发者来说,是个好消息——你可以选择一个更懂中文、更便宜、性能还不错的国产模型。

    至于端侧AI的兴起,可能会改变未来AI应用的形态。不是所有任务都需要传到云端处理,手机本地能搞定的,就本地搞定。这会催生一批新的应用场景和硬件创新。

  • 谷歌I/O 2026:Gemini Spark来了,AI智能体时代正式开启

    谷歌的AI大跃进

    昨天凌晨1点,谷歌I/O大会又在加州山景城拉开帷幕。CEO皮查伊开场就甩出一组数字:过去12个月,谷歌处理的Token量达到3.2千万亿个,同比增长7倍。Gemini应用的月活用户突破9亿。这些数字背后,是谷歌把AI智能体全面塞进所有产品的野心。

    这场发布会的核心逻辑很清楚:Gemini不再只是那个你打开对话框才能聊天的助手,它要变成一个持续运行、跨应用执行任务的智能代理。你可以理解为,谷歌想把AI从”工具”升级为”同事”。

    Gemini将从一个对话助手进化为持续运行的全天候AI代理,可以替你追踪信息、生成内容、调用工具,甚至直接完成下单和操作流程。

    几个值得关注的发布

    AskYouTube功能会在YouTube里加入聊天机器人式交互界面。你可以通过自然语言找到符合搜索意图的视频片段,直接跳转过去。这个功能预计今年夏天在美国扩大推广范围。

    DocsLive功能支持用户通过语音与Google Docs互动,不需要输入提示词。演示中,Gemini可以自动提取演讲要点,还能从Google Drive和Gmail调取信息,辅助用户高效创建和编辑文档。

    Gemini 3.5 Flash模型是这次发布的重头戏。谷歌称其生成速度是其他前沿模型的四倍,专为复杂任务和现实开发场景设计。在AI代理和编码工具领域,这个速度优势会让它更有竞争力。

    Gemini Spark是基于Gemini 3.5运行的全天候个人AI助手。即使你的电脑关闭,它也可以继续工作。这是谷歌对OpenAI的ChatGPT和Anthropic的Claude直接发起的挑战。


    硬件和基础设施布局

    谷歌在AI基础设施上的投入也在加速。2026年,谷歌AI相关支出预计达到1800亿-1900亿美元。最新一代TPU(张量处理单元)TPU8分为两类,分别用于大规模AI训练和快速响应用户请求。

    还有AndroidXR智能眼镜,谷歌预告会与GentleMonster、WarbyParker和三星合作推出这款硬件。分为语音交互和信息投影两种形式,用户可以通过眼镜完成导航、下单等操作。

    这意味着什么

    谷歌这次发布会传递的信号很明确:AI智能体不再是概念,而是要全面落地到每个人的日常工作中。从搜索、文档、视频到购物,谷歌想把AI渗透进你数字生活的每一个角落。

    对于用户来说,这意味着更便捷的体验。但对于谷歌的竞争对手来说,这意味着更激烈的竞争。OpenAI、Anthropic、Meta,大家都在抢这个”AI智能体”的入口。2026年的AI赛道,会比去年更精彩。

  • AI智能体有了”交通规则”:三部门联合发文背后

    AI智能体有了”交通规则”:三部门联合发文背后

    AI智能体现在有多火?你打开手机,可能已经跟好几个智能体打过交道了——帮你订外卖的、帮你写邮件的、帮你规划路线的。它们不再是聊天框里只会”说话”的AI,而是能真正”干活”的数字员工。但问题也随之而来:谁来规范这些智能体的行为?如果智能体做错了决策,责任算谁的?

    三部门同时出手,不是偶然

    5月8日,国家网信办、国家发展改革委、工业和信息化部三家一起,联合印发了一份文件——《智能体规范应用与创新发展实施意见》。这份文件的全名听起来很官方,但翻译成人话就是:智能体这个东西,既要让它发展,也要给它立规矩。

    为什么是这三家?很好理解。网信办管内容和网络安全,发改委管产业规划和投资,工信部管技术和制造业。智能体这个东西,既涉及内容安全,又涉及产业发展,还涉及技术底座,三家联合出手,说明这件事已经被放到了一个相当重要的位置。

    《实施意见》给智能体下了一个明确的定义:具备自主感知、记忆、决策、交互与执行能力的智能系统。它不是”聊天机器人”那么简单,它是能自主行动的AI。

    智能体的权限边界,终于有人提了

    这份文件里,有一个细节特别值得注意。它要求厘清三类决策的边界:仅限用户本人决策的、需由用户授权决策的、智能体可以自主决策的。这个区分,之前在国内政策文件里很少见到。

    举个例子,你让智能体帮你订一张机票,它该不该自己决定买哪一班?如果你事先授权了预算范围和出发时间,它就可以自主决策。但如果你让它不仅订机票,还顺便决定你要不要请年假,这就越界了。文件要做的,就是把这类边界划清楚。

    19个场景,智能体要”上岗”了

    文件提出了一个具体目标:围绕科学研究、产业发展、提振消费、民生福祉、社会治理这5个方向,推出19个典型应用场景。这意味着,智能体很快就会出现在这些领域里——可能在帮你做科研文献梳理,可能在帮你优化供应链,也可能在帮你处理政务服务。

    还有一个量化目标:新一代智能终端、智能体等应用普及率要超过70%。这个数字听起来很激进,但考虑到智能手机普及率早就超过这个数,智能体达到70%渗透率,也许比我们想象的要快。


    规范和创新,能不能兼得

    这份文件的全名里既有”规范应用”,又有”创新发展”,表面上看起来是两件矛盾的事。但实际上,规范的目的不是为了限制,而是为了让行业走得更稳。你想想,如果智能体出了几次重大安全事故,整个行业都可能被”一刀切”叫停。提前把规矩立好,反而是对创新的保护。

    对于做智能体产品的公司来说,这份文件释放了一个明确信号:国家是支持你们干的,但得按规矩来。那些还在灰色地带试探的产品,可能要重新检查一下自己的合规性了。

  • Spotify的AI野心:让你一键生成专属播客

    Spotify的AI野心:让你一键生成专属播客

    Spotify过去给人的印象,就是一个让你听听音乐、刷刷播客的平台。你消费别人做好的内容,它负责推荐和播放。但这个模式正在发生改变。最近Spotify连着推出了几项AI新功能,核心逻辑只有一个:让你从内容的消费者,变成创作者。

    Spotify AI播客功能界面
    Spotify正在将AI播客生成功能直接集成到应用中

    用AI把任意主题变成播客

    新功能的核心是”个人播客生成”。你只需要输入一个提示词,或者丢给它一个链接、一份PDF文档、一段文字,AI就能帮你生成一段专属播客音频,存到你的Spotify库里。想每天听一份关于你所在城市的简报,顺带提醒你喜欢的歌手有没有开演唱会?直接说就行。想用5分钟搞懂经济学的基础概念?也可以。

    更灵活的是,你还可以挑选音色。AI生成的声音不再是那种千篇一律的”机器人播报感”,而是可以选一个你喜欢的风格。Spotify显然研究过市面上已有的产品——Google的NotebookLM、ElevenLabs的阅读器,还有前NotebookLM开发者做的Huxe——它把这些产品的优点整合到了一起。

    不只是手机,还有桌面端

    除了在手机应用里生成播客,Spotify还做了一个叫Spotify Labs Studio的桌面端应用。这个应用可以读取你的邮箱和日历,自动生成个性化简报。想象一下,每天早上打开电脑,一段为你定制的播客已经在那里等着你,内容是你今天要参加的会议要点、你关注的行业动态、你可能错过的邮件摘要。这种体验,之前你可能只在科幻电影里见过。

    Spotify的野心很明显:它不想只做一个”播放器”,它想成为你获取个性化信息的第一入口。

    AI问答上线,播客也能”对话”了

    另一个新功能是AI驱动的问答。目前向美国、瑞典和爱尔兰的付费用户开放。你在听播客的时候,碰到不懂的概念,或者想深入了解某个话题,直接问AI就行。它会的不仅仅是”解释一下这段内容”,还能根据你的提问推荐相关播客。这个功能的逻辑,跟谷歌前几天在YouTube上线的Ask YouTube AI搜索很像。

    为什么Spotify要急着推这些功能?数据给了它信心。过去一年,在Spotify上收听视频播客的用户数量同比增长了50%。用户已经不满足于”被动收听”,他们想要更多互动、更多个性化。AI问答和AI播客生成,就是为了让用户把更多时间花在Spotify里。

    创作者也能赚钱了

    Spotify没忘了播客创作者。新推出的创作者赞助工具,可以帮他们管理品牌合作;付费订阅功能则让创作者能靠独家内容赚钱。这个套路,Instagram、Facebook、Snapchat早就跑通了。Spotify只是晚了一步,但赶上了。


    回过头看,Spotify这一步走得挺聪明。播客市场已经卷了好几年,单纯靠”更多内容”来拉新,边际效应越来越低。让用户自己能生成内容、让AI帮用户更好地理解内容,这两条路加起来,才是一个平台真正该做的”生态”。唯一的问题是,你会不会真的每天让AI给你生成一段播客?还是说,你更愿意自己动手?答案可能因人而异,但Spotify已经把工具递到了你手里。

  • 阿里千问Qwen3.7-Max发布:从对话模型到工程代理的关键一跃

    三个月连更三次,千问在争什么

    5月20日,阿里巴巴在杭州发布了千问新一代旗舰模型Qwen3.7-Max。如果只看标题,这像是一次常规的模型迭代——但从最近三个月的节奏来看,千问正在以不太常见的速度连续推出新版本。

    3月20日,Qwen3.5-Max-Preview亮相;4月20日,Qwen3.6-Max-Preview发布;5月20日,Qwen3.7-Max正式登场。三个月、三个大版本,这个节奏即便放在全球大模型厂商里也不算慢。背后反映的是一个明确判断:模型竞争的重点正在转移,从”谁的参数大、榜单分数高”,转向”模型能不能真正进入工作流,稳定执行复杂任务”。

    Agent能力成了新的主战场

    Qwen3.7-Max延续了千问3.x系列的一个明显转向:强化Agent能力。这不是一个抽象的方向——具体体现在编程、长上下文、工具调用、跨框架兼容和长程任务处理这几个维度上。

    在第三方机构Arena的全球大模型盲测总榜中,Qwen3.7-Max超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini等国际顶尖模型接近,位列国产模型第一。

    Qwen3.7-Max在MCP-Atlas、MCP-Mark、SkillBench等现实能力测试中表现优异,超过GLM-5.1、Kimi-K2.6等模型,创下国产模型新高。

    编程智能体能力的提升尤为明显。在SWE-Pro、SWE-Multilingual、Terminal Bench 2.0-Terminus等测评中,Qwen3.7-Max较Qwen3.6-Plus有大幅提升,并超过了DeepSeek-v4-pro-Max、Claude-Opus4.6、Kimi-K2.6等模型。

    一次完整的工程任务:35小时、上千次工具调用

    阿里内部做了一个挺有说服力的测试:把千问3.7放到一个陌生的新硬件平台上(平头哥真武M890),任务是优化一个生产级注意力内核算子。

    模型没有现成的性能profile,没有硬件文档,也没有示例实现——只拿到了任务描述、SGLang+Triton参考代码和评测脚本。在这个环境中,千问3.7连续工作了35小时,执行了数百次内核评估和上千次工具调用,完成了代码编写、编译、性能分析和迭代优化的完整流程。最终,内核速度在参考实现基础上提升了一个数量级。

    更值得注意的细节是:在连续运行30小时后,模型仍然能发现新的优化空间。这说明它并不是在完成一次性的指令执行,而是在较长时间内保持了目标感,能根据反馈调整路径。

    这个测试背后的意图很明显:当大模型具备较强的推理、编程和工具调用能力,并被放入真实的工程环境中,它有机会承担过去需要专业工程师长时间推进的复杂任务。

    阿里的真正优势:场景和基础设施

    千问的特殊性在于,阿里拥有大量真实的业务和基础设施场景。芯片(平头哥)、云(阿里云)、数据库、电商、物流、支付、出行、本地生活——这些都可以为Agent提供复杂的任务环境。场景既能测试模型,也能为模型迭代提供反馈数据。

    2026年3月,阿里成立了Alibaba Token Hub(ATH),由吴泳铭直接负责。这个调整的背景是:企业使用AI的方式正在变化。过去买的是算力时长,现在消耗的是Token——模型处理任务、生成内容、调用工具、完成工作的能力,最终都会体现在Token使用上。

    公开信息显示,阿里AI模型和应用服务ARR已突破80亿元,百炼MaaS开发平台客户数截至2026年3月同比增长8倍,覆盖电商、金融、制造等多个行业。

    在这个布局里,Qwen3.7-Max不只是一次模型能力更新,而是阿里把”芯—云—模型—推理”这条链路进一步打通的一个节点。模型越强、推理越快、成本越低,Agent越容易在企业中规模化应用——这个逻辑决定了下一阶段大模型竞争的重心。


  • SpaceX IPO招股书曝光:火箭、AI算力与火星殖民的赌局

    火箭还能赚钱,但马斯克的棋盘远不止于此

    SpaceX终于把IPO招股书摆上了台面。这家24年前由马斯克创立的航空航天公司,计划在纳斯达克上市,股票代码定为”SPCX”。估值1.75万亿美元——如果不是后续马斯克的薪酬包里藏着7.5万亿美元的市值目标,这个数字已经够夸张了。

    招股书里写得很直白:SpaceX已经找到了”人类历史上最大的可落地总目标市场”,规模28.5万亿美元,其中22.7万亿归功于AI的”企业应用场景”。这句话基本把底牌亮出来了——火箭是手段,轨道AI算力枢纽才是棋盘。

    SpaceX火箭发射
    SpaceX的火箭业务只是开始,AI算力枢纽才是终极目标(图源:Getty Images)

    星链养活了现在,星舰押注未来

    招股书披露了一些硬数据。星链订阅用户已达1000万,年营收超过110亿美元,占SpaceX总营收的一半以上。但另一边,SpaceX 2025年亏损约49亿美元,成立以来累计亏损已超过370亿美元。

    钱主要烧在两个地方:星舰(Starship)和AI。2025年航天业务板块为星舰项目投入30亿美元,2026年第一季度又砸了9.3亿美元。SpaceX的判断是,星舰有望把进入轨道的成本降低99%以上——如果这事成了,轨道AI数据中心、太空制造、月球基地这些现在看起来像科幻的东西,才有规模化的可能。

    星舰最早本周将进行第12次试射。SpaceX在招股书中表示,预计2026年下半年开始执行轨道载荷投送任务,如果顺利,同年下半年用星舰发射下一代V2移动卫星,2027年发射月球版星链。

    xAI并入之后,AI部门的亏损还在扩大

    2025年马斯克把xAI并入了SpaceX,Grok聊天机器人也随之进入上市公司体系。结果不算理想:2025年SpaceX约60%的资本支出投向了AI部门,金额约200亿美元。这块业务去年仍亏损数十亿美元,营收增长约22%,远低于一线AI实验室的公开增速。

    但招股书里的叙事是另一套逻辑:轨道AI算力、太空数据中心、月球和火星的制造设施——这些设想被打包成了”28.5万亿美元总目标市场”的一部分。投资者买不买账,取决于信不信这套叙事能在未来十年落地。

    马斯克的薪酬包:2万亿美元只是中途站

    IPO之后,马斯克将担任SpaceX的CEO、CTO和董事会主席,持有93.6%的B类股(每股10票投票权),掌握85.1%的投票权。IPO后这个比例会下降,但仍将保持在50%以上。

    今年年初马斯克获得了一份新的薪酬包:如果SpaceX市值达到7.5万亿美元,并且在火星建立拥有至少100万居民的永久人类殖民地,他将最多获得10亿股B类股。如果公司建成每年可提供”100太瓦计算能力”的太空数据中心,他还能拿到更多股份。

    这些目标听起来像在开玩笑,但招股书白纸黑字写着的。这份IPO招股书里既有很具说服力的商业数据(星链1000万用户、110亿美元营收),也有很度超前的设想(星舰地面交通系统、太空旅游、小行星采矿)。市场买不买账,几个月内就能见分晓。


  • RAGFlow:基于深度文档理解的开源RAG引擎,让AI精准理解你的文档

    RAGFlow Logo

    ## 📖 项目简介

    **RAGFlow** 是一款基于**深度文档理解(DeepDoc)**的开源 RAG(检索增强生成)引擎。它能够结合大语言模型(LLM),从各种复杂格式的数据中精准提取知识,为 AI 应用提供可靠的问答能力。无论你是个人开发者还是企业团队,RAGFlow 都能帮你构建专属的知识库问答系统。

    **GitHub Star:** 81k+ ⭐
    **最新版本:** v0.25.5 (2026年5月)
    **开源协议:** Apache-2.0

    ## 🔧 安装要求和过程

    ### 环境要求

    | 环境项 | 最低配置 |
    |——–|———-|
    | **CPU** | ≥ 4核 |
    | **内存** | ≥ 16 GB |
    | **磁盘** | ≥ 50 GB |
    | **Docker版本** | ≥ 24.0.0 |
    | **Docker Compose** | ≥ v2.26.1 |

    **⚠️ 重要:** 需确保系统参数 `vm.max_map_count` ≥ 262144

    “`bash
    # 临时生效
    sudo sysctl -w vm.max_map_count=262144

    # 永久生效
    echo “vm.max_map_count=262144” >> /etc/sysctl.conf
    “`

    ### 快速安装(Docker部署)

    **1. 克隆仓库**
    “`bash
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/docker
    “`

    **2. 启动服务(CPU版本)**
    “`bash
    docker compose -f docker-compose.yml up -d
    “`

    **3. 访问服务**
    服务启动后,浏览器访问 `http://服务器IP地址`(默认端口80)

    **4. 配置LLM**
    在 `service_conf.yaml.template` 中配置你使用的LLM厂商和对应的API_KEY

    **💡 提示:** 如需GPU加速,修改 `.env` 文件设置 `DEVICE=gpu`

    ## ⚡ 核心功能

    ### 1️⃣ 高质量数据处理
    基于**深度文档理解(DeepDoc)**技术,从格式复杂的非结构化数据中提取知识,支持Word、PPT、Excel、TXT、图片、扫描件、网页等多种异构数据源。

    ### 2️⃣ 智能分块与可视化
    提供丰富的模板化分块选项,分块逻辑可解释、可调整。支持分块可视化,允许用户人工干预优化,确保知识切分的精准性。

    ### 3️⃣ 降低幻觉,可追溯来源
    回答附带**可追溯的引用来源**,支持查看关键参考信息。可视化展示文本分块逻辑,大幅提升结果可信度。

    ### 4️⃣ 自动化RAG工作流
    适配个人和大型企业的RAG编排需求,支持自定义配置LLM和嵌入模型,支持多路召回+融合重排,提供直观的API,可无缝集成到业务系统中。

    ### 5️⃣ Agent能力与生态集成
    支持**Agent工作流**、**MCP协议**、**记忆(Memory)功能**。最新版本已支持 DeepSeek v4、Gemini 3 Pro、GPT-5 系列模型,并支持 Confluence、Notion、Discord、Google Drive 等数据源同步。

    ## 🎯 典型使用场景

    ### 场景1:企业知识库问答
    **问题:** 企业内部文档分散,员工查找信息困难
    **解决方案:** 使用 RAGFlow 构建统一知识库,上传公司文档、手册、规范,员工通过自然语言提问即可快速获取准确答案,并附带原文引用。

    ### 场景2:技术文档智能检索
    **问题:** 技术文档篇幅长,开发者难以快速定位关键信息
    **解决方案:** 将 API 文档、开发手册导入 RAGFlow,结合 LLM 实现智能问答,开发者可以直接询问”如何在XXX中实现YYY功能”,系统会返回精准的代码段和说明。

    ### 场景3:个人学习笔记管理
    **问题:** 学习资料繁多,复习时难以高效检索
    **解决方案:** 将课程笔记、论文、书籍导入 RAGFlow,构建个人知识助手,随时提问巩固知识点,实现智能化学习。

    ## 💡 推荐理由

    作为一名 AI 开发者和内容创作者,我为什么强烈推荐 RAGFlow?

    **1. 真正理解复杂文档**
    不同于简单的文本切片,RAGFlow 的**深度文档理解**能力可以识别表格、公式、多栏布局等复杂结构,这在处理技术文档和学术论文时特别有用。

    **2. 可视化的分块调试**
    很多 RAG 系统的痛点是”黑盒分块”,你不知道文档是怎么被切分的。RAGFlow 提供**分块可视化**,让你可以直观看到知识切分效果,并手动调整,这大大提升了问答质量。

    **3. 开源且活跃**
    81k+ Star,Apache-2.0 协议,社区非常活跃。相比闭源的商业 RAG 服务,你可以完全掌控数据安全,也能根据需求定制功能。

    **4. 完整的 Agent 能力**
    最新版本支持 Agent 工作流和记忆功能,不仅能回答问题,还能执行复杂任务,比如”帮我总结本周所有文档的更新内容”。

    **5. 部署简单**
    一条 `docker compose` 命令就能跑起来,对新手非常友好。同时也支持源码部署,方便深度定制。

    ## 📥 下载地址

    – **GitHub 仓库:** https://github.com/infiniflow/ragflow
    – **官方网站:** https://ragflow.io
    – **云服务入口:** https://cloud.ragflow.io
    – **官方文档:** https://ragflow.io/docs/dev/
    – **中文文档:** https://ragflow.com.cn/docs
    – **Discord 社区:** https://discord.gg/NjYzJD3GM3

    ## 🏷️ 相关标签

    `RAG` `RAGFlow` `AI` `LLM` `AI Agent` `开源项目` `知识库` `检索增强生成`

    **📌 系列文章:** 本文是”GitHub热门AI开源项目介绍”系列的第10期。欢迎关注我的博客,获取更多 AI 开源项目的深度介绍!

  • 英伟达最新财报:数据中心营收暴涨92%,AI算力军备竞赛远未结束

    英伟达刚交出了一份让整个科技圈屏息的财报:2027财年第一季度,总营收816亿美元,其中数据中心业务752亿美元,同比增长92%。这个数字背后,是全世界对AI算力近乎贪婪的需求。

    Nvidia AI芯片
    英伟达AI芯片是这轮AI浪潮的核心基础设施 | 图片来源:The Verge

    数字背后的信号

    92%的同比增速,放在任何行业都是惊人的数字,但在英伟达身上,这已经变成了某种”常态”。过去两年,每次财报发布,市场都在问同一个问题:这个增速还能维持多久?每次英伟达都用实际行动回答:还能更猛。

    这次财报里有个细节值得拎出来说: 下一代Vera Rubin AI芯片将在今年第三季度按计划推出。这意味着英伟达的产品迭代节奏没有放慢,它并不打算给竞争对手留喘息的空间。

    “Vera Rubin AI芯片将在今年下半年按计划推出,从第三季度开始。”

    不是所有人的好消息

    财报里也藏着一个不太好的消息:受RAM短缺和价格上涨影响,英伟达的PC销量有所下滑。这说明AI算力扩张的代价正在向消费端传导——内存价格上涨,最终买单的是普通消费者。

    更大的背景是,全球各大科技公司正在上演一场前所未有的数据中心军备竞赛。微软、谷歌、亚马逊、Meta,每一家都在疯狂砸钱建数据中心,而每一座新数据中心的心脏,都是英伟达的GPU。这个局面短期内看不到结束的迹象。

    竞争者在哪里

    AMD在追赶,英特尔在重新布局,谷歌TPU、亚马逊Trainium、微软Maia都在推自己的AI芯片。但现实是,英伟达的护城河不止是芯片性能,更是CUDA生态——全世界绝大多数AI框架和模型,都是围绕CUDA开发的。换芯片意味着重写大量代码,没几家公司真的愿意这么做。

    Vera Rubin芯片如果在第三季度如期推出,英伟达的领先优势还会继续扩大。对于AI创业公司和研究者来说,这意味着算力成本可能继续下降——但对英伟达的竞争对手来说,窗口正在快速关闭。