标签: 人工智能

  • LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    🔄

    LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    GitHub 热门 AI 开源项目系列 · 第27期

    📦 项目简介

    LangGraph 是 LangChain 官方出品的 Agent 编排框架,专门用于构建、管理和可视化复杂的 AI Agent 工作流。它基于图结构(Graph)设计,让开发者能够以声明式方式定义 Agent 之间的交互逻辑,支持循环、条件分支、状态管理等复杂场景。无论是构建多步骤推理链、人机协作流程,还是复杂的多 Agent 协作系统,LangGraph 都能提供清晰的可编程抽象。

    LangGraph 架构示意图

    LangGraph 基于图结构的 Agent 编排架构

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.9+
    • pip 包管理器
    • ✅ (可选)LangSmith 账号用于可视化调试

    快速安装

    Bash
    # 安装LangGraph核心库
    pip install langgraph
    
    # 安装LangChain和LLM支持(以OpenAI为例)
    pip install langchain-openai
    
    # 可选:安装LangSmith用于可视化调试
    pip install langsmith
    
    # 设置环境变量
    export OPENAI_API_KEY="your-api-key"
    export LANGCHAIN_TRACING_V2="true"  # 启用LangSmith追踪
    export LANGCHAIN_API_KEY="your-langsmith-api-key"

    验证安装

    Python
    import langgraph
    print(f"LangGraph version: {langgraph.__version__}")

    🎯 核心功能

    🔄 图结构编排

    基于有向图(Directed Graph)定义 Agent 工作流,支持节点(Node)和边(Edge)的灵活配置。可以轻松实现顺序执行、条件分支、循环等复杂逻辑,让 Agent 工作流程清晰可控。

    💾 状态管理

    内置强大的状态管理机制,支持在图执行过程中持久化、传递和更新状态。每个节点的输入输出都明确定义,避免了传统链式调用中的状态混乱问题,方便调试和测试。

    🔄 循环与人工干预

    原生支持循环(Loops)和人工干预(Human-in-the-Loop)场景。可以在图中定义循环逻辑,让 Agent 根据中间结果动态调整执行路径;也支持在关键节点暂停,等待人工审核后再继续。

    📊 可视化调试

    与 LangSmith 深度集成,提供工作流的实时可视化调试功能。可以查看每个节点的输入/输出、状态变化、执行时间等详细信息,快速定位问题。支持本地调试和云端追踪两种模式。

    🚀 生产级部署

    提供 LangGraph Cloud 服务,支持一键部署 Agent 工作流到生产环境。内置版本管理、并发控制、错误恢复、日志监控等企业级特性,让原型快速走向生产。

    💡 典型使用场景

    📰 场景1:多步骤研究报告生成

    构建一个自动化研究报告生成系统:首先用搜索 Agent 从多个来源收集信息,然后用摘要 Agent 提取关键信息,接着用分析 Agent 生成洞察,最后用写作 Agent 生成结构化报告。LangGraph 可以清晰定义每个步骤的依赖关系和数据处理逻辑。

    Workflow

    搜索 Agent → 摘要 Agent → 分析 Agent → 写作 Agent → 人工审核 → 发布

    🤖 场景2:多Agent协作客服系统

    构建一个智能客服系统:意图识别 Agent 分析用户问题,然后根据问题类型路由到专门的知识库 Agent、订单查询 Agent 或退款处理 Agent。如果遇到复杂问题,系统自动升级到人工客服,并在人工处理完后继续自动跟进。

    Workflow

    意图识别 → 路由分发 → 专业Agent处理 → 人工介入(可选) → 结果反馈

    🔄 场景3:代码审查与重构助手

    构建一个代码审查助手:静态分析 Agent 检查代码质量和潜在bug,安全扫描 Agent 识别安全漏洞,性能分析 Agent 发现性能瓶颈,然后综合 Agent 生成审查报告和改进建议。支持循环迭代,直到代码质量达标。

    Workflow

    代码输入 → 多Agent分析 → 综合报告 → 人工确认 → 重构建议 → 循环优化

    🌟 推荐理由

    作为一名经常构建 AI Agent 系统的开发者,我对 LangGraph 的推荐理由如下:

    1️⃣ 可视化让复杂逻辑变得清晰

    传统的 Agent 开发往往依赖复杂的链式调用,逻辑隐藏在代码细节中,难以理解和维护。LangGraph 的图结构让整个工作流一目了然,节点和边的定义清晰明确,方便团队协作和代码审查。

    2️⃣ 状态管理避免了”意大利面条式”代码

    在复杂 Agent 系统中,状态传递往往是最容易出错的地方。LangGraph 内置的状态管理机制,让每个节点的输入输出都有明确定义,避免了全局变量和隐式状态修改,代码质量显著提升。

    3️⃣ 与LangChain生态深度集成

    如果你已经在使用 LangChain,那么 LangGraph 是天然的选择。它可以无缝集成 LangChain 的所有组件(LLM、Prompt Template、Memory、Tools等),复用现有代码,降低学习成本。

    4️⃣ 生产级特性让部署不再头疼

    很多 AI 项目死在从原型到生产的路上。LangGraph Cloud 提供了版本管理、并发控制、错误恢复、日志监控等生产级特性,让 Agent 系统的部署和运行变得可靠和可控。

    LangGraph 让复杂的 AI Agent 工作流变得清晰可控。如果你正在构建多步骤、多Agent的AI系统,或者需要可视化调试和状态管理,LangGraph 绝对值得一试!

    希望这个开源项目能帮助你在 AI Agent 开发的道路上走得更远 🚀


    📌 GitHub 热门 AI 开源项目系列 · 持续更新中

    本文由 WorkBuddy AI 自动采集撰写 · 源码见 GitHub

  • MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司

    MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司





    🤖 MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司

    MetaGPT Logo

    📋 项目简介

    MetaGPT 是一个多智能体协作框架,核心理念是 Code = SOP(Team)——把标准化作业流程(SOP)具象化,应用于由大语言模型(LLM)构成的团队。它模拟真实软件公司的组织架构与工作流程,让多个AI智能体扮演产品经理、架构师、工程师、测试员等角色,协同完成复杂任务。

    简单来说:你给它一句话需求,它能自动输出用户故事、竞品分析、需求文档、数据结构设计、API文档、相关代码文件等完整交付物——就像一家全自动化的软件公司。

    🌐 官方资源:
    • GitHub:https://github.com/FoundationAgents/MetaGPT
    • 文档:https://docs.deepwisdom.ai/
    • Stars:68.2k+(持续增长中)

    ⚙️ 安装要求和过程

    环境要求

    # Python 3.9+ 必需
    # 建议使用 Conda 或 venv 创建独立环境
    # 需要有效的大模型API密钥(OpenAI / Azure / 其他支持LLM)

    快速安装步骤

    # 方法一:pip安装(稳定版)
    pip install metagpt
    
    # 方法二:从源码安装(最新功能)
    git clone https://github.com/geekan/MetaGPT.git
    cd MetaGPT
    pip install -e .
    
    # 配置API密钥
    # 复制配置模板
    cp config/config2.yaml config/key.yaml
    # 编辑 key.yaml,填入你的 LLM API 密钥

    验证安装

    # 运行示例:构建一款Flappy Bird游戏
    metagpt "Design a Flappy Bird game"

    ✨ 核心功能

    1. 需求到交付的全流程自动化

    输入一句话的老板需求,MetaGPT 自动完成:需求分析 → 竞品调研 → 用户故事 → 架构设计 → 代码实现 → 测试用例。全程无需人工干预,每个环节都有对应角色的智能体负责。

    2. SOP驱动的多角色协作

    这是 MetaGPT 的独门绝技。SOP(Standardized Operating Procedures) 被编码到提示词序列中,让每个智能体都具备类人的领域专业知识和标准化的协作流程。产品经理写PRD、架构师出设计方案、工程师写代码——各司其职,有序协作。

    3. 可扩展的多智能体框架

    不局限于软件公司场景。你可以基于 MetaGPT 框架自定义搭建各类多智能体应用:数据分析、内容创作、科研助手、游戏NPC……框架层提供通信、记忆、工具调用等基础能力,你只需定义角色和SOP。

    4. 丰富的内置示例场景

    官方提供了大量可直接运行的示例,覆盖:单智能体(数据分析、OCR识别、邮件回复、图像去背景)和多智能体(辩论、狼人杀、Minecraft自动化、斯坦福小镇模拟)两大类别。

    🚀 典型使用场景

    场景一:老板的一句话,变成可运行的软件

    你对着 MetaGPT 说:”帮我做一个类似Trello的任务管理工具,支持拖拽排序和实时协作。” —— 几分钟后,你将获得:需求文档、技术架构图、数据库设计、API接口文档、前端代码、后端代码、单元测试用例。当然,代码质量取决于底层模型的能力,但框架保证了”软件公司流水线”的完整运转。

    场景二:多智能体科研/创作助手

    MetaGPT 的多智能体机制不仅限于写代码。你可以设计一个”科研助手”团队:一个智能体负责文献检索,一个负责提炼核心观点,一个负责撰写综述,一个负责格式校对。相比单一AI对话,这种方式更接近于真实的团队协作,产出质量通常更高。

    场景三:教学/研究多智能体机制

    MetaGPT 本身就是多智能体研究的优秀案例。学术界用它来验证 SOP 编码、角色分工、通信协议等设计理念。如果你在研究或学习多智能体系统,MetaGPT 的源码和论文都是极佳的参考资料。

    💡 推荐理由

    🎯 为什么值得关注?

    1. 理念先进,不只是”多个ChatGPT并联”
    很多多智能体框架只是把多次LLM调用串起来,MetaGPT 的核心贡献在于把 SOP 编码进 prompt 序列,让智能体的协作有章可循,而不是自由发挥。这是从”对话式AI”走向”流程化AI”的关键一步。

    2. 软件公司隐喻非常直观
    用”产品经理 → 架构师 → 工程师 → 测试”的流程来组织智能体,降低了理解门槛,也方便了提示词工程的设计。即使是AI小白,也能理解每个角色在干什么。

    3. 与 CrewAI 形成有趣对比
    我们之前介绍过 CrewAI(轻量高性能),MetaGPT 则更偏”重流程、重规范”,两者定位不同,可以互补使用。

    4. 成本可控
    官方给出参考:用 GPT-4 生成包含分析和设计内容的样例约需 $0.2,生成完整项目约需 $2.0。对于自动化生成项目原型来说,这个成本是可以接受的。

    📥 下载地址

    GitHub github.com/FoundationAgents/MetaGPT
    官方文档 docs.deepwisdom.ai
    PyPI pip install metagpt
    论文 MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework


    📌 这是「GitHub热门AI开源项目」第26期,由 WorkBuddy AI 自动采集撰写。欢迎关注 admin.hiyoho.com 获取更多AI开源项目深度介绍。


  • ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    ChatGPT杀进PowerPoint:打几个字,幻灯片自动生成

    微软和OpenAI又搞新动作了。最新推出的ChatGPT for PowerPoint集成功能,让你在侧边栏里打几句话,就能自动生成或编辑演示文稿。跟他家之前推出的Excel、Google Sheets插件差不多,都是把ChatGPT直接塞进办公软件里。

    ChatGPT for PowerPoint
    ChatGPT集成到PowerPoint侧边栏(图源:The Verge)

    怎么用?

    功能入口在PowerPoint的侧边栏,跟Excel那个插件的位置差不多。你可以直接打提示词让它生成幻灯片,也可以把文档、图片这些素材丢给它,让它帮你整理成演示文稿。

    比如说你要做一个产品介绍PPT,以前得自己一页页排版、找图、调格式,现在可能只需要告诉ChatGPT”帮我做一个15页的产品介绍,包含市场分析、功能介绍和竞品对比”,它就能给你搭出个框架来。

    “用户可以通过聊天提示词,结合文档、图片和其他素材,创建或编辑演示文稿。”——The Verge报道

    谁能用到?

    目前这个功能还在beta测试阶段,覆盖的用户群挺广:Business、Enterprise、Edu、Teacher、K-12、Free、Go、Pro、Plus订阅计划的ChatGPT用户都能用。也就是说,不管你是企业用户、教育工作者还是普通个人用户,只要用ChatGPT基本都能尝鲜。


    办公软件+AI,这波趋势停不下来

    微软在这件事上其实挺鸡贼的。一边是自己Copilot在推进,一边又允许OpenAI的ChatGPT直接集成进Office套件。表面上看是在开放生态,实际上不管用户用哪个,微软都能赚到钱——Copilot要订阅,ChatGPT for Microsoft 365也要走微软的渠道。

    对普通用户来说,这确实能省不少时间。做PPT最烦的不是想内容,而是调格式、找模板、对齐元素这些琐碎活。AI帮你把框架搭好,你只需要改改内容、换个配色,效率至少提升一倍。

    当然,生成的PPT质量怎么样还得实测。如果版式太死板、审美不过关,可能反而要花更多时间返工。不过从Excel插件的使用反馈看,OpenAI在这件事上还算靠谱,至少能帮你省掉最无聊的那部分工作。

    • 功能:侧边栏集成,支持提示词生成/编辑PPT
    • 支持素材:文档、图片及其他源文件
    • 当前状态:beta测试阶段
    • 可用计划:Business/Enterprise/Edu/Teacher/K-12/Free/Go/Pro/Plus

    办公软件的AI化已经是大势所趋。再过两年,可能没人会手动从零开始做PPT了——就像现在没人会手动排版一封电子邮件一样。早适应,早省事。

    📎 原文来源:ChatGPT for PowerPoint generates presentations with prompts(The Verge,2026-05-21)
  • 英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达又破纪录了:数据中心收入同比增长92%,AI芯片有多赚钱

    英伟达刚发布的2027财年第一季度财报,数字简直离谱。总营收816亿美元,其中数据中心业务就贡献了752亿美元——比去年同一个季度增长了92%。也就是说,这家公司几乎全部收入都来自AI数据中心对芯片的渴求。

    Nvidia财报创纪录
    英伟达财报再次刷新纪录(图源:The Verge)

    AI数据中心的”印钞机”

    752亿美元是什么概念?很多科技公司一整年的收入都达不到这个数字,而英伟达只用一个季度就做到了。增长引擎很清楚——全球各地的AI数据中心都在抢购它的芯片,从微软、谷歌到字节跳动、阿里,大家都在扩建算力基础设施。

    “持续增长的AI数据中心芯片需求,推动我们创造了纪录性的营收表现。”——英伟达官方财报声明

    下一代芯片Vera Rubin要来了

    财报电话会议上,英伟达确认下一代Vera Rubin AI芯片”按计划将在今年下半年推出,从第三季度开始”。这意味着大概2026年7-9月之间,我们就能看到这款新芯片的影子。Vera Rubin是在今年CES 2026上首次公布的,定位是替代当前Blackwell架构的下一代产品。

    不过也有不那么亮眼的数字。受内存(RAM)短缺和价格上涨影响,英伟达的PC业务销量出现了下滑。这其实对整个PC行业都是个头疼的问题——内存供应跟不上,成本涨了,消费者也不急着换电脑。


    为什么这个数字很重要

    92%的同比增长,说明AI基础设施建设还没有放缓的迹象。很多人担心AI泡沫什么时候破,但至少从现在的数据看,科技公司在算力上的投入还在加速。每一家做大模型、做AI服务的公司,都需要英伟达的芯片来训练模型和跑推理。

    而且这个趋势很可能还会持续——Vera Rubin一旦量产,性能会比现在的Blackwell更强,到时候又会引发新一轮的采购潮。对于英伟达来说,眼下的挑战可能不是需求不够,而是产能能不能跟上。

    • 总营收:816亿美元(创纪录)
    • 数据中心营收:752亿美元(同比增长92%)
    • 下一代芯片:Vera Rubin将于2026年Q3推出
    • 隐忧:PC业务受内存短缺影响销量下滑

    AI这场仗,英伟达目前还是最大的赢家。只是不知道这个增速能维持多久——AMD和英特尔都在追赶,中国本土的芯片厂商也在崛起。不过按照现在的需求量,短期内英伟达的”印钞机”估计还停不下来。

    📎 原文来源:Nvidia’s Q1 2027 data center revenue jumped 92 percent from last year(The Verge,2026-05-20)
  • AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    AI写作闯进文学圈:诺奖得主也在用,评委却分不清是人写的还是机器写的

    自2012年以来,英国文学杂志《格兰塔》(Granta)每年都会公布英联邦短篇小说奖的地区获奖者。今年的入选作品却出了状况:其中一篇作品,看起来像是AI生成的。

    贾米尔·纳齐尔(Jamir Nazir)的《丛林中的蛇》(The Serpent in the Grove)具备大语言模型生成文本的多处典型特征:混合隐喻、首语重复、三元素列举。我承认这里也是三元素列举,但我保证这篇文章完全由我本人独立撰写,没有借助任何AI工具,我所有的作品都是如此。

    AI写作文学争议
    AI写作闯入文学圈,评委和读者都措手不及(图源:The Verge)

    三元素列举、破折号、单词”delve”——这些都是AI特征吗

    我最初对”纳齐尔的作品由AI生成”的指控持怀疑态度。我知道很多人会用LLM辅助写作,甚至完全让AI代笔,但我对同行中出现的那种”AI偏执”一直很警惕。据说破折号、单词”delve(钻研)”以及三元素列举都是AI写作的特征,短促有力的句子也是,尤其是当这类句子用来衔接长句的时候。

    但我作为人类,以前写作时也肯定用过上述所有特征。毕竟LLM的训练数据就是人类的写作内容,它们只是在模仿输入的内容。可AI生成的文本确实有一种诡异的质感,哪怕你一时说不出哪里不对,也能感觉到异样。

    “AI写作有一种我学会识别的特殊节奏,很难用语言描述。AI使用程度有一个光谱,从’AI帮我编辑’到’AI写了整篇内容’,这个案例在我看来属于后者的范畴。”
    ——纳比尔·S·库雷希,乔治梅森大学默卡特斯中心前AI访问学者

    评委分不清,AI检测工具也分不清

    问题在于,哪怕AI使用的嫌疑很大,所有人都无法百分百确定。英联邦基金会总干事拉兹米·法鲁克表示,该组织已经知晓有关获奖作品使用AI的指控。法鲁克称,所有提交作品参赛的作家都会被问及作品是否为原创、未发表内容,所有入围作家都亲自声明没有使用AI辅助撰写故事。

    “在出现能够可靠检测AI使用、同时能解决未发表小说相关挑战的有效工具或流程之前,英联邦基金会和英联邦短篇小说奖必须遵循信任原则开展工作,”法鲁克表示。

    《格兰塔》方面则将纳齐尔的作品输入Claude,”询问它是否为AI生成内容”。出版人西格丽德·劳辛在一份声明中称:”回复内容很长,结论是’几乎可以肯定不是无人类辅助生成的’。”但Claude并不是AI检测工具,它是基于大语言模型的聊天机器人。

    诺奖得主的AI使用,让读者震惊

    本周,波兰作家奥尔加·托卡尔丘克(Olga Tokarczuk)承认她使用AI辅助创作过程——这位2018年诺贝尔文学奖得主的做法,对于崇拜她的读者来说依然令人震惊。

    “我经常会直接把一个想法输入机器,加上提示词:’亲爱的,我们怎么把这个想法写得精彩?’”托卡尔丘克说。她在波兹南的一场活动中用波兰语发表了这番评论,不幸的是,它走红的时间正好和英联邦奖争议的时间重合。

    托卡尔丘克在分享给Lit Hub的一份三点声明中澄清了她的AI使用情况,她解释说自己没有用AI写即将出版的新书,但确实用它来”更快地记录和核实事实”,不过她会独立验证这些信息。


    AI生成的文本有一种”诡异质感”,但你看到的时候就知道

    当我把纳齐尔的作品输入AI和剽窃检测软件Pangram时,结果显示100%是AI生成的。根据Pangram的说法,最明显的特征是纳齐尔对三元组的使用;单词”stubborn(固执的)”,它在AI生成文本中出现的概率是人类写作的6倍。

    但我不满意这个结果,于是把我即将出版的新书的未发表片段(我目前正在编辑)输入Pangram检测。仅一个段落就包含了两个三元组。(这部分内容写得不好,所以我才要编辑。)Pangram显示片段100%是人类写的,这是事实,但我还是不满意。

    人类创作的作品有一种难以言喻的特质,AI生成的作品也是如此。也许AI生成的文本就像色情内容:你看到的时候就知道是它,哪怕你说不出原因。

  • Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI 特色图

    📌 项目简介

    Gemini CLI 是 Google 官方开源的终端 AI 智能体,把 Gemini 大模型的能力直接搬进了你的命令行。它不只是一个聊天工具——它能读你的代码库、帮你写代码、调试 Bug、执行终端命令,甚至直接操作文件,真正实现了「在终端里有一个懂你项目的 AI 搭档」。


    ⚙️ 安装要求和过程

    📦 环境要求

    • Node.js >= 18(必须!)
    • npm 或 npx(自带)
    • Google 账号(登录获取免费额度)
    • 终端:支持 macOS / Linux / Windows

    🚀 快速安装(3步搞定)

    最简单的方式,一步安装:

    npm install -g @google/gemini-cli

    或者用 npx 直接运行(无需安装):

    npx @google/gemini-cli

    安装完成后,在终端输入以下命令启动:

    gemini

    首次使用会用浏览器打开 Google 登录页面,授权后即可开始使用,免费版有每天 1000 次请求额度,对个人使用完全够用。


    💡 核心功能

    🔍 1. 全代码库理解

    Gemini CLI 不是「瞎猜」你的代码,它能真正读取和理解整个项目目录。你问它「这个函数的逻辑是什么」,它会去读对应的文件,给你准确的答案,而不是泛泛而谈。

    🛠️ 2. 代码生成与执行

    直接让它写代码、改 Bug、重构函数,它生成完还能直接帮你写到文件里。更厉害的是它可以在沙箱环境里执行代码,验证结果后再提交,减少低级错误。

    🔗 3. 内置 Google 工具集成

    因为是第一方工具,Gemini CLI 可以直接调用 Google 的生态:搜索网页、读取 Gmail、管理日历、操作 Google Drive 文件……这些都不需要额外配置,登录账号就能用,真正的一体化体验。

    📋 4. 多模态支持

    不只处理文字——你可以把截图、设计图、PDF 文档直接丢给它,它能看懂图片内容、提取 PDF 里的文字、分析表格数据。写前端的时候直接把设计稿截图发过去,它能帮你写出对应的 HTML/CSS,这体验真的很丝滑。

    ⚡ 5. 超长上下文窗口

    Gemini 的杀手锏就是上下文长度,CLI 版本同样支持最高 100 万 token 的上下文窗口(付费版)。什么概念?你可以把整个中型项目的代码库全部塞进去,它都能记住,不需要像其他工具那样担心「忘记前面的对话」。


    🎯 典型使用场景

    场景一:接手陌生项目,快速上手

    刚 clone 下来一个开源项目,看不懂项目结构?在终端里直接输入 gemini 启动,然后问它:「这个项目的入口文件在哪?主要业务逻辑是怎么流转的?」它会读一遍整个目录,给你画出一张「项目地图」,比自己瞎看文档快太多了。

    场景二:写代码卡壳,AI 当结对编程伙伴

    正在写一个复杂的正则表达式或者递归算法,脑子转不动了?不用切换窗口去网页版 ChatGPT,直接在终端里问 Gemini CLI,它看着你的代码上下文给建议,甚至直接帮你写完整个函数。最关键是——它知道你项目里已有的工具和风格,不会给你写出风格迥异的代码。

    场景三:自动化日常开发任务

    需要批量重命名文件、生成项目的 README、写单元测试、或者分析 git log 找出是谁引入了某个 Bug?这些琐碎但耗时的任务,直接告诉 Gemini CLI 去做,它能在终端里直接执行,你只需要最后确认一下结果就行。


    🌟 推荐理由

    我推荐 Gemini CLI,最直接的原因就是:它是真的「懂终端」的 AI 工具

    之前用过不少 AI 编程助手,但大多要么是在网页里聊天(切换窗口很打断思路),要么是 VS Code 插件(离开编辑器就用不了)。Gemini CLI 不一样——它就在你的终端里,和你日常的 cdgitnpm 命令待在一起,想问什么直接问,完全不需要切换上下文。

    另一个很打动我的点是免费额度够大方。每天 1000 次请求,对个人开发者来说基本上用不完。当然如果你需要 100 万 token 的超长上下文,那就要开付费了,但普通使用免费版完全够用。

    当然它也有不足——相比 Claude Code,Gemini CLI 的代码生成质量偶尔会稍逊一筹,复杂逻辑可能需要多轮对话才能搞定。但作为一款终端原生的免费 AI 助手,它已经足够好用,特别是如果你本来就在用 Google 生态(Gmail、Drive 等),整合体验会很流畅。


    📥 下载地址

    🌐 官方网站:geminicli.com

    🐙 GitHub 仓库:github.com/google-gemini/gemini-cli(104.5k ⭐)

    📦 npm 安装:npm install -g @google/gemini-cli

    📚 官方文档:查看 GitHub README

    🚀 如果你每天都在用终端,Gemini CLI 值得一试。
    把它当成你的「终端里的 AI 结对编程伙伴」,你会发现开发效率提升不止一点点。

  • vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈





    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM Logo

    vLLM – 高性能LLM推理与服务引擎


    📝 项目简介

    vLLM 是由加州大学伯克利分校Sky Computing实验室开发的高吞吐量、内存高效的LLM推理与服务引擎,目前已成为拥有2000+贡献者的活跃开源项目,被誉为”AI模型部署的加速器”。


    ⚙️ 安装要求和过程

    环境要求

    • 操作系统:Linux(推荐)或 macOS/Windows(需WSL2)
    • Python版本:3.8 – 3.11
    • GPU:NVIDIA GPU(CUDA 7.0+)或 AMD GPU(ROCm 5.6+)
    • 内存:建议16GB+ RAM

    快速安装

    # 使用 pip 安装(推荐)
    pip install vllm
    
    # 使用 uv 安装(更快)
    uv pip install vllm
    
    # 从源码安装(用于开发)
    git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .

    💡 提示:安装前建议先查看官方安装指南,选择与你的硬件和系统匹配的安装方式。


    ✨ 核心功能

    1. 业界领先的推理吞吐量

    采用PagedAttention技术高效管理注意力键值内存,支持连续批处理、分块预填充、前缀缓存,实现业界顶尖的推理吞吐量。

    2. 广泛的模型与硬件兼容性

    支持200+模型架构(Llama、Qwen、DeepSeek-V3、Mixtral等),兼容NVIDIA/AMD GPU、x86/ARM CPU,还可通过插件支持Google TPU、Intel Gaudi、华为昇腾等硬件。

    3. 丰富的推理优化技术

    支持FP8/INT8/INT4量化、投机解码(Speculative Decoding)、FlashAttention、CUDA内核优化等多种推理加速技术,显著降低延迟和成本。

    4. OpenAI兼容API服务

    提供与OpenAI API完全兼容的服务接口,只需修改API base URL即可将现有应用无缝迁移到vLLM,支持流式输出、结构化输出、工具调用等高级功能。

    5. 分布式推理支持

    支持张量并行、流水线并行、数据并行、专家并行、上下文并行等多种分布式推理策略,可轻松扩展到大模型和多GPU场景。


    🎯 典型使用场景

    场景一:自建私有化AI推理服务

    企业可以使用vLLM在自有GPU服务器上部署Llama、Qwen等开源模型,提供与OpenAI兼容的API接口,实现数据私有化、成本可控的AI推理服务。相比调用公有云API,可节省70%以上的成本。

    场景二:AI应用高性能后端

    将vLLM作为AI聊天机器人、代码助手、RAG系统的后端推理引擎,利用其连续批处理和高吞吐量特性,支撑高并发用户请求,提升用户体验。

    场景三:多模型推理服务统一平台

    使用vLLM的多LoRA适配器支持能力,在同一服务实例中动态加载多个微调模型,或使用模型并行技术同时服务多个不同架构的模型,简化运维复杂度。


    💡 推荐理由

    作为一个经常跟大模型打交道的开发者,我深刻体会到模型推理部署是AI应用落地的最大瓶颈之一。直到遇见vLLM,这个问题终于有了优雅的解决方案。

    vLLM最让我惊艳的是它的PagedAttention技术——灵感来自操作系统的虚拟内存管理,将KV Cache分割成固定大小的”页”,动态分配给不同请求。这让GPU内存利用率从传统的40-60%飙升到80%以上,吞吐量提升了2-4倍!

    另外,vLLM的OpenAI兼容API设计太贴心了。我只需要改一行代码(把API base URL从api.openai.com改成localhost:8000),整个应用就迁移到了自部署的模型上,零改动成本。

    如果你正在为AI推理成本发愁,或者需要私有化部署大模型,vLLM绝对是首选方案。目前已有数千家企业在生产环境使用vLLM,包括Meta、Google、腾讯等巨头,成熟度完全不用担心。


    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文首发于 admin.hiyoho.com


  • Spotify联手环球音乐:AI翻唱正式合法化,Suno要慌了?

    Spotify鑱旀墜鐜悆闊充箰锛欰I缈诲敱姝e紡鍚堟硶鍖栵紝Suno瑕佹厡浜嗭紵

    Spotify鏈懆瀹e竷鍜岀幆鐞冮煶涔愰泦鍥紙UMG锛夎揪鎴愬悎浣滐紝鍏佽鐢ㄦ埛鐢ㄧ敓鎴愬紡AI鎶€鏈垱浣滃枩鐖辨瓕鏇茬殑缈诲敱鍜屾贩闊炽€傝繖涓姛鑳戒細浠ヤ粯璐归檮鍔犵粍浠剁殑褰㈠紡涓婄嚎锛屽彧鏈塖potify Premium璁㈤槄鐢ㄦ埛鑳界敤锛岃€屼笖鍙備笌椤圭洰鐨勮壓鏈鑳芥嬁鍒版敹鍏ュ垎鎴愩€?/p>

    Spotify搴旂敤鍥炬爣
    Spotify搴旂敤鍥炬爣锛堝浘鐗囨潵婧愶細TechCrunch锛?/figcaption>

    鍏堣瑙勭煩锛屽啀璋堝垱鏂?/h3>

    杩欐鍚堜綔鏈€鏈夋剰鎬濈殑鍦版柟鍦ㄤ簬锛孲potify璧扮殑鏄?鍏堣皥濡ュ啀涓婄嚎”鐨勮矾绾匡紝鍜孲uno銆乁dio閭g鍏堜笂绾垮啀姹傝皡瑙g殑鍋氭硶瀹屽叏鐩稿弽銆傚幓骞碨potify灏遍€忛湶杩囨鍦ㄥ拰鐜悆闊充箰銆佺储灏笺€佸崕绾宠繖浜涘法澶磋皥”浠ヨ壓鏈涓哄厛”鐨凙I浜у搧锛屽綋鏃惰繕鐗规剰寮鸿皟瑕?棰勫厛杈炬垚鍗忚”锛岃瘽閲岃瘽澶栭兘鍦ㄦ殫鎸嘢uno浠栦滑銆?/p>

    Spotify鑱斿悎棣栧腑鎵ц瀹楢lex Norstr枚m鍦ㄥ0鏄庨噷璇村緱寰堟竻妤氾細”瑙e喅闊充箰琛屼笟鐨勯毦棰樻槸Spotify鐨勪笓闀匡紝绮変笣鍒涗綔鐨勭炕鍞卞拰娣烽煶浣滃搧鏄笅涓€涓鏀诲厠鐨勯鍩熴€傛垜浠湪鍋氱殑浜у搧锛屾牳蹇冨氨鏄壓鏈鐨勭煡鎯呭悓鎰忋€佺讲鍚嶆潈鍜屾姤閰€?

    姣忎竴娆℃妧鏈彉闈╋紝鎴戜滑閮藉拰鍗㈣タ鎭╃埖澹紙鐜悆闊充箰闆嗗洟钁d簨闀垮吋棣栧腑鎵ц瀹橈級鍙婂叾鍥㈤槦鍚堜綔锛屾帹鍔ㄩ煶涔愮敓鎬佽繘鍖栵紝涓虹矇涓濆甫鏉ユ洿涓板瘜銆佹洿鏈変环鍊肩殑浣撻獙锛屼篃涓鸿壓鏈鍜岃瘝鏇蹭綔鑰呭甫鏉ユ洿涓板帤鐨勫洖鎶ャ€?

    Suno鍜孶dio鐨勬硶寰嬪櫓姊?/h3>

    瀵规瘮涓€涓嬪氨鐭ラ亾Spotify杩欐妫嬫湁澶氱簿鏄庝簡銆係uno鍜孶dio鍦ㄥ紑鍙慉I闊充箰宸ュ叿鐨勬椂鍊欙紝鍩烘湰鏄湪娉曞緥鐏拌壊鍦板甫鐙傚銆傜粨鏋滀笉鍑烘墍鏂欙紝鍚勫ぇ鍞辩墖鍏徃杩呴€熸彁璧蜂簡璇夎銆?/p>

    2025骞?1鏈堬紝Suno鍜屽崕绾抽煶涔愰泦鍥㈣揪鎴愬拰瑙o紝鎺忎簡5浜跨編鍏冭В鍐冲畼鍙搞€傚樊涓嶅鍚屼竴鏃堕棿锛岀幆鐞冮煶涔愰泦鍥篃鍜孶dio杈炬垚浜嗗拰瑙c€傜洰鍓峉uno杩樺湪搴斿鐜悆闊充箰銆佺储灏奸煶涔愮瓑鍏徃鎻愬嚭鐨勭増鏉冪储璧旓紝Udio铏界劧宸茬粡鍜屽崕绾炽€乁MG鍜岃В锛屼絾杩樺湪鍜岀储灏煎崗鍟嗐€?/p>

    • Suno锛氬凡涓庡崕绾冲拰瑙o紙5浜跨編鍏冿級锛屼粛闈复UMG銆佺储灏艰瘔璁?/li>
    • Udio锛氬凡涓庡崕绾炽€乁MG鍜岃В锛屼粛鍦ㄤ笌绱㈠凹鍗忓晢
    • Spotify锛氶鍏堣揪鎴愯鍙崗璁紝鍚堟硶鍚堣鍏ュ満

    鑹烘湳瀹剁殑鐭ユ儏鍚屾剰鍜屾姤閰?/h3>

    鐜悆闊充箰闆嗗洟钁d簨闀垮吋棣栧腑鎵ц瀹樺崲瑗挎仼路鏍煎叞濂囩埖澹〃绀猴紝杩欎竴杩涘睍鏄壓鏈娣卞寲涓庣矇涓濆叧绯汇€佸悓鏃跺垱閫犻澶栨敹鍏ユ満浼氱殑鏂瑰紡銆備笉杩囩洰鍓嶈繕娌℃湁娑堟伅閫忛湶鍝簺UMG鏃椾笅鐨勮壓鏈鍚屾剰鍙備笌杩欎釜椤圭洰銆?/p>

    浠庢潈鐩婂垎閰嶇殑瑙掑害鏉ョ湅锛岃繖涓」鐩‘瀹炴瘮Suno銆乁dio閭g”鍏堜笂杞﹀悗琛ョエ”鐨勬ā寮忚鍚堢悊寰楀銆傝壓鏈鍙互閫夋嫨鏄惁鍙備笌銆佸浣曞弬涓嶢I宸ュ叿锛屽鏋滃弬涓庡氨鑳借幏寰楀叕骞虫姤閰紝鑰屼笉鏄瓑鎵撳畼鍙哥殑鏃跺€欏啀璋堝垎鎴愩€?/p>

    Spotify鐨凙I澶хぜ鍖?/h3>

    杩欐鍜孶MG鐨勫悎浣滃彧鏄疭potify鎶曡祫鑰呮棩鍏竷鐨勪竴绯诲垪AI鍔熻兘涓殑涓€涓€傚悓鏈熶寒鐩哥殑杩樻湁锛?/p>

    • 鐢盓levenLabs鎻愪緵鏀寔鐨凙I鏈夊0涔﹀垱浣滃伐鍏?/li>
    • 闈㈠悜鎾鍒涗綔鑰呯殑AI闂瓟鍜屾憳瑕佺敓鎴愬姛鑳?/li>
    • 鐢ㄤ簬閫氳繃AI鍒朵綔涓汉鎾鐨勬闈㈠簲鐢?/li>
    • 涓鸿壓鏈鐨勬牳蹇冪矇涓濋鐣欐紨鍞变細闂ㄧエ鐨勫姛鑳?/li>

    鐪嬭捣鏉potify姝e湪鎶夾I鍏ㄩ潰鍦板杩涜嚜宸辩殑浜у搧閲岋紝浠庨煶涔愬垱浣溿€佹湁澹颁功鍒朵綔鍒版挱瀹㈢敓浜э紝涓€涓兘涓嶆斁杩囥€?/p>

    UMG鍙兘鍙槸Spotify浼楀鍞辩墖鍏徃鍚堜綔涓殑绗竴涓€傝櫧鐒跺叕鍙告病鏈夋槑纭鏄庯紝浣嗕粠瀹冨凡缁忓拰鍏ㄧ悆澶氬澶撮儴闊充箰闆嗗洟娌熼€氬悎浣滄潵鐪嬶紝AI闊充箰鍒涗綔鍔熻兘鏈潵澶ф鐜囦細瑕嗙洊鏇村鐗堟潈鍐呭銆?

    AI闊充箰璧涢亾鐨勭珵浜夊崌绾?/h3>

    浼犵粺闊充箰娴佸獟浣撳钩鍙颁緷鎵樺悎娉曠増鏉冧紭鍔垮叆灞€AI闊充箰鍒涗綔锛岃繖瀵筍uno杩欑被鍘熺敓AI闊充箰鏈嶅姟鍟嗘潵璇达紝鍘嬪姏鏄疄鎵撳疄鐨勩€傜敤鎴峰鏋滆兘鍦⊿potify閲岀洿鎺ョ敤姝g増鎺堟潈鍒涗綔AI缈诲敱锛岃皝杩樹細鍘诲啋鐗堟潈椋庨櫓鐢⊿uno锛?/p>

    褰撶劧锛孲potify鐩墠杩樻病鏈夊叕甯冭繖涓姛鑳界殑瀹氫环鍜屽叿浣撲笂绾挎棩鏈燂紝鍝簺鑹烘湳瀹朵細鍙備笌涔熸槸鏈煡鏁般€備絾杩欎欢浜嬫湰韬凡缁忛噴鏀句簡涓€涓緢寮虹殑淇″彿锛欰I闊充箰鍒涗綔鐨勫悎瑙勬椂浠e彲鑳界湡鐨勮鏉ヤ簡锛岄偅浜涜繕鍦ㄦ硶寰嬬伆鑹插湴甯﹀緲寰婄殑鐜╁锛屾槸鏃跺€欒€冭檻杞瀷浜嗐€?/p>


    馃搸 鍘熸枃鏉ユ簮锛?a href=”https://techcrunch.com/2026/05/21/spotify-and-universal-music-strike-deal-allowing-fan-made-ai-covers-and-remixes/” style=”color:#6366f1;” target=”_blank”>Spotify and Universal Music strike deal allowing fan-made AI covers and remixes – TechCrunch

  • 发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    5月22日,国家发改委召开5月份新闻发布会,新闻发言人李超透露了一个重要信号:官方正在开展人工智能立法研究,要强化安全治理能力建设,让人工智能朝着有益、安全、公平的方向发展。

    这话听起来有点宏观,但实际影响会很深远。想想看,AI现在到处都是,从手机里的语音助手到医院的辅助诊断,从自动驾驶到金融风控,到处都在用。但规则跟不上技术,就会出问题——数据泄露、算法歧视、AI生成内容乱七八糟……所以立法不是”要不要”的问题,是”什么时候出台、怎么制定才合理”的问题。

    “这也是中国人工智能发展的一大突出特征——在保持快速发展的同时,确保自主可控、向善发展、行稳致远,让全体人民共享人工智能发展成果。”

    “人工智能+”已经在路上

    发布会上还介绍了”人工智能+”行动的进展。目前官方已经出台了制造、医疗、能源等十多个行业的专项政策文件,政策体系正在不断完善。

    更有意思的是,国家发改委会同有关部门在制造、医疗、交通等领域布局了一批国家人工智能应用中试基地。这些基地是干嘛的?简单说,就是让AI技术从实验室走到试验场、从工厂走到市场的”中转站”,提供算力、数据、场景这些关键要素支撑,大幅缩短转化周期、降低落地成本。

    国家发改委新闻发布会
    国家发改委5月份新闻发布会现场(图片来源:中国新闻网)

    已经有落地案例了

    举个具体的例子:医疗领域的中试基地孵化出了一款叫“蚂蚁阿福”的AI应用,可以提供就医陪诊、辅助诊断、家医随访等智能服务。这款应用已经在十多个省市的医疗机构落地,让更多居民享受到智能、优质、便利的健康体验。

    你看,AI不是只在大厂实验室里跑模型、刷榜单,它真的在走进医院、走进社区,开始影响普通人的生活。这才是”人工智能+”想要达到的效果。


    接下来还要做什么?

    李超还透露了两个重要计划:

    • 出台配套文件:官方正在谋划出台加快”人工智能+”落地的配套文件,进一步加大要素保障。
    • 打造标杆应用:持续推动央国企开放高价值应用场景,面向各行业领域和各地方打造人工智能标杆应用,加快引导人工智能融入生产、经营、管理等各方面各环节。

    这意味着什么?意味着接下来会有更多实际的应用场景被开放出来,AI技术会更快地渗透到各行各业。对于做AI应用的创业公司来说,这是个好消息——有政策支持、有场景开放、有要素保障,落地会更容易。

    回过头看,人工智能立法研究、”人工智能+”行动、应用中试基地、配套文件……这一套组合拳打下来,中国AI的发展路径已经很清晰了:既要快,也要稳;既要创新,也要安全;既要技术突破,也要普惠共享。

  • andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    🎯 项目简介

    andrej-karpathy/skills 是一个基于Andrej Karpathy(前OpenAI创始成员、特斯拉AI前主管)总结的LLM编程陷阱而创建的Claude Code技能集合,拥有超过14.4万Stars,帮助AI编程助手避免常见错误,提升代码质量。


    💻 安装要求和过程

    环境要求

    • Claude Code 或兼容的AI编程助手
    • 支持技能导入功能

    快速安装

    # 克隆仓库
    git clone https://github.com/multica-ai/andrej-karpathy-skills.git
    
    # 进入目录
    cd andrej-karpathy-skills
    
    # 将 CLAUDE.md 文件复制到你的项目根目录
    # Claude Code 会自动读取该文件作为行为规则

    ✨ 核心功能

    1. 🎯 避免LLM编程陷阱:基于Karpathy总结的常见错误模式,帮助AI生成更可靠的代码
    2. 📝 最佳实践集成:内置经过验证的编程模式和架构决策
    3. 🔧 Claude Code优化:专门为Claude Code调优的技能集合
    4. 🚀 提升代码质量:减少调试时间,提高代码可维护性
    5. 📚 持续更新:跟随LLM能力演进,持续添加新的最佳实践

    🎨 典型使用场景

    场景1:AI辅助代码审查

    在代码审查阶段,让Claude Code加载这些技能,自动识别代码中的潜在问题,如性能陷阱、安全漏洞、反模式等。

    场景2:学习LLM编程

    对于刚开始使用AI辅助编程的开发者,这个项目是一个完美的”避坑指南”,帮助你理解LLM在编程时的常见失误。

    场景3:团队标准化

    在团队中统一配置这些技能,确保所有成员在使用AI编程助手时遵循相同的最佳实践。


    💡 推荐理由

    Andrej Karpathy作为深度学习领域的先驱,其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能,让每个开发者都能受益于顶级专家的见解。

    特别适合:

    • 频繁使用Claude Code或其他AI编程助手的开发者
    • 希望提升AI生成代码质量的团队
    • 对LLM编程能力边界感兴趣的研究者

    这个项目最打动我的是其实用性——不是空洞的理论,而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。


    📥 下载地址


    如果你正在使用Claude Code或其他AI编程助手,强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知!