博客

  • Langflow:148.6k Stars!可视化AI工作流构建平台,让Agent开发像搭积木一样简单

    Langflow:148.6k Stars!可视化AI工作流构建平台,让Agent开发像搭积木一样简单

    🚀 项目简介

    Langflow 是一个强大的AI智能体和AI工作流可视化构建平台。它让开发者可以通过拖拽式界面快速搭建LLM应用,同时也支持直接修改Python源码进行深度定制。内置API和MCP服务器,可以把每一个工作流变成可被任何框架调用的工具。

    Langflow

    Langflow — 可视化AI工作流构建平台

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.10 – 3.13
    • 推荐包管理器:uv(更快更现代)
    • 可选:Docker(容器化部署)

    快速安装(推荐方式)

    # 安装 Langflow
    uv pip install langflow -U
    
    # 启动 Langflow
    uv run langflow run

    启动后访问 http://127.0.0.1:7860 即可使用可视化界面。

    Docker 方式

    docker run -p 7860:7860 langflowai/langflow:latest

    桌面版(最简单)

    Langflow Desktop 是入门首选,包含所有依赖,无需手动管理Python环境。支持 Windows 和 macOS,可从 langflow.org/desktop 下载。

    ✨ 核心功能

    🎨 可视化构建界面

    通过拖拽组件即可快速搭建AI工作流,所见即所得,迭代速度极快。不需要写大量样板代码,新手也能快速上手。

    🐍 源码级定制能力

    每一个组件都支持直接查看和修改Python源码。你可以轻松添加自定义逻辑、接入私有API,而不被平台限制住手脚。

    🤖 多智能体编排

    内置对话管理和检索能力,支持构建多智能体系统。可以轻松实现Agent之间的协作、记忆共享和任务分工。

    🚀 一键部署为 API / MCP 服务器

    任何工作流都可以一键部署为REST API,也可以作为MCP服务器运行,让你的AI工作流变成其他应用可以调用的工具。真正实现了”构建一次,随处使用”。

    📊 可观测性集成

    支持 LangSmith、LangFuse 等可观测性工具集成,方便调试和监控生产环境中的AI工作流表现。

    💡 典型使用场景

    📄

    RAG文档问答系统

    连接向量数据库和LLM,构建基于私有知识的问答系统。可视化配置文档加载、分块、检索和生成的完整流程。

    🤝

    多Agent协作任务

    构建多个专业Agent协作完成复杂任务,比如一个Agent负责搜索、一个负责总结、一个负责写作,通过可视化流程串联起来。

    🔌

    AI能力API化

    把精心设计的AI工作流一键部署为API或MCP工具,供前端应用、企业系统或其他AI Agent调用,实现AI能力的模块化复用。

    🧪

    Prompt工程实验

    快速搭建不同的Prompt链路进行对比测试,找到效果最好的提示词组合。交互式Playground支持单步调试,每个环节的输入输出都清晰可见。

    🌟 推荐理由

    如果你在寻找一个既适合快速原型验证、又能支撑生产部署的AI工作流工具,Langflow值得认真考虑。

    它和Dify的定位有些类似,但Langflow更偏向开发者的使用习惯——你可以直接在界面里改Python代码,组件库开放且易扩展,不会被”低代码”的边界限制住。

    我个人最喜欢的功能是部署为MCP服务器。现在AI Agent生态里MCP是重要协议,Langflow让你可以把任何工作流变成MCP工具,被Claude、Cursor等AI助手直接调用,这个设计非常前瞻。

    另外,Langflow Desktop版本对Windows用户非常友好,一键安装,开箱即用,不需要折腾Python环境,这点必须点赞 👍

    🔗 下载地址

    📌 本文由 WorkBuddy AI 自动采集撰写,开源项目信息来自 GitHub 官方仓库。

  • 福布斯中国AI TOP 50出炉,企业级AI平台被单独标注了

    唯一一家”企业级AI平台”公司

    福布斯中国刚发布了2026年AI科技企业TOP 50榜单。和往年不太一样的是,今年的榜单里出现了一个有点特别的入选理由标注。

    中关村科金是榜单上唯一一家被标注为”企业级AI平台及应用公司”的企业。这个标注背后,其实藏着一个正在发生变化的市场信号。

    据IDC最新报告,中关村科金位列中国大模型平台私有化市场份额第四。2026年一季度,其在应用类大模型项目公开中标数排名前五,服务行业客户超3000家。

    私有化部署为什么成了独立赛道

    AI行业有一个变化已经进行了一段时间:从”我能做多大模型”到”我的大模型能在你的环境里跑起来吗”。

    私有化部署这个需求,在中国市场尤其突出。金融、政务这些行业,数据不能出域是硬要求。大模型再强,不能本地部署就免谈。这就是为什么”企业级AI平台”成了一个独立的赛道。

    中关村科金能上福布斯榜单,某种程度上说明这个赛道已经被主流视野注意到了。之前这块业务相对低调,做的主要是把大模型”装进”企业的私有环境里,让企业能用自己的数据跑自己的AI。

    同一时期的其他信号

    同一时期的AI行业快讯里,还有几个值得放在一起看的数据。

    • Meta计划全球裁员10%,但同时把7000名员工转到AI工作流相关的新项目——AI转型伴随着组织重构。
    • 腾讯2026年Q1净利润756亿元,AI投入是百亿级别;百度AI相关收入占比首次过半,但毛利率只有35-40%,远低于传统广告业务的65-67%。
    • 三大运营商齐发Token服务,支持话费账单支付——AI算力开始走向大众化消费。

    这些数据放在一起,一个轮廓开始清晰:AI的商业模式分化正在加速。做to C的可能还在烧钱,做to B的有些已经开始赚钱了。


    福布斯榜单的真正信号

    福布斯榜单的意义,往往不在于谁上榜了,而在于它折射出资本和市场的注意力在哪里。

    企业级AI平台这个赛道,在此之前相对低调。现在被福布斯拎出来单独标注,至少说明一件事:AI价值链里,不被看见的那部分,可能才是最值钱的那部分。

    大模型本身的竞赛已经白热化,但能把大模型”交付”到企业手里、还能跑得稳的这个中间层,反而是更稀缺的能力。这个能力需要的不只是技术,还有对金融、政务、汽车这些行业的理解。

    榜单里只有一家企业级AI平台公司,不代表这个赛道只有一家在跑。但它至少说明,资本开始认真看待这个方向了。

  • xAI再砸28亿美元买燃气轮机,但环保官司还没打完

    28亿美元的燃气轮机采购计划

    根据SpaceX 2026年5月20日披露的IPO文件,xAI打算在未来三年里采购价值28亿美元的天然气轮机,专门用来给AI算力基础设施供电。其中一笔高达20亿美元的订单,买的正是眼下被起诉的那类”移动式燃气轮机”。

    xAI孟菲斯数据中心燃气轮机
    xAI在田纳西州孟菲斯的数据中心,燃气轮机就安置在拖车上(图:Getty Images)

    这件事的背景挺戏剧性。xAI在田纳西州孟菲斯附近的数据中心,最近因为空气污染问题被告上了法庭。起诉方是美国全国有色人种协进会(NAACP),理由是xAI在没有任何许可证的情况下运行了几十台燃气轮机,让本就污染严重的地区雪上加霜。

    根据起诉内容,xAI目前只拿到了15台燃气轮机的运营许可。但截至几周前,实际在运行的轮机数量是46台。每台这种规模的轮机,每年可以排放超过2000吨的氮氧化物——就是那种会诱发哮喘的雾霾的主要成分。

    “移动设备”的法律漏洞

    xAI的辩解挺有意思。他们说这些轮机属于”移动设备”——因为还停在运输拖车上没卸下来——所以按照密西西比州的规定,可以在没有许可证的情况下运行最多一年。

    但联邦环保署(EPA)不这么看。EPA在2026年初裁定,不管你是不是放在拖车上,这个规模的燃气轮机都得遵守联邦空气污染法规。结论很明确:xAI在违反联邦法律运行这些设备。

    眼下的情况是,州法和联邦法之间有一个解释上的缝隙,xAI正在这个缝隙里使劲钻。但EPA已经表态了,接下来的官司不好打。

    SpaceX IPO文件里的风险自白

    最有意思的是SpaceX自己在IPO文件里写的话。文件里明确说了:”我们目前的数据中心运营高度依赖天然气和燃气轮机技术。”如果法院出台禁止令,或者已经发放的许可被撤销,”将对我们的AI业务产生不利影响”。

    翻译成大白话就是:如果官司打输了,xAI的算力扩张计划可能直接卡壳。


    AI算力的能源困局

    把视角拉远一点,这件事背后是一个整个行业都绕不开的矛盾。AI公司们都在疯狂扩建数据中心,但数据中心的耗电量和碳排放已经成为一个无法忽视的问题。

    xAI的选择是用燃气轮机自己发电,这样不用跟电网抢电,但代价是直接在当地排放污染物。Musk显然认为这是一个可以接受的权衡——28亿美元的采购计划说明他觉得这条路走得通。

    但NAACP的起诉和EPA的裁定表明,监管和环境正义组织并不打算让他轻松过关。这场官司的结果,大概率会影响整个AI行业怎么思考算力的能源问题。

    算力是弹药,电力是弹药库。xAI想自己建弹药库,但现在的麻烦是,弹药库可能会被判违法。

  • OpenAI推理模型推翻80年数学猜想,AI数学能力真的起飞了

    5月20日,OpenAI宣布了一个在数学圈炸锅的消息:他们的一款内部推理模型,成功推翻了保罗· Erdős在1946年提出的「单位距离猜想」。这个问题困扰了数学界将近80年,现在被AI给解了。

    如果你对Erdős这个名字不太熟悉——他是20世纪最多产的数学家之一,一生发表了1500多篇论文,提出的开放问题多得数不清。这个「单位距离猜想」说的是:在平面上放一堆点,如果任意两个点的距离都是1(单位距离),那么这种点的排列方式有没有上限?

    Erdős猜想的答案可能是「没有上限」——你可以构造任意大的点集,使得所有点对的距离都是1。OpenAI的模型给出了一个新的构造方法,证明了Erdős的直觉是对的。

    为什么这次值得认真看待

    今年2月,OpenAI前副总裁Kevin Weil曾经宣称「GPT-5解决了10个Erdős问题」,结果被数学界集体打脸——那些「证明」经不起推敲,有些甚至是错的。

    但这次不一样。OpenAI找了Noga Alon和Melanie Wood这两位顶级数学家独立验证,结论是对的。这种级别的同行评议,基本等于把「AI证明」这件事从「噱头」提升到了「科研工具」的层次。


    菲尔兹奖得主也下场了

    就在OpenAI官宣的前几天,剑桥大学数学教授Timothy Gowers(菲尔兹奖得主)发了一篇博客,详细记录了他用ChatGPT 5.5 Pro做数学研究的经历。他的评价是:「这是我第一次真正感受到AI在数学推理上的突破。」

    Gowers用ChatGPT 5.5 Pro处理了几道博士级别的原创性数学问题,模型大约花了一个小时就给出了完整的解答过程。他自己动手验算了一遍,逻辑是通的。

    菲尔兹奖得主的背书分量很重。如果连Gowers都觉得「这玩意儿真的能干活」,那AI在数学领域的应用可能比我们想象的要快得多。

    对AI研究的启示

    这次突破的意义,不只是「AI会做数学题」这么简单。它说明了一点:大模型的推理能力已经开始触及「原创性思维」的边界

    过去我们觉得AI擅长的是「模式识别」——给它看成千上万道微积分题,它能学会做题的规律。但Erdős猜想这种问题,没有「题库」可以刷,需要的是真正的数学直觉和构造能力。

    • OpenAI的模型用的是「推理链」机制——它会自己分解问题、尝试不同的构造方法、反复验证每一步的正确性
    • 这种能力如果迁移到软件工程、芯片设计、药物发现这些领域,影响会是系统性的
    • 当然,目前还停留在「辅助研究」阶段,离「AI独立做科研」还有距离

    写在最后

    从2月被数学界打脸,到5月拿出经得起验证的证明,OpenAI用了大约三个月。这个节奏,比很多人预期的要快。

    AI会不会在不久的将来成为数学家的「标配工具」,就像现在的数学家离不开Latex和Mathematica一样?这个答案,可能比我们想象的更早到来。

  • 谷歌I/O 2026大会:Gemini 3.5亮相,AI生态全面升级

    昨天凌晨1点,谷歌在山景城开了2026年的I/O大会。如果你关注AI,这场发布会基本等于谷歌今年的「底牌曝光」——新一代Gemini模型、搜索大改版、还有那副看起来有点怪的AI眼镜,全都一次性端了出来。

    Gemini Omni:把图像、音频、视频揉进一个模型

    谷歌把图像生成、文本处理、音频分析和视频编辑全部整合进了Gemini Omni。现场演示的时候,工作人员直接对着手机说了一句「帮我把这段视频加个字幕,背景音乐换成爵士乐」,模型真的就跑起来了,而且速度不算慢。

    这个功能的核心价值在于:你不再需要打开Premiere或者Final Cut,也不用在不同AI工具之间倒腾文件。自然语言直接驱动多模态编辑,这才是「AI助手」该有的样子。

    Gemini 3.5 Flash已经向全球用户开放,Pro版本还在内部测试。谷歌这次明显在打「速度牌」——Flash系列主打低延迟,瞄准的是开发者和移动端场景。

    搜索的「25年来最大改版」

    谷歌把新搜索框叫做「动态扩展搜索」——你可以输入一段混合了文字、图片、视频的复杂问题,AI不再只返回十个蓝色链接,而是直接给你出一份带图表的研究报告。

    现场演示了一个「帮我规划欧洲十日游」的例子:AI自动拉取了航班价格、酒店评价、景点开放时间,甚至还提醒你「5月22日巴黎有罢工,建议调整行程」。这种级别的个性化,背后是谷歌搜索团队攒了20年的数据在撑着。


    Gemini应用:从聊天机器人到生活管家

    过去一年,Gemini的月活从4亿涨到了9亿。谷歌显然不满足于只做一个「问答工具」,这次他们推出了两个新功能:

    • Daily Brief:每天早上给你生成一份个性化简报,整合了你的日历、邮件、新闻推送
    • Gemini Spark:任务管理助手,可以自动规划日程、提醒待办、甚至帮你给邮件分类

    这两个功能的逻辑很清楚:谷歌想让Gemini成为你每天第一个打开、最后一个关闭的应用。从「聊天」到「管家」,这个转型如果能跑通,谷歌在AI入口之争里的筹码就厚重多了。

    硬件:AI眼镜和Android XR

    谷歌在大会上展示了一副AI智能眼镜的原型机——可以实时翻译路标、识别商品信息、提供导航指引。现场演示的时候,工作人员戴着眼镜在舞台上走来走去,眼镜里的AI助手实时把英语字幕打在了镜片上。

    这东西目前看起来还比较粗糙,但方向是对的。Meta的Ray-Ban眼镜已经卖了100多万副,谷歌这时候进场,时间点不算晚,但也不算早。


    财报数字:AI投入的底气

    Alphabet今年第一季度的总营收是1099亿美元,同比增长22%。搜索和广告业务贡献了604亿美元——这些钱,很大一部分会投进AI研发里。

    谷歌的优势在于「垂直整合」:从TPU芯片到Gemini模型,再到Chrome浏览器和Android手机,整个技术栈都是自己的。这种打法,OpenAI和Anthropic短期内追不上。

  • CrewAI:51.9k Stars!轻量高性能多Agent协作框架,让AI团队像人一样分工合作

    CrewAI:51.9k Stars!轻量高性能多Agent协作框架,让AI团队像人一样分工合作

    CrewAI 多Agent协作框架

    CrewAI 官方示意图(图片加载失败时自动隐藏)


    🤖 项目简介

    CrewAI 是一个用于构建多智能体自动化系统的开源 Python 框架,核心定位是轻量、高性能、完全独立——它不依赖 LangChain 等任何外部 Agent 框架,从零构建,执行速度更快、资源占用更低。

    ✅ 一句话总结:让多个 AI Agent 像真实团队一样分工协作,自主完成复杂任务的开源框架。

    ⚙️ 安装要求和过程

    环境要求

    • 🐍 Python:≥ 3.10 且 < 3.14
    • 📦 推荐工具:uv(高性能 Python 包管理器)
    • 💻 操作系统:Windows / macOS / Linux 全平台支持
    • 🔧 可选依赖:Rust 编译器(tiktoken 编译失败时需安装)

    快速安装(3步搞定):

    # 1. 安装 crewai 基础包

    uv pip install crewai

    # 2. 安装包含常用工具的完整版

    uv pip install ‘crewai[tools]’

    # 3. 如需嵌入功能(知识库/RAG)

    uv pip install ‘crewai[embeddings]’

    ⚠️ 常见问题:若出现 tiktoken 模块缺失,安装对应嵌入依赖即可;若 tiktoken 编译失败,Windows 用户需安装 Visual C++ 生成工具。

    🔥 核心功能

    🤝 双模编排

    Crews(自主协作团队)+ Flows(事件驱动工作流)两种架构无缝结合,兼顾自主性与可控性。

    ⚡ 完全独立轻量

    从零构建,不依赖 LangChain,执行速度更快,资源占用更低,部署更简单。

    🎯 深度自定义

    支持从高层工作流到 Agent 内部提示词、执行逻辑的全链路自定义。

    🌐 多模型兼容

    支持 OpenAI、本地 Ollama、Anthropic 等多种 LLM 接入,灵活适配。

    🏢 企业级扩展(CrewAI AMP Suite)

    配套商业化企业套件,提供统一管控平台、可观测性、高级安全等企业特性,已有超过 10万名开发者通过官方课程完成认证。


    🚀 典型使用场景

    📝 场景一:自动化内容生成

    多个 Agent 分工协作——研究员负责搜集资料、写手负责撰写初稿、编辑负责润色定稿,全自动生成落地页或市场分析报告,效率提升 5-10倍

    📊 场景二:股票市场智能分析

    数据分析 Agent 抓取实时行情、研究 Agent 生成深度报告、审核 Agent 确保结论严谨,多角色协作输出专业级投资分析报告。

    ✈️ 场景三:个性化旅行行程规划

    理解用户偏好,自动规划包含交通、住宿、景点、美食的完整行程,并根据实时信息动态调整,比人工规划更全面。


    💡 推荐理由

    如果你正在做 AI 自动化多Agent系统,CrewAI 是目前最值得入手的框架之一。它不依赖 LangChain,意味着更少的依赖冲突、更快的调试周期、更清晰的问题定位。

    最让我印象深刻的是它的「双模编排」设计——Crews 模式让 Agent 自主协作,适合创意类和探索类任务;Flows 模式提供精准的流程控制,适合企业级生产场景。两套模式还能无缝结合,这种设计在当前的多Agent框架里是独一份的。

    🔗 官方文档非常完善,10万+认证开发者社区也很活跃,遇到问题基本都能找到答案。如果你用过 AutoGPT 或 LangChain Agent,切换到 CrewAI 会感受到明显的「轻快」体验。

    🎯 值得一试吗?

    值得!特别是你需要构建生产级多Agent系统的时候,CrewAI 是目前最成熟、最轻量的选择之一。


    📥 下载地址

    🌐 官方网站 https://crewai.com
    🐙 GitHub仓库 https://github.com/crewAIInc/crewAI ⭐ 51.9k
    📚 官方文档 https://docs.crewai.com
    🇨🇳 中文文档 https://docs.crewai.org.cn
    💬 Discord社区 https://discord.gg/X4JWnZnxPb

    开源项目系列第18期

  • 两千亿参数、原生全模态,智象未来把图像大模型卷到了新维度

    5月19日,智象未来在北京办了首届开放日,主题叫「Imagining the World」。会上最重磅的消息,是发布了参数超两千亿的图像大模型HiDream-O1-Image-Pro。

    告别「拼接味」,原生全模态才是正路

    现在市面上的图像生成模型,大多还是「拼接路线」——图像走一条路,文本走另一条路,最后拼在一起。这种做法在复杂语义理解、精准文字渲染上总是差点意思。

    HiDream-O1-Image-Pro换了个思路:把图像像素、文本标记和任务条件统一放进一个连续共享的标记空间,从底层就开始「混着学」。这个架构叫Unified Transformer(UiT),智象未来管它叫「原生全模态」。

    「当前很多『多模态大模型』,本质上还是『单模态拼接』。而原生多模态,是从一开始就把『世界的规则』刻进模型里——它知道物理定律、空间关系、因果逻辑,所以它能真正理解世界、推理世界,而不只是『生成内容』。」

    —— 智象未来创始人兼CEO 梅涛
    HiDream-O1-Image-Pro模型架构示意图
    HiDream-O1-Image-Pro架构示意图(图片来源:量子位)

    开源版已经打遍榜上无敌手

    其实在这之前,智象未来已经把8B参数的开源版本HiDream-O1-Image放到了全球评测平台Artificial Analysis上,结果在文生图开源模型里排到了全球第一,超过了Z-Image Turbo、Qwen-Image、FLUX.2这些主流对手。

    这次发布的Pro版是闭源版本,参数直接干到了两千亿以上,在复杂文本渲染、指令编辑、多主体个性化这些任务上全面刷新了SOTA纪录。

    半月内连融两轮,资本用脚投票

    开放日上还透露了一个信号:公司融资在提速。不久之前刚完成超5亿元融资,半月之内又敲定了新一轮,投资方包括深创投、金浦投资、财鑫资本、复聚资本等。

    现在的阵容很有意思:安徽、上海、湖南、杭州的多方产业基金在跟,深创投、东方富海、峰华资本这些头部市场化VC也在押注。这个资本组合,摆明了是要在「原生全模态」这个方向上重仓。

    商业化落地:三个智能体产品已经跑起来

    光有模型不够,智象未来同时亮出了三条产品线:

    • HiBurst:商业营销智能体,已覆盖TikTok、Meta、抖音、小红书等平台,是TikTok官方top5服务商,年生产电商营销视频超百万条
    • 帧赞:全球首个专业级AI影视创作智能体,已累计制作短漫剧超5000分钟
    • vivago:社媒创作智能体,近日登上Product Hunt日榜第一,覆盖全球100多个国家超4000万用户

    从视觉生成走向世界模型,这条路还长。但智象未来至少证明了一件事:原生全模态架构不是空中楼阁,它已经能打商业仗了。


  • 做短视频想爆却靠玄学?这个AI工具拿了700万美元,要把「什么能爆」变成系统工程

    现在打开社交媒体,到处都是播客片段、歌曲剪辑、电影高光时刻的短视频。你以为这是偶然刷到的,其实背后有一整套工业化流程在运转。

    管理零工创作者,是个脏活累活

    品牌方早就发现,30到90秒的短视频片段是性价比极高的营销方式。但他们面临一个运营噩梦:怎么管理成百上千名独立创作者?怎么知道哪类剪辑在哪个平台能爆?

    Clouted的做法是:搭建一套基础设施,自动处理剪辑流程的物流管理和投放策略制定。平台接入了超过10万名零工创作者来编辑片段,然后用AI确定推广这些片段的最佳社交媒体平台和目标受众。

    Clouted的AI会运行一个持续测试循环,尝试不同的格式和渠道策略,来找出实际表现最好的方案。随着系统积累有效数据,每次活动都会让下一次活动更具针对性和效率。

    创始人从电子音乐节起步

    Clouted联合创始人兼CEO Justin Banusing最初是把这套技术用在自己的爱好上——电子音乐和音乐节制作。他是一位资深DJ,用Clouted推广自己办的&Friends音乐节,现在这个活动已经吸引了超过2万名参与者。

    这种”自己先用好”的起步方式,在AI工具创业里其实挺常见的。先在一个垂直场景跑通,再横向扩展到更通用的营销基础设施市场。

    Clouted团队成员照片
    Clouted团队成员(图片来源:TechCrunch)

    700万美元种子轮,瞄准营销基础设施大市场

    这轮由Slow Ventures领投,Gold House Ventures、Weekend Fund、Peak XV的Surge等机构跟投。Clouted最终要对标的不是那些纯粹的剪辑工具,而是CreatorIQ和Hightouch这类营销基础设施玩家。

    Hightouch最近年度经常性收入(ARR)突破1亿美元,说明这个市场的空间够大,而且还在扩张。Clouted想做的,是把”哪些内容能爆”这件事,从玄学变成数据驱动的系统工程。