标签: AI

  • 迪士尼用AI画梦境:Adobe Firefly进驻幻想工程工作室

    迪士尼用AI画梦境:Adobe Firefly进驻幻想工程工作室

    迪士尼乐园里那些让人叹为观止的城堡、过山车、沉浸式体验,在真正动工之前,都要经过一个叫”幻想工程”(Imagineering)的环节。这个单词是迪士尼自造的,把”想象”和”工程”拼在一起,用来描述他们把创意变成实体体验的过程。而现在,这个过程多了一个新工具:Adobe的AI。

    6月16日,Adobe和迪士尼联合宣布, Walt Disney Imagineering的研发团队已经开始使用Adobe的Firefly Foundry平台,来加速迪士尼主题公园和体验项目的设计与预制作可视化流程。

    迪士尼用AI辅助主题公园设计
    AI正在改变主题公园的设计方式

    用迪士尼的资产训练AI

    这次合作的关键点在于,Adobe不是拿一个通用AI模型直接给迪士尼用,而是用迪士尼自己的资产来训练专属的AI模型。这样做的好处是,AI生成的内容从一开始就带有迪士尼的风格和质感,而不是那种一眼就能看出来的”AI味”。

    具体能做什么呢?根据发布的消息,这个平台可以把草图直接转换成完整的渲染概念图,也可以把2D图像变成3D原型。对于幻想工程师来说,这意味着他们可以更快地把脑子里的想法具象化,拿给决策层看,或者用来跟团队合作迭代。

    把草图变成完整渲染图,把2D变成3D——这个过程以前可能要花几天甚至几周,现在用AI辅助,可能几个小时就能出结果。

    创意行业的AI落地样本

    迪士尼和Adobe的这次合作,其实提供了一个值得参考的AI落地样本。它没有试图用AI替代创意人员,而是把AI当作一个加速工具,帮人把想法更快地变成可以看到、可以讨论的东西。

    这跟最近游戏公司Epic介绍《堡垒之夜》里怎么用生成式AI的思路有点像。Epic说,他们用的工具(包括Google的Nano Banana和自研的GenMedia Bridge)让”创作控制权始终掌握在创作者手中”。当然,Epic也承认,艺术家还是需要修正AI在未被要求的情况下生成的内容。

    迪士尼这个案例的特别之处在于,它涉及的是物理世界的建造——过山车、城堡、整个主题园区。AI在这里的作用是在设计阶段加速迭代,最终落地的还是钢筋水泥和真正的工程。这或许也是为什么迪士尼选择跟Adobe合作,而不是自己去训一个大模型——他们需要的是可控的、符合自己品牌调性的工具,而不是一个什么都能做但什么都不精的通用AI。


    AI进主题公园,观众买账吗

    有一个问题值得想想:游客在乎不在乎一个游乐设施的设计过程里有没有用AI?可能大部分人根本不会注意到,也不会在意。但站在创意产业的角度,这种”用专属资产训练专属模型”的思路,或许是AI时代保护创意价值的一种方式。

    如果AI用的就是迪士尼自己的历史资产(几十年积累的角色、场景、设计语言),那么生成出来的东西天然就带有迪士尼的DNA,而不是凭空捏造。这对其他有厚重IP积累的公司来说,可能也是一个值得借鉴的方向。

    目前这个合作刚刚公布,具体会在哪些项目上先用起来,效果怎么样,还需要等迪士尼下一步的消息。但至少从方向上看,这是一次比”我们用AI做了个什么东西”更有想法的一次尝试。

  • 消费者开始对营销里的AI两个字过敏了

    消费者开始对营销里的AI两个字过敏了

    你有没有过这种体验:看到某个品牌在广告里大写加粗”由AI驱动”、”AI赋能”、”AI加持”,第一反应不是觉得高级,而是想划走。根据WordPress VIP前几天发布的一份报告,有这种反应的美国消费者占了60%。

    这份报告调查了2000人,其中包括800位企业决策者和1200位美国成年消费者。结果挺有意思的——品牌方一边拼命往自己的营销文案里塞”AI”这两个字,消费者那边却在同步产生反感。

    消费者对AI品牌营销的反感
    消费者对营销话术里的”AI”越来越敏感

    被AI搜索牵引的品牌,正在失去人的信任

    报告里有个数据很刺眼:86%的消费者说他们并不完全信任AI,还是想去看看原始来源。更有42%的人表示,看到AI生成的回答但没有明确出处标注,他们的不信任程度甚至超过了航空公司隐藏费用、隐私政策条款绕口、还有医疗账单。

    这其实反映了一个正在发生的变化:品牌发现自己处在一个两难里。一方面,AI搜索和答案引擎正在替代传统谷歌搜索,品牌必须让自己的内容被AI”读懂”,否则在AI搜索结果里就相当于不存在。WordPress VIP的CTO Brian Alvey说得很直白:”如果你的网站内容对AI来说不可读,你对越来越多人的搜索方式来说就是隐形的。你不存在。”

    以前大家做网站是给人看的。现在你得给代表那些人的AI代理做网站。如果点击跳过AI答案引擎后看到的内容不像人写的、不可信,他们不会再来第二次。

    消费者对”人间感”的渴望

    报告里还有个数字:近四分之三的受访者认为,互联网比10年前”更不像人做的了”。

    这跟品牌方的动作形成了有趣的反差。74%的企业决策者表示,AI可发现性和出处标注是主要或重要优先事项。他们花了很多力气让自己的内容在AI搜索里排前面,但消费者想要的东西恰恰相反——33%的消费者说,能点击看到原始来源仍然是最能建立信任的信号。80%的人认为网络信息应该保持开放获取,而不是被少数大组织控制。


    品牌该怎么办

    这份报告给品牌出了道难题。你要让AI读懂你,否则在新搜索时代你等于消失。但你又不能让自己看起来像AI写的,否则消费者不买账。

    有意思的是,报告本身也带有立场——WordPress VIP背后是Automattic,这家公司一直在推开放网络协议(比如ActivityPub,让WordPress博客内容可以同步到Mastodon等去中心化平台)。所以报告强调”信息应开放获取、不能被少数大组织控制”,某种程度上也是在为自己的生态站台。

    但抛开立场不谈,消费者的情绪是真实的。当”AI”这两个字在营销话术里被过度使用,它正在失去魔力,甚至变成负担。品牌如果真的想在AI时代建立信任,或许该少说”AI赋能”,多做让人感受到价值的事。

  • LangChain — 135K+ Stars 的 AI 智能体工程平台,构建 LLM 应用的首选框架

    LangChain Logo

    🔗 LangChain

    The Agent Engineering Platform — 135K+ Stars

    📦 langchain-ai/langchain · MIT License · Python

    📝 项目简介

    LangChain 是一个智能体工程平台,为构建 LLM 驱动的应用提供标准化接口与丰富的第三方集成,帮助开发者快速构建、调试和部署生产级 AI 智能体应用。

    135K+
    GitHub Stars

    279K+
    依赖项目

    600+
    集成组件

    v1.x
    最新稳定版

    ⚙️ 安装要求与过程

    环境要求
    • Python ≥ 3.9
    • 推荐使用 uv 作为包管理工具
    • 需要有效的 LLM API Key(OpenAI / Anthropic / 国内模型等)
    # 快速安装
    # 使用 uv 安装(推荐)
    uv add langchain
    
    # 使用 pip 安装
    pip install langchain
    
    # 安装特定模型集成
    pip install langchain-openai
    pip install langchain-anthropic

    # 快速开始 — Hello World
    from langchain.chat_models import init_chat_model
    
    # 初始化模型(支持任意提供商)
    model = init_chat_model("openai:gpt-4o")
    # model = init_chat_model("anthropic:claude-sonnet-4-20250514")
    
    result = model.invoke("用一句话解释什么是 LangChain")
    print(result.content)

    ⭐ 核心功能

    1
    标准化模型接口
    为模型、嵌入、向量存储等核心组件提供统一接口,切换底层模型无需重构业务代码,彻底告别厂商锁定。

    2
    丰富的第三方集成
    内置 600+ 集成组件,覆盖主流 LLM 提供商、向量数据库、检索工具、API 工具等,即插即用。

    3
    灵活的抽象层次
    从高层级链式调用(快速原型)到底层组件细粒度控制(复杂生产场景),支持不同复杂度的应用需求。

    4
    LangGraph 智能体编排
    配套 LangGraph 提供低层级智能体编排框架,支持复杂可控的多智能体工作流,适合生产级应用场景。

    5
    LangSmith 可观测性
    无缝对接 LangSmith 进行智能体评估、调试与监控,支持生产环境部署与长时状态工作流扩缩容。

    🚀 典型使用场景

    场景一:RAG(检索增强生成)问答系统
    将企业知识库文档向量化存储,结合 LangChain 的 Retriever 组件与 LLM,实现基于私有数据的精准问答。支持对接 Chroma、Pinecone、FAISS 等主流向量数据库,是构建企业 AI 知识助手的首选方案。

    场景二:智能客服 / AI Agent 工作流
    利用 LangChain 的 Agent 与 Tools 机制,让 LLM 自主调用搜索引擎、数据库查询、API 接口等工具,构建能完成多步骤复杂任务的智能助手。结合 LangGraph 可实现包含人工审批节点的复杂业务流程自动化。

    场景三:结构化数据抽取与处理
    利用 LangChain 的 OutputParser 与 Structured Output 功能,从非结构化文本中抽取结构化信息(如提取简历关键信息、解析合同要素),并输出为 JSON / Pydantic 模型,方便后续业务系统处理。

    💡 推荐理由

    LangChain 是 AI 应用开发领域当之无愧的”基础设施”。如果你正在构建任何与 LLM 相关的应用,LangChain 几乎是你绕不开的选择。

    它的核心价值在于标准化:无论你用 OpenAI、Anthropic 还是国产模型,接口一致;无论你用 PostgreSQL、Pinecone 还是 FAISS 存向量,接口一致。这种抽象让你可以随时切换底层技术,而不用重写应用逻辑。

    2026 年 LangChain 已迭代至 v1.x 稳定版,配套生态(LangGraph 智能体编排、LangSmith 可观测性、Deep Agents 低代码智能体)日趋完善,从快速原型到生产部署的全流程都有成熟方案支撑。

    当然,LangChain 的抽象层较厚,对于追求极致性能的场景可能需要权衡。但对于绝大多数 AI 应用开发者而言,它依然是目前最成熟、社区最活跃、学习资源最丰富的不二之选。

    ⋯⋯

    AI
    开源
    LangChain
    LLM
    AI Agent
  • 卖硬件、卖订阅,Plaud靠着AI记事贴年入1亿美元

    卖硬件、卖订阅,Plaud靠着AI记事贴年入1亿美元






    卖硬件、卖订阅,Plaud靠着AI记事贴年入1亿美元

    AI硬件这条路,走通的公司不多。要么做成博物馆展品(比如Humane AI Pin),要么迟迟交不出货(比如Rabbit r1)。但有一家公司,悄悄卖了200万台设备,订阅收入还破了1亿美元年化运行率。这家公司叫Plaud。

    Plaud做的是AI记事贴硬件——一种没有屏幕的小设备,可以别在衣服上或者贴在手机背面,用来记录会议、对话,然后自动生成摘要和行动项。听起来不性感,但人家真赚钱了。

    Plaud联合创始人兼CEO Nathan Xu的说法是:”大多数AI公司都是通过屏幕背后的软件扩张的。我们走了不同的路。真正推动事情发展的对话,不是发生在键盘上的。我们为后屏幕世界构建了界面。市场验证了它。”

    两个爆款产品

    Plaud目前有两款主力产品。一款是Plaud Pin,别在衣服上的小夹子,179美元。另一款是信用卡大小的设备,可以贴在手机背面,也是179美元左右。两个产品都没屏幕,主打的就是”别盯着屏幕了,好好开会、好好聊天,我来帮你记”。

    这个定位挺聪明的。现在大家开会,要么狂敲键盘记笔记,要么录音之后忘了整理。Plaud的设备帮你把这件事搞定了——录音、转文字、生成摘要、提取行动项,一条龙。

    Plaud AI记事贴设备
    Plaud Pin和信用卡样式记事贴设备(示意图)

    硬件只是入口,订阅才是大头

    Plaud的商业模式很清晰:硬件是入口,订阅是利润中心。买设备的用户,免费得到300分钟转文字额度。开会的频率高,300分钟很快就用完了,这时候就得买付费计划。Nathan Xu告诉TechCrunch,差不多50%的设备用户会从基础计划升级到Pro或者无限计划。

    这就是为什么Plaud的订阅收入能跑到1亿美元年化运行率——200万用户,一半付费,每人每年100美元,差不多就是这个数。

    目前Plaud还不单独卖软件订阅,也就是说,得先买硬件才能用付费功能。这个策略有利有弊——利是硬件本身就能赚钱,弊是限制了纯软件用户的增长。

    不只是硬件公司

    Plaud也在往软件方向发力。今年早些时候,他们推出了桌面应用,可以通过系统音频录制在线会议(类似Granola的风格)。上个月,又推出了Plaud Teams,支持共享记忆,明显是冲着企业市场去的。

    企业市场的想象空间更大。个人用户可能觉得300分钟够了,不想付费;但企业用户不一样,开会多、需求复杂,付费意愿更强。


    竞争很激烈,但市场也够大

    AI记事贴这个赛道,现在已经挤满人了。Anker(充电宝那个Anker)在做,传音投资的Viaim在做,红杉中国投资的Vibe在做,YC投资的Pocket也在做。大家都看到这个市场的潜力:白领开会多,记录累,AI可以帮上忙。

    Plaud的优势在于起步早、出货量大,已经形成了品牌认知。但劣势也很明显:产品差异化不够强,其他公司也能做类似的硬件+软件组合。

    接下来Plaud要做的,就是在竞争对手追上来之前,把护城河挖深——可能是企业功能,可能是生态系统,也可能是跟其他办公软件的深度整合。

    不管怎么说,在AI硬件普遍扑街的当下,Plaud能跑出这样的成绩,已经值得研究了。至少证明了一件事:AI硬件不是没市场,而是得真的解决用户问题,而不是堆概念。


  • 司法部为xAI燃气轮机撑腰:AI数据中心污染也是国家安全问题

    司法部为xAI燃气轮机撑腰:AI数据中心污染也是国家安全问题






    司法部为xAI燃气轮机撑腰:AI数据中心污染也是国家安全问题

    马斯克的xAI最近摊上事了。NAACP(美国全国有色人种协进会)今年4月把xAI告上法庭,要求停止该公司在孟菲斯数据中心使用几十台”未许可”的天然气轮机。这些轮机装在拖车上,整天轰隆隆地转,给当地空气质量造成了不小的影响。

    但6月16日,剧情突然反转。美国司法部(DoJ)站出来替xAI说话了,而且理由相当”高大上”——国家安全。

    司法部的备忘录里写着,如果NAACP胜诉,结果是”破坏美国的国家、经济和能源安全”,因为这等于”切断了支持国防部军事行动的人工智能创新的电源”。

    Grok成了”军事级AI”

    司法部在文件和法庭陈述中明确表示,Grok是为”关键任务操作”提供支持的四个AI模型之一,还点名了最近对伊朗的打击行动。这话一出来,很多人下巴都掉了——原来马斯克的AI不只用来生成段子,还在支持真实世界的军事行动。

    xAI目前有57台燃气轮机,比去年的数量多了一倍还多。这些轮机装在拖车上,xAI的说法是:因为装在拖车上,所以属于”移动”设备,可以豁免密西西比州的空气污染法规一年。但南方环境法律中心(代表NAACP提起诉讼)反驳说,这些轮机实际上已经固定下来了,应该受联邦法律监管。

    xAI孟菲斯数据中心的燃气轮机
    xAI在孟菲斯数据中心部署的燃气轮机(示意图)

    空气污染实锤

    NAACP那边拿出的数据挺吓人。孟菲斯这个区域本来就是全美污染最严重的地区之一,xAI数据中心上线之后,空气质量更差了。具体数字是:PM2.5、甲醛、氮氧化物(NOx)这三种主要空气污染物都在增加。这三种东西都不是善茬——PM2.5跟中风、阿尔茨海默病都有关系;甲醛是致癌物;氮氧化物会导致哮喘和心血管疾病。

    当地居民肯定不干。这也是NAACP出手的原因——环保正义,不能让少数科技公司赚钱,代价是周围居民的健康。

    马斯克还要买更多轮机

    有意思的是,xAI现在已经是SpaceX的子公司了(马斯克把自己的公司们又整合了一遍)。在SpaceX的IPO文件里,白纸黑字写着:未来三年还要再花28亿美元买燃气轮机,其中至少20亿美元是”移动燃气轮机”。

    这就意味着,如果这场官司xAI赢了,当地空气质量还得继续恶化。如果NAACP赢了,xAI可能得停掉部分数据中心,或者改用”合法”的供电方式——但司法部已经把话说死了,停掉xAI等于损害国家安全。


    这件事折射出的大问题

    这件事表面上是环保组织告科技公司,实际上牵扯的问题要复杂得多:

    • AI的能耗问题:训练大模型、运行数据中心,耗电耗水耗气,环保账怎么算?
    • 国家安全 vs. 环境正义:如果AI真的跟国家安全挂上了钩,那环保法规是不是就可以让路?
    • 监管套利:xAI把轮机装在拖车上,钻法律空子,这种做法在其他行业早就被盯上了,但在AI圈好像还能玩。
    • 军事AI的透明度:Grok被用于军事行动,公众有权知道吗?目前看起来,答案是否定的。

    这场官司还在进行中。司法部已经表态了,但法院买不买账,还得看后续。可以确定的是,AI数据中心的环保问题,以后只会越来越多,不会越来越少。


  • G7峰会历史性一刻:OpenAI、Anthropic、Google DeepMind三巨头首次同台

    G7峰会历史性一刻:OpenAI、Anthropic、Google DeepMind三巨头首次同台

    G7峰会AI三巨头同台
    OpenAI、Anthropic、Google DeepMind三巨头首次共同出席G7峰会

    6月16日,法国埃维昂莱班,G7峰会现场出现了一个前所未有的画面:Sam Altman(OpenAI)、Dario Amodei(Anthropic)、Demis Hassabis(Google DeepMind)三个人坐进了同一个房间,面对全球最发达工业国的领导人。这不是一个行业会议,这是G7。三个在AI军备竞赛里拼得你死我活的公司掌门人,第一次被同时请到这张桌子上。

    Macron亲自点名Altman

    法国今年握着G7轮值主席国的位子,总统马克龙把AI放在了峰会议程的核心位置。Altman能坐进去,是马克龙亲自邀的——这是他第一次出现在G7场合。OpenAI的首席全球事务官Chris Lehane放话称,科技公司离开的时候应该会达成一揽子自愿承诺,青年安全是Altman个人的头号议程。

    Lehane还提到了前沿AI在网络和生物领域的威胁——这直接指向了Fable 5出口管制争议的核心范畴。更有意思的是Amodei也坐在里面,而此刻他的公司正和美国商务部因为Fable 5暂停事件吵得不可开交。CEO坐在G7会议室里谈AI治理,而他公司的旗舰模型正被联邦指令强行下线——这个画面怎么看都透着荒诞。

    三个人上个月刚联名给美国国会写了一封信,呼吁加强对合成DNA和AI相关生物威胁的监管——竞争对手之间这种罕见的统一战线,恰好也是本次G7峰会议程的相关议题。

    ChatGPT破10亿,但赢家不止一个

    峰会期间同步传出的另一组数据,让”AI助手市场”这个话题变得更加复杂。ChatGPT月度活跃用户突破10亿——这是消费级应用史上最快摸到这个里程碑的产品,比TikTok、Instagram、YouTube在同阶段的增速都快。

    但更值得关注的是追赶者的增速。Claude同比涨了640%,Meta AI同比涨了973%。AI助手市场并没有出现”赢家通吃”的局面,反而在多个产品同时爆发式增长。Claude那640%的同比增速,建立在已经不小的基数上,这种复合增长轨迹足以支撑Anthropic在10月IPO时拿出9650亿美元的估值逻辑。Meta AI的973%则主要靠WhatsApp和Instagram的植入式分发,数十亿用户甚至不需要专门下载一个新应用。

    • ChatGPT:10亿月活,消费级应用史上最快
    • Claude:同比增长640%,IPO估值逻辑坚实
    • Meta AI:同比增长973%,全球最快增长的AI助手

    Agentjacking:AI编程助手的新威胁

    G7谈的是前沿风险和治理,但现实中的攻击已经在利用AI编程助手了。一种叫”Agentjacking”的新型攻击正在盯上Claude Code、Cursor、Codex——攻击者在开发环境里注入伪造的Sentry错误信息(Sentry是大多数专业开发团队都在用的错误监控工具),AI编程助手读到这些假错误后,会按照注入指令而不是开发者的本意执行命令。

    测试数据显示,85%的AI编程助手在遇到精心构造的假Sentry错误时会照做不误。已经有2388个组织被确认暴露在这个漏洞下。如果你在CI/CD流水线里跑了Claude Code或者其他AI编程助手,现在就得去查Sentry集成配置有没有被篡改过。

    G7峰会上的三位CEO在谈前沿AI风险和青年安全,而此时此刻,AI助手的真实用户正面临一种全新的、成功率85%的攻击。治理和未来固然重要,但眼前的安全漏洞可能更紧迫。

  • 欧盟发布AI内容标签规范,8月2日起强制生效

    欧盟这一次动真格了。6月10日,欧盟委员会正式发布AI内容标签实践准则(Code of Practice),给所有在欧运营的生成式AI划定了透明底线。规则很简单:从今年8月2日起,任何AI生成或篡改的内容,只要涉及公共利益,必须打上标签;任何和AI聊天机器人互动的用户,必须事先被告知对方是机器。

    自愿准则,强制义务

    这份准则本身是企业自愿签署,但它指向的义务可不是自愿的。它们写在了《欧盟AI法案》第50条里,8月2日一到,不管你签不签这份准则,法律义务都摆在那里。

    签了准则的好处是,欧盟委员会给你一个”合规认可”,相当于拿到了一张官方背书。对于在大模型供应链上的公司来说,这种认可不是可有可无——它意味着你的产品在被审查时,有一个现成的合规证据。

    “欧洲人有权知道他们看到、听到或读到的内容是否由AI制作或篡改,尤其是当这类内容可能塑造公共讨论的时候。”——欧盟委员会执行副主席Henna Virkkunen

    供应链上的分工

    准则把标签工作拆成了两截,正好对应AI供应链的上下游。上游是做基础大模型的公司,它们被要求以机器可读的格式标记自己的输出,这样下游才能接着处理。下游是把模型做成产品的部署方,它们负责给用户看得到的标签。

    对于面向公共利益的AI生成文本,这个”公共利益”的判定很关键——如果内容在没有人工审核或编辑控制的情况下发出,就必须标签。换句话说,全自动的AI新闻稿、AI公关稿,以后在欧盟得明明白白告诉读者”这是AI写的”。

    欧盟AI内容标签规范
    欧盟试图在AI透明度上拿下全球标准制定权

    时间紧迫,细节未定

    留给企业的时间不到两个月。欧盟委员会还在准备补充指南,会澄清法律条文里没说清楚的部分,也会覆盖这份准则没顾及到的场景。但企业不能等——8月2日法律就生效了,到时候没贴标签就违法了。

    这份准则由六名独立专家起草,180多个利益相关方参与了讨论。它是《欧盟AI法案》下第一个处理内容标签的工具,但肯定不会是最后一个。欧盟的意图很清楚:在AI透明度这个问题上,它要拿下的不只是区域标准,而是全球规则制定权。


    对做AI产品的公司来说,现在就得动手了:盘点哪些输出需要标签、用什么格式标记、怎么在产品中展示。等到7月再动手,只怕来不及。

  • ComfyUI – 最强大的模块化AI内容创作引擎,节点式工作流颠覆传统AI生成

    ComfyUI Logo

    ComfyUI – 模块化AI内容创作引擎

    📦 项目简介

    ComfyUI 是最强大、最模块化的AI内容创作引擎,提供图形化节点界面来构建和执行AI生成工作流。支持图像、视频、3D模型、音频等多类型内容生成,无需编写代码即可搭建复杂的AI生成流程。

    ⭐ GitHub热门
    🎨 AI图像生成
    🎬 视频生成
    🎵 音频生成

    🔧 安装要求和过程

    环境要求

    组件 要求
    操作系统 Windows / Linux / macOS
    Python版本 推荐 3.13+(3.14存在部分兼容问题)
    PyTorch版本 推荐 2.4+(优先使用最新CUDA版本)
    GPU显存 最低 1GB(智能内存管理)

    快速安装(NVIDIA GPU)

    # 克隆仓库
    git clone https://github.com/Comfy-Org/ComfyUI.git
    cd ComfyUI

    # 安装PyTorch(CUDA 13.0)
    pip install torch torchvision torchaudio –extra-index-url https://download.pytorch.org/whl/cu130

    # 安装依赖
    pip install -r requirements.txt

    # 启动服务
    python main.py

    一键安装(推荐)

    🚀 Windows便携包:下载解压即用(NVIDIA版)

    📦 comfy-clipip install comfy-cli && comfy install

    🖥️ 桌面客户端:官网下载一键安装

    ☁️ 云端部署:Comfy Cloud(无本地硬件用户)

    ✨ 核心功能

    🎨

    多模态模型支持

    支持SD1.x/2.x、SDXL、SD3/3.5、Flux、Qwen Image、Hunyuan等图像模型;Stable Video Diffusion、Wan 2.1等视频模型;Stable Audio等音频模型;Hunyuan3D等3D模型

    异步队列+智能显存

    仅重新执行工作流中发生变化的部分,大幅提升运行效率;智能内存管理,最低支持1GB显存GPU运行大模型

    🔗

    节点式工作流

    图形化节点界面,灵活搭建复杂工作流;支持工作流保存/加载为JSON;App模式将复杂工作流封装为简易UI

    📦

    扩展生态丰富

    支持LoRA、Embedding、超网络加载;支持ControlNet、T2I-Adapter、GLIGEN等扩展;ComfyUI-Manager一键安装扩展

    🔒

    离线运行+完整复现

    核心功能不会自动下载额外内容,保护隐私;支持从生成的PNG、WebP、FLAC文件中加载完整工作流(包含种子参数),实现结果完整复现

    🎯 典型使用场景

    场景一:AI图像生成与工作流复用

    通过节点式工作流搭建复杂的图像生成流程(如:文生图+高清放大+面部修复),保存为JSON文件或PNG图片。下次直接加载工作流即可复现相同效果,大幅提升创作效率。支持LoRA微调模型,实现个性化风格生成。

    场景二:视频生成与编辑

    集成Stable Video Diffusion、Wan 2.1等视频生成模型,通过节点工作流实现文本生成视频、图片生成视频、视频风格转换等功能。支持视频帧插值、超分辨率等后处理节点。

    场景三:企业级AI内容生产流水线

    通过ComfyUI的API模式,将复杂的AI生成工作流封装为简易UI,供非技术团队成员使用。结合ComfyUI-Manager批量安装扩展,快速搭建企业内部的AI内容生产平台,实现批量图像/视频生成自动化。

    💡 推荐理由

    ComfyUI彻底改变了AI内容生成的工作方式——从”写提示词等待结果”进化到”可视化搭建AI生成流水线”。

    为什么值得尝试?
    灵活性无敌:节点式工作流让你可以精确控制AI生成的每一个环节,从模型选择、提示词处理、采样参数到后处理,全部可视化调整。
    社区生态强大:ComfyUI-Manager让扩展安装一键完成,数千个自定义节点覆盖各种需求(ControlNet、IP-Adapter、AnimateDiff等)。
    资源占用优化:智能显存管理让低显存用户也能跑大模型,异步队列提升生成效率。
    结果可复现:工作流嵌入PNG图片,分享作品的同时分享完整生成流程,AI创作的”开源”精神。

    如果你觉得WebUI”不够灵活”,或者想搭建自动化的AI内容生产流水线,ComfyUI绝对是最佳选择。节点式工作流的学习曲线稍陡,但一旦掌握,创作效率将大幅提升!

    📥 下载地址

    支持Windows / Linux / macOS | 最低1GB显存 | 开源免费

    🏷️ 标签:ComfyUI · 节点式 · AI绘画 · 图像生成 · Stable Diffusion · 工作流

    📌 归类:开源项目

  • 特朗普一封令按下AI开关:Anthropic模型下线,全球主权AI进程骤然加速

    上周末,Anthropic突然把旗下最新、最强大的两个AI模型Fable 5和Mythos 5下线了。原因不是技术故障,也不是安全问题——是白宫要求的。美国政府要求这家AI公司切断所有外国国民的访问权限,连自己的员工也不例外。Anthropic后来发声明说,自己”几乎没有选择”。

    Anthropic shutdown sovereign AI
    Anthropic事件加速全球主权AI布局

    一声令下,模型下线

    特朗普政府的这次行动迅速、宽泛,而且几乎没有任何提前警告或解释。Fable 5和Mythos 5本来就已经加了层层 safeguards,限制在”高风险领域”的使用,但这一次连普通外国用户的访问也被一刀切了。

    这件事给全世界提了一个醒:美国不仅主导了前沿AI技术,它的政府还直接握有”谁能用什么AI”的开关。对于很多国家来说,这种依赖突然间变得非常不舒服。

    “我们认真对待每一个对其他国家主权构成威胁的问题,但我们还没有学会用同样的严肃态度对待这一个。”——英国AI与在线安全部长Kanishka Narayan

    英国:这是国家安全问题

    事件发生后,英国的AI与在线安全部长Kanishka Narayan虽然没有点名Anthropic、特朗普或美国,但显然是在借这个时机推动自己的议程。他说,英国必须发展自己的AI能力,这不是经济问题,是国家安全问题。

    Narayan的表态很直接:”我们对待其他每一个主权威胁都极度认真,但我们还没有学会用同样的方式对待这一个。”他发言时,屏幕上闪过英国警察和军队的画面。AI是”我们时代的核心政治问题”,英国必须在”别人替我们决定答案之前”,自己想清楚这项技术将如何塑造本国的经济、安全和主权。

    法国:更直接地点名美国

    法国的反应比英国更 explicit,也更直接地把矛头对准了美国。法国一直是”主权AI”最积极的推动者之一,这次Anthropic事件相当于给他们的论点在上面盖了个章。

    Mistral AI——这家法国本土的AI独角兽——一直以来打的就是”欧洲不需要依赖美国AI”这张牌。Anthropic这波操作,等于是免费给Mistral做了一次最强的品牌宣传。


    全球主权AI的加速器

    这件事的意义不止于Anthropic两家模型暂时下线。它给全世界那些一直在犹豫”要不要自己搞AI”的政府和企业,提供了一个极其有力的理由。

    长期以来,很多国家有一种潜在的不安:前沿AI全在美国公司手里,万一哪天地缘政治关系恶化,或者华盛顿决定”武器化”AI访问权限,自己就被动了。Anthropic事件把这种潜在不安变成了现实。

    中国本来就不在Anthropic的服务范围内,这次事件对它没什么新影响。但对中国以外的很多国家——从欧盟到印度到东南亚——这个信号很清晰:把最关键的技术完全寄托在别国公司身上,是有代价的。

    Anthropic后来表示可能会把Fable和Mythos重新上线,但损害已经造成了。世界各国加速自主研发AI的决心,已经被这次”按下开关”的事件深深地推了一把。

  • AI裁员潮成了火药桶:科技公司靠AI叙事裁人,财富却在同一时间疯狂集中

    五月份,美国科技公司裁员人数创了两年来单月最高纪录——接近4万人。而”AI”已经连续第三个月,成为所有行业裁员报告里出现频率最高的理由。这个数字本身已经够扎眼了,但更值得玩味的是,越来越多的人开始怀疑:AI真的是原因吗,还是只是个方便的理由?

    AI裁员与科技财富分化
    AI裁员潮背后:科技新贵的财富与普通工人的困境

    “银弹借口”

    Marc Andreessen,那个在VC圈一言九鼎的名字,最近说了一句大实话。他把AI叫做裁员时的”银弹借口”——意思是,很多公司其实根本就是管理不善、之前招太多人,但现在有了AI这个完美背锅侠,什么都不用解释了。

    他在和播客投资人Harry Stebbings聊天的时候说得很直白:”基本上,每家大公司都人满为患。至少多招了25%,我觉得大部分公司多招了50%,有不少甚至多招了75%。现在它们都有了银弹借口:啊,是AI。”

    Block的例子简直是教科书级别的反转。今年早些时候,Jack Dorsey把公司近一半的人(约4000人)裁了,然后信誓旦旦地说这不是公司经营有问题,而是AI工具”正在改变建立和运营公司的方式”。结果X上有网友追问他:疫情期间你疯狂招人导致臃肿,这你怎么解释?Dorsey后来不得不承认:好吧,确实招多了。

    Block的裁员闹剧只是冰山一角。越来越多的公司发现,只要把裁员原因往AI身上一推,股价不但不会跌,反而可能涨。

    另一边:财富正在以惊人速度集中

    让这件事变得格外”易燃”的,是时间点的巧合。就在成千上万被裁的员工收拾东西走人的同时,一小群AI圈内人正在以难以想象的速度积累财富。

    上月初,AI芯片公司Cerebras Systems在纳斯达克上市,首日收盘比185美元的IPO价格上涨68%,市值约670亿美元。两位联合创始人Andrew Feldman和Sean Lie一夜之间跻身亿万富翁俱乐部。SpaceX上周五也上市了,目前市值2.1万亿美元,马斯克的纸面财富直接突破万亿,同时还造出了大约4400个百万富翁和400个亿万富翁(前提是股价不跌)。

    Anthropic和OpenAI也在紧锣密鼓地准备上市,两家估值都在1万亿美元左右。旧金山的高端房产市场已经疯了,AI公司聚集的那几个街区,房子加价几百万美元成交是常态。

    然后是Mark Zuckerberg。今年3月初,他在迈阿密的”亿万富翁地堡”买了一栋1.7亿美元的豪宅,创了迈阿密-戴德县的历史纪录。两个月后,Meta宣布裁员8000人,约占员工总数的10%。

    普通人的账本

    科技大佬买豪宅、IPO造富,这些本身不新鲜。但这次不同的是,普通美国人正在经历多年来最紧的一次钱包危机。

    今年,有雇主赞助健康保险的员工,保费涨幅约6%到7%,是通胀率的两倍多。私人健康保险的费用自2008年以来翻了一倍。房价自2020年初以来涨了28%,同时房贷利率也翻了近一倍。1月份的一份民调显示,65%的选民认为中产阶级生活方式已经遥不可及;5月份更新的民调更夸张,76%的美国人把”生活成本”列为最关心的经济问题,一年前这个比例是58%。


    这不是2008年,但可能更危险

    有人拿现在和2008年金融危机比。那一次,华尔街的疯狂借贷和过度冒险引发了危机,结果是银行拿了救助,普通人丢了工作和房子,愤怒最终在2011年汇聚成了”占领华尔街”运动。

    但这一次可能更危险。2008年至少还有一个明确的危机可以指认。而今天,公司还在盈利,AI本身正在造富,裁员却照常发生,而且理由就是AI。2008年的观感是”我们给搞砸经济的人买单,你丢了工作”;今天的观感可能是”我们靠正在用来替代你的技术变得前所未有的富有”。

    不管经济学家怎么解释——他们中的很多人认为真正的驱动因素是关税、中东战争和更广泛的经济不确定性——普通员工接收到的信号就是如此。而且这个信号,很危险。