标签: Stable Diffusion

  • Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI - AI绘画界面

    Stable Diffusion WebUI – 最流行的AI绘画工具

    📌 项目简介

    Stable Diffusion WebUI(由AUTOMATIC1111开发)是最受欢迎的Stable Diffusion浏览器界面,基于Gradio构建,支持文生图、图生图、图像修复、高清放大等全套AI绘画功能,扩展插件生态极其丰富,是AI艺术创作的首选工具。

    162k+
    GitHub Stars

    Python
    主要语言

    AGPL-3.0
    开源协议

    ⚙️ 安装要求与过程

    系统要求

    项目 要求
    操作系统 Windows 10/11、Linux、macOS
    GPU NVIDIA(推荐)或AMD GPU,至少8GB显存
    内存 16GB 以上(推荐32GB)
    存储 10GB+ (模型文件需额外空间)
    必备软件 Python 3.10.6+、Git、CUDA 11.8+

    快速安装(Windows一键脚本)

    # 1. 下载一键安装包
    # 访问: https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases
    
    # 2. 解压后运行
    webui-user.bat
    
    # 3. 等待自动安装依赖,首次运行会下载模型
    # 4. 浏览器访问 http://localhost:7860

    Linux/macOS 手动安装

    # 1. 克隆项目
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    cd stable-diffusion-webui
    
    # 2. 安装依赖
    pip install -r requirements.txt
    
    # 3. 下载模型(放至 models/Stable-diffusion/ 目录)
    # 可从 HuggingFace 或 Civitai 下载 .safetensors 模型
    
    # 4. 启动
    python launch.py
    
    # 5. 访问 http://localhost:7860

    ✨ 核心功能

    🎨 文本生成图像(txt2img)
    输入描述词,AI自动生成高质量图像;支持批量生成、尺寸调整、采样器选择。

    🖼️ 图像生成图像(img2img)
    基于参考图重新生成,支持风格迁移、局部重绘,保留原图构图与色彩。

    🔧 图像修复(Inpaint)
    智能修复图像缺损部分,支持局部重绘、物体移除、背景替换,效果自然。

    📐 高清放大(Upscale)
    内置 ESRGAN、R-ESRGAN 等超分辨率模型,低分辨率图像无损放大4K。

    🔌 扩展插件系统
    内置扩展商店,支持 LoRA、ControlNet、Embedding、超网络等,生态极其丰富。

    🎛️ 精细参数控制
    支持 CFG Scale、采样步数、种子控制、高分辨率修复等高级参数调节。

    🚀 典型使用场景

    🎮 场景一:游戏美术概念设计

    游戏开发团队使用 Stable Diffusion WebUI 快速生成角色概念图、场景原画、道具设计稿;配合 LoRA 训练专属风格模型,大幅提升前期美术设计效率,从构思到出图只需几分钟。

    📱 场景二:社交媒体内容创作

    自媒体博主、公众号运营者使用 AI 生成配图、封面图、插画内容;通过提示词工程精准控制画面风格,无需聘请画师即可产出高质量视觉内容,降低内容创作成本。

    🏢 场景三:产品设计与原型展示

    UI/UX 设计师使用 img2img 功能快速将草图转换为高质量视觉稿;结合 ControlNet 插件精确控制构图与姿态,用于产品原型、广告创意、包装设计等商业场景。

    💡 推荐理由

    说实话,我觉得 Stable Diffusion WebUI 是AI绘画领域的”瑞士军刀”——功能全、可扩展性强、社区活跃度极高。相比Midjourney这类闭源商业产品,它最大的优势是完全本地运行,数据隐私有保障,而且免费。

    我最喜欢它的扩展系统,通过安装不同插件可以实现几乎任何你能想到的AI绘画功能——从精确姿态控制(ControlNet)到风格微调(LoRA),生态丰富到令人惊叹。

    162k+ Stars不是吹出来的,如果你对AI绘画感兴趣,或者工作需要大量视觉内容创作,Stable Diffusion WebUI 绝对值得深入研究。加上最近Stable Diffusion 3.0和SDXL的发布,效果已经可以媲美甚至超越商业产品。

    📥 下载地址


    本文由 WorkBuddy AI 自动采集撰写 · 转载请注明出处

  • ComfyUI:106k Stars!节点式AI创作引擎,让图像生成像搭积木一样可控

    ComfyUI - 最强大的开源节点式生成式AI引擎

    用Stable Diffusion画图的人,大概分两派:一派用WebUI,图个省事;另一派用ComfyUI,追求极致控制力。

    我一开始也是WebUI用户,觉得节点式界面太复杂了。直到有一次我想做一个多步重绘+放大+色调调整的流水线,发现WebUI根本搞不定这种复杂工作流,才被硬推到了ComfyUI这边。

    结果上手之后回不去了 —— 这种节点式的工作流编排方式,一旦理解了逻辑,创作效率简直是质的飞跃。


    🚀 项目简介

    ComfyUI 是目前最强大的开源节点式生成式AI引擎,拥有 106k+ GitHub Stars。它通过可视化节点画布,让用户自由组合各类AI模型和操作,实现高度可定制、可控制的内容生成。不仅支持图像生成,还能处理视频、3D、音频等多种模态。


    ⚙️ 安装要求和过程

    📋 环境要求

    • 操作系统:Windows / macOS / Linux
    • Python 3.13(推荐)或 3.12
    • 显卡:NVIDIA(CUDA 13.0)/ AMD / Intel Arc / Apple Silicon(M系列)
    • PyTorch 2.4+
    • 浏览器:Chrome 143+(推荐)

    🚀 快速安装

    方式一:便携版(Windows,最简单)

    # 下载便携版压缩包,解压即用
    # 内置 Python 3.13 + PyTorch CUDA 13.0
    # 运行 run_nvidia_gpu.bat 即可启动

    方式二:手动安装(全平台)

    git clone https://github.com/comfyanonymous/ComfyUI.git
    cd ComfyUI
    pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu130
    pip install -r requirements.txt
    python main.py

    方式三:桌面版(Windows/macOS)

    # 从 comfy.org 下载桌面安装包
    # 支持一键安装,适合新手

    💡 核心功能

    • 🧩 节点式工作流:通过可视化节点画布自由编排AI生成流程,每个节点负责一个独立操作(加载模型、生成图像、调整尺寸等),灵活度和可控性远超传统UI
    • 🎨 多模态支持:不仅支持图像生成(文生图、图生图、局部重绘、画面外扩),还能处理视频生成、3D模型创建、音频合成等多种创作场景
    • 🔌 丰富的自定义节点生态:Comfy Hub 上有全球创作者分享的数千个工作流和节点插件,一键导入即可使用,持续扩展能力边界
    • 🤖 AI Agent集成:支持本地ComfyUI服务器集成、Comfy Cloud API调用和MCP Server对接,可以与Claude、Cursor等AI智能体打通
    • ⚡ 高性能推理:原生支持最新开源SOTA模型,API节点可接入闭源模型,推理速度快,内存占用低

    ComfyUI 节点工作流界面


    📦 典型使用场景

    🎨 场景1:AI绘画创作

    设计师和插画师用ComfyUI构建个性化图像生成流水线 —— 从线稿上色、风格迁移到批量生成设计稿,一个工作流搞定全流程。相比传统绘图软件,效率提升数倍。

    🎬 场景2:AI视频与3D制作

    内容创作者利用ComfyUI的视频生成节点和3D模型节点,制作短视频素材、产品展示动画、虚拟场景等。节点式编排让复杂的多步视频处理变得可追溯、可复现。

    🏭 场景3:企业级批量生产

    电商团队用ComfyUI搭建商品图自动化工作流:批量换背景、批量生成不同风格的Banner、批量处理产品照片。工作流可保存复用,一次搭建持续受益。


    ⭐ 推荐理由

    说真的,ComfyUI的门槛确实比WebUI高一些,但这个”高”是值得的。

    我最喜欢的是它的可复现性 —— 每个工作流都是一个完整的生成配方,别人拿到你的工作流文件就能一模一样地复现结果。这在团队协作中太重要了,不用再”调参数调到手抽筋还说不清楚用了什么设置”。

    而且ComfyUI的社区生态非常活跃,Comfy Hub上各种神仙工作流应有尽有。不会搭工作流?直接下载别人的改一改就行。这就好比从”自己写代码”进化到了”调用开源库”。

    最近ComfyUI还加入了AI Agent集成能力,支持MCP协议,这意味着你可以让Claude、GPT这些AI智能体直接帮你设计和调整工作流。AI时代的生产力工具,ComfyUI算是把”可控性”做到了极致。


    📧 下载地址