stable-diffusion-webui 是什么?

Stable Diffusion web UI(AUTOMATIC1111/stable-diffusion-webui)是 Stable Diffusion 的网页图形界面,用 Gradio 实现,把文生图(txt2img)、图生图(img2img)、修复(inpainting)、扩展(outpainting)、放大、提示词控制等本地图像生成能力集中到一个浏览器界面里。它功能极其丰富,长期是本地玩 Stable Diffusion 的事实标准 GUI,支持低显存(4GB 甚至更低)、丰富采样器、Textual Inversion 训练、扩展生态等。AGPL-3.0 许可,约 163,252 stars,主语言 Python。仓库最后更新约在 2026 年 3 月,功能成熟、活跃开发已放缓。

⭐ 162,149 Stars 🍴 30,221 Forks Python AGPL-3.0 作者: AUTOMATIC1111
来源:README.md(标题、Features);GitHub 仓库元数据(stars=163252、language=Python、license=AGPL-3.0、topics stable-diffusion) 查看 GitHub 仓库 →

为什么值得关注

Stable Diffusion 开源后,本地出图需要一个易用且强大的界面,A1111 WebUI 凭借一键安装、海量功能(采样器、放大、修复、提示词权重、X/Y/Z 对比、Textual Inversion、扩展生态等)与对低显存的友好支持,迅速成为社区最主流的 SD GUI,star 极高、教程与扩展生态庞大。需说明:它聚焦原版/早期 SD 与 SDXL 等生态,近年活跃开发放缓(很多用户转向 ComfyUI 等做新模型与工作流);生成图像需遵守模型许可、版权与平台政策,避免侵权或不当用途。截至数据采集约 163,252 stars。

来源:README.md(Features 的一键安装/低显存/扩展);GitHub 仓库元数据(stars=163252、pushed_at 2026-03)

核心功能

txt2img / img2img 等模式

文生图、图生图、inpainting/outpainting、放大、变体、Highres Fix 等完整出图功能。

来源:README.md(Features)
丰富提示词与采样控制

注意力权重语法、负向提示、Styles、Prompt Editing、多种采样器与噪声设置。

来源:README.md(Features 的 Attention/Negative prompt/Sampling)
放大与人脸修复

集成 RealESRGAN/ESRGAN/SwinIR/LDSR 放大与 GFPGAN/CodeFormer 人脸修复。

来源:README.md(Features 的 Extras tab)
扩展生态与低显存

可通过扩展接入第三方功能,支持 4GB 甚至更低显存与一键安装。

来源:README.md(Features 的 4GB 支持、一键安装;扩展机制)

技术架构

WebUI 用 Python + Gradio 构建:本地加载 Stable Diffusion 模型权重(checkpoint),在浏览器界面提供 txt2img/img2img 等模式,调用 PyTorch 做推理。功能模块化且极多:注意力权重语法、负向提示、采样方法与噪声设置、Highres Fix 高清修复、放大(RealESRGAN/ESRGAN/SwinIR/LDSR 等)、人脸修复(GFPGAN/CodeFormer)、Textual Inversion 训练、Checkpoint Merger、CLIP interrogator、X/Y/Z 参数对比、生成参数随图保存与还原等;通过扩展(extensions)机制接入第三方功能(如 ControlNet 等)。支持低显存优化(4GB 甚至更低)与一键安装脚本(需先装 Python 与 git)。

来源:README.md(Features 列表);GitHub 仓库元数据(language=Python、topics gradio/pytorch)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) PyTorch Gradio(界面) Stable Diffusion 模型权重Stable Diffusi… 放大/修复模型(RealESRGAN/GFPGAN/CodeFormer 等)放大/修复模型(R… txt2img / img2img 等模式txt2img / img2img… 丰富提示词与采样控制 放大与人脸修复 扩展生态与低显存 stable-diffusion-webui 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python框架Stable Diffusion 网页 GUI(Gradio + PyTorch)
PyTorchGradio(界面)Stable Diffusion 模型权重放大/修复模型(RealESRGAN/GFPGAN/CodeFormer…
本地运行(需 Python + git),支持低显存 GPU;AGPL-3.0
来源:README.md(标题、Features);GitHub 仓库元数据(language=Python、topics gradio/torch)

快速上手

需先安装 Python 与 git,再用仓库提供的一键安装/运行脚本拉起 WebUI(Windows/Linux/macOS 有对应说明),首次会下载依赖;准备好 SD 模型 checkpoint 放入对应目录后,在浏览器界面用 txt2img/img2img 出图,并按需用放大、修复、扩展等功能。低显存可用相应优化参数(支持 4GB 甚至更低)。注意:从 UI 运行任意 Python 代码需显式加 --allow-code,且生成内容须遵守模型许可、版权与平台政策。详见仓库 Wiki。
来源:README.md(Features 的一键安装、--allow-code、Wiki 链接)

使用场景

适合想在本地用 Stable Diffusion 出图的创作者、设计师与爱好者:文生图/图生图创作、图像修复与扩展、放大与人脸修复、提示词与采样实验、Textual Inversion/嵌入训练、批量处理,以及通过扩展接入 ControlNet 等高级控制。适合注重本地、可控、可定制与扩展生态的场景。生成与使用图像需遵守模型许可与版权,避免侵权或不当内容。

来源:README.md(Features 列表)

优势与局限

优势

  • 功能极其丰富、生态庞大,是本地 SD 的事实标准 GUI
  • 一键安装、对低显存友好(4GB 甚至更低)
  • 采样/提示词/放大/修复/训练等一应俱全,扩展机制强
  • 社区教程与扩展极多,AGPL-3.0 开源

局限

  • 活跃开发放缓,新模型/工作流很多用户转向 ComfyUI 等
  • 功能繁多导致界面与参数复杂,新手有学习成本
  • AGPL-3.0 对集成/分发有较强 copyleft 约束
  • 出图需遵守模型许可与版权,注意不当用途风险
来源:README.md(Features);GitHub pushed_at、license=AGPL-3.0

最新版本

本页未列具体版本号;WebUI 通过 GitHub Releases 与一键脚本更新。仓库最后更新约在 2026 年 3 月,功能已相当成熟、活跃开发放缓;新模型与复杂工作流的社区重心部分转向 ComfyUI 等。

来源:README.md(Features);GitHub pushed_at

总结评价

Stable Diffusion web UI(A1111)是本地玩 Stable Diffusion 的事实标准图形界面:用 Gradio 把文生图/图生图、修复、放大、人脸修复、提示词与采样控制、Textual Inversion 训练与庞大扩展生态集于一身,一键安装且对低显存友好,社区教程与扩展极多,对本地出图的创作者非常实用。要清楚它活跃开发已放缓、新模型/工作流社区重心部分转向 ComfyUI、功能繁多有学习成本、AGPL-3.0 有较强 copyleft 约束、出图需遵守模型许可与版权。作为 SD 本地 GUI 的奠基性项目,功能与生态分量极重。

来源:综合 README.md 的定位、功能矩阵、生态与维护现状
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 16:29. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件