Stable Diffusion web UIStable Diffusion Web 可视化方案-技术圈

Stable Diffusion Web 可视化方案，基于 Gradio 库。

特性

带图像的详细功能展示：

原始 txt2img 和 img2img 模式
一键安装并运行脚本（但仍然必须安装python和git）
Outpainting
Inpainting
Color Sketch
Prompt Matrix
Stable Diffusion Upscale
Loopback，多次运行img2img处理
X/Y/Z 图，一种绘制具有不同参数的 3 维图像图的方法
文本倒装
- 拥有任意数量的嵌入并使用您喜欢的任何名称
- 使用每个标记具有不同数量向量的多个嵌入
- 适用于半精度浮点数
- 在 8GB 上训练嵌入（还有 6GB 工作的报告）
附加选项卡包含：
- GFPGAN，修复人脸的神经网络
- CodeFormer，人脸修复工具，作为 GFPGAN 的替代品
- RealESRGAN，神经网络升级器
- ESRGAN，具有许多第三方模型的神经网络升级器
- SwinIR 和 Swin2SR（参见此处），神经网络升级器
- LDSR，潜在扩散超分辨率升级
调整宽高比选项
采样方法选择
- 调整采样器 eta 值（噪声乘数）
- 更高级的噪音设置选项
随时中断处理
4GB 显卡支持（也有 2GB 工作报告）
批次正确种子
实时提示令牌长度验证
Generation parameters
- 用于生成图像的参数与该图像一起保存
- 对于 PNG，在 PNG 块中；对于 JPEG，在 EXIF 中
- 可以将图像拖到PNG信息选项卡以恢复生成参数并自动将其复制到UI中
- 可以在设置中禁用
- 将图像/文本参数拖放到提示框中
读取生成参数按钮，将提示框中的参数加载到UI
设置页面
从 UI 运行任意 python 代码（必须运行--allow-code才能启用）
大多数 UI 元素的鼠标悬停提示
可以通过文本配置更改 UI 元素的默认/混合/最大/步长值
平铺支持，用于创建可以像纹理一样平铺的图像的复选框
进度条和实时图像生成预览
- 可以使用单独的神经网络来生成预览，几乎不需要 VRAM 或计算要求
否定提示，一个额外的文本字段，允许您列出您不想在生成的图像中看到的内容
样式，一种保存部分提示并稍后通过下拉菜单轻松应用它们的方法
变体，一种生成相同图像但有微小差异的方法
种子调整大小，一种生成相同图像但分辨率略有不同的方法
CLIP询问器，一个尝试从图像中猜测提示的按钮
提示剪辑，中代换提示的一种方式，比如说开始做西瓜，中途换成动漫少女
批处理，使用img2img处理一组文件
Img2img 交叉注意力控制的替代、反向欧拉方法
Highres Fix，一种方便的选项，只需单击一下即可生成高分辨率图片，而不会出现常见的扭曲
即时重新加载检查点
检查点合并，该选项卡允许您将最多 3 个检查点合并为一个
具有来自社区的许多扩展的自定义脚本
Composable-Diffusion，一种同时使用多个提示的方法
- 使用大写字母AND分隔提示
- 还支持权重提示：a cat :1.2 AND a dog AND a penguin :2.2
提示无 token 限制（原创稳定扩散最多可使用 75 个 token）
DeepDanbooru 集成，为动漫提示创建 danbooru 风格标签
xformers，选择卡的主要速度提升：（添加--xformers到命令行参数）
通过扩展：历史记录选项卡：在 UI 中方便地查看、定向和删除图像
生成永久选项
训练选项卡
- 超网络和嵌入选项
- 预处理图像：使用 BLIP 或 deepdanbooru（针对动漫）进行裁剪、镜像、自动标记
Clip skip
Hypernetworks
Loras（与 Hypernetworks 相同但更漂亮）
一个单独的 UI，您可以通过预览选择要添加到提示中的嵌入、超网络或 Loras
可以选择从设置屏幕加载不同的 VAE
进度条中的预计完成时间
应用程序编程接口
RunwayML支持专用修复模型
通过扩展：Aesthetic Gradients，一种通过使用剪辑图像嵌入来生成具有特定美感的图像的方法（https://github.com/vicgalle/stable-diffusion-aesthetic-gradients 的实现）
Stable Diffusion 2.0 支持 - 参阅wiki获取说明
Alt-Diffusion 支持 - 参阅wiki
以 safetensors 格式加载检查点
放宽分辨率限制：生成图像的尺寸必须是 8 的倍数而不是 64
从设置屏幕重新排序 UI 中的元素
......