Stable Diffusion web UIStable Diffusion Web 可视化方案

联合创作 · 2023-09-26 07:05

Stable Diffusion Web 可视化方案,基于 Gradio 库。



特性


带图像的详细功能展示



  • 原始 txt2img 和 img2img 模式

  • 一键安装并运行脚本(但仍然必须安装python和git)

  • Outpainting

  • Inpainting

  • Color Sketch

  • Prompt Matrix

  • Stable Diffusion Upscale

  • Loopback,多次运行img2img处理

  • X/Y/Z 图,一种绘制具有不同参数的 3 维图像图的方法

  • 文本倒装

    • 拥有任意数量的嵌入并使用您喜欢的任何名称

    • 使用每个标记具有不同数量向量的多个嵌入

    • 适用于半精度浮点数

    • 在 8GB 上训练嵌入(还有 6GB 工作的报告)


  • 附加选项卡包含:

    • GFPGAN,修复人脸的神经网络

    • CodeFormer,人脸修复工具,作为 GFPGAN 的替代品

    • RealESRGAN,神经网络升级器

    • ESRGAN,具有许多第三方模型的神经网络升级器

    • SwinIR 和 Swin2SR(参见此处),神经网络升级器

    • LDSR,潜在扩散超分辨率升级


  • 调整宽高比选项

  • 采样方法选择

    • 调整采样器 eta 值(噪声乘数)

    • 更高级的噪音设置选项


  • 随时中断处理

  • 4GB 显卡支持(也有 2GB 工作报告)

  • 批次正确种子

  • 实时提示令牌长度验证

  • Generation parameters

    • 用于生成图像的参数与该图像一起保存

    • 对于 PNG,在 PNG 块中;对于 JPEG,在 EXIF 中

    • 可以将图像拖到PNG信息选项卡以恢复生成参数并自动将其复制到UI中

    • 可以在设置中禁用

    • 将图像/文本参数拖放到提示框中


  • 读取生成参数按钮,将提示框中的参数加载到UI

  • 设置页面

  • 从 UI 运行任意 python 代码(必须运行--allow-code才能启用)

  • 大多数 UI 元素的鼠标悬停提示

  • 可以通过文本配置更改 UI 元素的默认/混合/最大/步长值

  • 平铺支持,用于创建可以像纹理一样平铺的图像的复选框

  • 进度条和实时图像生成预览

    • 可以使用单独的神经网络来生成预览,几乎不需要 VRAM 或计算要求


  • 否定提示,一个额外的文本字段,允许您列出您不想在生成的图像中看到的内容

  • 样式,一种保存部分提示并稍后通过下拉菜单轻松应用它们的方法

  • 变体,一种生成相同图像但有微小差异的方法

  • 种子调整大小,一种生成相同图像但分辨率略有不同的方法

  • CLIP询问器,一个尝试从图像中猜测提示的按钮

  • 提示剪辑,中代换提示的一种方式,比如说开始做西瓜,中途换成动漫少女

  • 批处理,使用img2img处理一组文件

  • Img2img 交叉注意力控制的替代、反向欧拉方法

  • Highres Fix,一种方便的选项,只需单击一下即可生成高分辨率图片,而不会出现常见的扭曲

  • 即时重新加载检查点

  • 检查点合并,该选项卡允许您将最多 3 个检查点合并为一个

  • 具有来自社区的许多扩展的自定义脚本

  • Composable-Diffusion,一种同时使用多个提示的方法

    • 使用大写字母AND分隔提示

    • 还支持权重提示:a cat :1.2 AND a dog AND a penguin :2.2


  • 提示无  token 限制(原创稳定扩散最多可使用 75 个 token)

  • DeepDanbooru 集成,为动漫提示创建 danbooru 风格标签

  • xformers,选择卡的主要速度提升:(添加--xformers到命令行参数)

  • 通过扩展:历史记录选项卡:在 UI 中方便地查看、定向和删除图像

  • 生成永久选项

  • 训练选项卡

    • 超网络和嵌入选项

    • 预处理图像:使用 BLIP 或 deepdanbooru(针对动漫)进行裁剪、镜像、自动标记


  • Clip skip

  • Hypernetworks

  • Loras(与 Hypernetworks 相同但更漂亮)

  • 一个单独的 UI,您可以通过预览选择要添加到提示中的嵌入、超网络或 Loras

  • 可以选择从设置屏幕加载不同的 VAE

  • 进度条中的预计完成时间

  • 应用程序编程接口

  • RunwayML支持专用修复模型

  • 通过扩展:Aesthetic Gradients,一种通过使用剪辑图像嵌入来生成具有特定美感的图像的方法(https://github.com/vicgalle/stable-diffusion-aesthetic-gradients 的实现)

  • Stable Diffusion 2.0 支持 - 参阅wiki获取说明

  • Alt-Diffusion 支持 - 参阅wiki

  • 以 safetensors 格式加载检查点

  • 放宽分辨率限制:生成图像的尺寸必须是 8 的倍数而不是 64

  • 从设置屏幕重新排序 UI 中的元素

  • ......

浏览 37
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报