Stable Diffusion web UIStable Diffusion Web 可视化方案

联合创作 · 2023-09-26 07:05

Stable Diffusion Web 可视化方案,基于 Gradio 库。

特性

带图像的详细功能展示

  • 原始 txt2img 和 img2img 模式
  • 一键安装并运行脚本(但仍然必须安装python和git)
  • Outpainting
  • Inpainting
  • Color Sketch
  • Prompt Matrix
  • Stable Diffusion Upscale
  • Loopback,多次运行img2img处理
  • X/Y/Z 图,一种绘制具有不同参数的 3 维图像图的方法
  • 文本倒装
    • 拥有任意数量的嵌入并使用您喜欢的任何名称
    • 使用每个标记具有不同数量向量的多个嵌入
    • 适用于半精度浮点数
    • 在 8GB 上训练嵌入(还有 6GB 工作的报告)
  • 附加选项卡包含:
    • GFPGAN,修复人脸的神经网络
    • CodeFormer,人脸修复工具,作为 GFPGAN 的替代品
    • RealESRGAN,神经网络升级器
    • ESRGAN,具有许多第三方模型的神经网络升级器
    • SwinIR 和 Swin2SR(参见此处),神经网络升级器
    • LDSR,潜在扩散超分辨率升级
  • 调整宽高比选项
  • 采样方法选择
    • 调整采样器 eta 值(噪声乘数)
    • 更高级的噪音设置选项
  • 随时中断处理
  • 4GB 显卡支持(也有 2GB 工作报告)
  • 批次正确种子
  • 实时提示令牌长度验证
  • Generation parameters
    • 用于生成图像的参数与该图像一起保存
    • 对于 PNG,在 PNG 块中;对于 JPEG,在 EXIF 中
    • 可以将图像拖到PNG信息选项卡以恢复生成参数并自动将其复制到UI中
    • 可以在设置中禁用
    • 将图像/文本参数拖放到提示框中
  • 读取生成参数按钮,将提示框中的参数加载到UI
  • 设置页面
  • 从 UI 运行任意 python 代码(必须运行--allow-code才能启用)
  • 大多数 UI 元素的鼠标悬停提示
  • 可以通过文本配置更改 UI 元素的默认/混合/最大/步长值
  • 平铺支持,用于创建可以像纹理一样平铺的图像的复选框
  • 进度条和实时图像生成预览
    • 可以使用单独的神经网络来生成预览,几乎不需要 VRAM 或计算要求
  • 否定提示,一个额外的文本字段,允许您列出您不想在生成的图像中看到的内容
  • 样式,一种保存部分提示并稍后通过下拉菜单轻松应用它们的方法
  • 变体,一种生成相同图像但有微小差异的方法
  • 种子调整大小,一种生成相同图像但分辨率略有不同的方法
  • CLIP询问器,一个尝试从图像中猜测提示的按钮
  • 提示剪辑,中代换提示的一种方式,比如说开始做西瓜,中途换成动漫少女
  • 批处理,使用img2img处理一组文件
  • Img2img 交叉注意力控制的替代、反向欧拉方法
  • Highres Fix,一种方便的选项,只需单击一下即可生成高分辨率图片,而不会出现常见的扭曲
  • 即时重新加载检查点
  • 检查点合并,该选项卡允许您将最多 3 个检查点合并为一个
  • 具有来自社区的许多扩展的自定义脚本
  • Composable-Diffusion,一种同时使用多个提示的方法
    • 使用大写字母AND分隔提示
    • 还支持权重提示:a cat :1.2 AND a dog AND a penguin :2.2
  • 提示无  token 限制(原创稳定扩散最多可使用 75 个 token)
  • DeepDanbooru 集成,为动漫提示创建 danbooru 风格标签
  • xformers,选择卡的主要速度提升:(添加--xformers到命令行参数)
  • 通过扩展:历史记录选项卡:在 UI 中方便地查看、定向和删除图像
  • 生成永久选项
  • 训练选项卡
    • 超网络和嵌入选项
    • 预处理图像:使用 BLIP 或 deepdanbooru(针对动漫)进行裁剪、镜像、自动标记
  • Clip skip
  • Hypernetworks
  • Loras(与 Hypernetworks 相同但更漂亮)
  • 一个单独的 UI,您可以通过预览选择要添加到提示中的嵌入、超网络或 Loras
  • 可以选择从设置屏幕加载不同的 VAE
  • 进度条中的预计完成时间
  • 应用程序编程接口
  • RunwayML支持专用修复模型
  • 通过扩展:Aesthetic Gradients,一种通过使用剪辑图像嵌入来生成具有特定美感的图像的方法(https://github.com/vicgalle/stable-diffusion-aesthetic-gradients 的实现)
  • Stable Diffusion 2.0 支持 - 参阅wiki获取说明
  • Alt-Diffusion 支持 - 参阅wiki
  • 以 safetensors 格式加载检查点
  • 放宽分辨率限制:生成图像的尺寸必须是 8 的倍数而不是 64
  • 从设置屏幕重新排序 UI 中的元素
  • ......
浏览 13
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报