DragDiffusion基于 Diffusion 模型的 AI 图像编辑工具
DragDiffusion 是 AI 图像编辑工具,通过利用 Diffusion 模型来控制基于点的交互式图像编辑。
DragDiffusion 受到了 DragGAN 的启发,后者实现了基于点的交互式图像编辑,并取得像素级精度的编辑效果。但是也有不足,DragGAN 是基于生成对抗网络 (GAN),通用性会受到预训练 GAN 模型容量的限制。
研究者将 DragGAN 这类编辑框架扩展到 Diffusion 模型,提出了 DragDiffusion。他们利用大规模预训练 Diffusion 模型,极大提升了基于点的交互式编辑在现实世界场景中的适用性。
工作原理
使用示例
评论