CVPR 2021专题1:GAN的改进
共 2163字,需浏览 5分钟
·
2021-09-27 00:26
点击上方“机器学习与生成对抗网络”,关注星标
获取有趣、好玩的前沿干货!
1,Directional GAN: A Novel Conditioning Strategy for Generative Networks
图像是营销活动、网站和横幅的主要形式之一。这可能需要设计师花费大量时间来生成此类专业的内容。提出一种简单而新颖的调节策略,针对无条件图像生成任务训练的生成器生成给定语义属性的图像。
方法基于修改潜在向量,使用潜在空间中相关语义属性的方向向量,处理离散(二类、多类)的和连续的图像属性。
2,Image Generators with Conditionally-Independent Pixel Synthesis
现有的生成器网络一般都依赖空间卷积、或者自注意力模块,然后以由粗到细的方式逐渐合成图像。
本文提出一种新的生成器架构,其中每个像素的颜色值是根据随机潜在向量的值和该像素的坐标独立计算的,在合成过程中不涉及跨像素传播信息的空间卷积或类似操作。
3,Efficient Feature Transformations for Discriminative and Generative Continual Learning
随神经网络越来越多地应用于实际中,解决数据分布差异、偏移和序列任务学习等问题、不会“遗忘”至关重要。通过增加模型容量来学习新任务,同时避免灾难性遗忘,但可能很耗算力。
基于连续学习提出一种特征图转换策略,为学习新任务提供了更好的灵活性,而这只需在基础架构中添加最少的参数即可实现。
4,A Sliced Wasserstein Loss for Neural Texture Synthesis
在风格迁移或者GAN里,经常通过以目标分类识别任务而优化好的网络(例如 VGG-19),利用其提取特征激活,从而获取统计数据来计算纹理损失;其本质数学问题是测量特征空间中两个分布之间的距离。Gram-matrix loss 是这个问题的普遍近似,但它有一些缺点。
本文推广Sliced Wasserstein Distance,实现简单,效果更好。
5,Regularizing Generative Adversarial Networks under Limited Data
GAN模型依赖大量的训练数据,这项工作提出一种在有限数据上训练鲁棒 GAN 模型的正则化方法。在理论上展示了正则化损失和称为 LeCam-divergence 的 f-divergence 之间的联系,它在有限的训练数据下更加稳健。https://github.com/google/lecam-gan
6,Training Generative Adversarial Networks in One Stage
生成对抗网络 (GAN) 有着繁琐的训练过程,生成器和判别器交替更新。本文研究仅在一个阶段就可以有效地训练 GAN。
基于生成器和判别器的对抗性损失,将 GAN 分为两类,对称 GAN 和非对称 GAN,并引入了一种新的梯度分解方法来统一这两者,能够在一个阶段训练这两个类,减轻训练难度。
7,Posterior Promoted GAN with Distribution Discriminator for Unsupervised Image Synthesis
本文研究者认为生成器中需要有足够的关于真实数据分布的信息,这是GAN生成能力的关键点。但目前GAN及其变体缺乏这一点,导致训练过程脆弱。
本文提出了一种新的 GAN 变体,即Posterior Promoted GAN(P2GAN),它使用判别器产生的后验分布中的真实信息来提升生成器。与 GAN 的其他变体不同,判别器将图像映射到多元高斯分布并提取真实信息;生成器使用 AdaIN 后的真实信息和潜码。实验结果表明,P2GAN 在无监督图像合成方面取得了与GAN最先进的变体相当的结果。
猜您喜欢:
CVPR 2021 | GAN的说话人驱动、3D人脸论文汇总
附下载 |《TensorFlow 2.0 深度学习算法实战》