用超分辨率扛把子算法 ESRGAN,训练图像增强模型
来源:HyperAI超神经 本文约3500字,建议阅读9分钟
本文为你介绍基于插值、重建、学习的三大 SR 研究方法。
内容一览:通过硬件或软件方法,提高原有图像的分辨率,让模糊图像秒变清晰,就是超分辨率。随着深度学习技术的发展,图像超分辨率技术在游戏、电影、医疗影像等领域的应用,也愈发广泛。
将图像或影片从低分辨率转化为高分辨率,恢复或补足丢失的细节(即高频信息),往往需要用到超分辨率技术。
根据所用低分辨率图像的数量,超分辨率技术可分为单幅图像的超分辨率 (SISR) 和多幅图像的超分辨率 (MISR)。
SISR 利用一张低分辨率图像,达到图像尺寸增大或像素的增加的效果,从而获得一张高分辨率图像。
MISR 则是借助同一场景中的多张低分辨率图像,获取不同细节信息,合成一张或多张高分辨率图像。MISR 的输出既可以是单幅图像,也可以是一个图像系列(即视频)。
引入容量更大、更易于训练的 Residual-in- Residual Dense Block (RRDB) 来改善网络结构,删除 BN (Batch Normalization) 层,用 residual scaling 和 smaller initialization 来改善深度网络的训练;
用 RaGAN 改进判别器,预测高分辨率图像跟原始图像之间的相对真实性而不是绝对值,从而使得生成器恢复原始图像更真实的纹理细节;
改进感知损失,把先前 SRGAN 中激活后的 VGG features 改为激活前执行,提高输出图像的边缘清晰度和纹理真实性。
快速上手 ESRGAN
开源协议:Apache License 2.0
安装环境:Python 3.6,TensorFlow 2.3.1
使用说明:该模型使用 DIV2K 数据集(双三次降采样的图像)中,大小为 128 x 128 的图像快进行训练
注意事项:运行教程请使用「使用ESRGAN进行图像超分辨率重建.ipynb」,按顺序运行 cell 即可;目录中 model 文件夹下为模型文件,esrgan-tf2_1.tar.gz 文件为模型压缩包(本教程运行中未使用压缩包)
现在访问 openbayes.com 并注册
即可享用
600 分钟/周的 vGPU
以及 300 分钟/周 的 CPU 免费计算时