英伟达提出GAN的全新训练方式,数据可减少10到20倍!大数据文摘关注共 1342字,需浏览 3分钟 ·2020-12-21 16:22 大数据文摘出品来源:VB编译:陈之炎 英伟达的研究人员创造了一种增强方法来训练生成对抗性网络(GAN),与先前的方法相比,这种方法需要的数据量相对更少。 英伟达的这种GAN网络,可用于风景画等艺术作品的创作,还可制作一些用于视频会议的作品。(GAN是人工智能的一种形式,它将生成器网络与鉴别器网络相匹配,以创建图像或视频。) 训练GANs可能需要10万张以上的图像,但论文“利用有限数据训练生成对抗性网络”中提出了一种称为自适应鉴别器增强(ADA)的方法,利用这种方法训练GAN,可使需要的数据减少10到20倍。 “小型数据集的关键问题是:鉴别器会产生过拟合,训练开始发散,使得生成器的反馈变得毫无意义‘论文中这样描述’通过在多个数据集上进行训练,结果证明,现在只使用几千张图片就可以取得好的结果,而Style GAN2的训练结果则需要与更少的图像匹配。” 今年早些时候,来自Adobe Research、MIT和清华大学的研究人员详细介绍了GANS增强的另一种方法DiffAugment。 英伟达副总裁,图学研究员David Luebke声称,做过实用数据科学的人都知道:大部分时间都用在收集和管理数据上,这通常称为ETL管道:提取、转换和加载。他说:“仅这一项工作就需要大量实地数据科学人员,我们认为这种方法非常有用,因为你无需巨量的数据,也能获得有用的结果。” 他说:“对于那些没有大量时间对数据进行标注的数据科学人员来说,这一点变得尤为重要。” 论文的作者认为:减少数据约束可以授权研究人员检查GANs的新用例。除了创造人或动物的假照片外,研究人员认为GAN可能在医学成像数据中得到应用。 “如果有一位专门研究某一特定领域的放射科医生......让他或她坐下来给你贴上5万张照片的标签可能不太现实......但是让他们贴上1,000张照片的标签似乎是完全可能的。这的确降低了数据科学家需要投入的数据管理的工作量,从而方便了研究工作,“Luebke说。 在世界上最大的年度AI研究会议——NeurIPS会议上,作为神经信息处理网络的一部分,本周发表了一篇详细介绍该方法的论文。 “用有限的数据训练生成对抗性网络”并不是唯一与GAN相关的论文。另一篇研究论文介绍了鉴别器驱动的潜在抽样(DDLS),利用CIFAR-10数据集进行评估时,DDLS提高了GAN的性能。这篇论文是由MILA魁北克人工智能研究所和谷歌大脑研究人员合作撰写,作者包括Yoshua Bengio和Hugo Larochelle,蒙特利尔谷歌大脑小组组长,NeurIPS会议常务主席。 相关报道:https://venturebeat.com/2020/12/07/nvidia-researchers-devise-method-for-training-gans-with-less-data/志愿者介绍后台回复“志愿者”加入我们点「在看」的人都变好看了哦! 浏览 8点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 英伟达研究出用较少数据集训练GAN的方法Python中文社区047分钟,BERT训练又破全新纪录!英伟达512个GPU训练83亿参数GP...新智元0ViT 训练的全新baseline机器学习与生成对抗网络0英伟达把P图软件GAN了数据派THU0ViT训练的全新baseline!数据派THU0ViT训练的全新baseline!机器学习实验室0英伟达把P图软件GAN了开发者技术前线0yolov7-pytorch可用于训练自己的数据集机器学习AI算法工程0谷歌ViTGAN | 视觉Transformer训练的GAN机器学习与生成对抗网络0英伟达调整的思考公众号改版,及时收到文章推送需要给公众号加星。大家可以点击页面上方蓝色字【京北夜光】,进入公众号首页,点右上角“...”,点下方“设为星标”。坚持复盘总结分享不容易,点右上角点个在看并分享到朋友圈,看完顺手点个点赞和在看,算是个认可,感谢。本文首发于公众号(建议关注):近期NV高点回调,主要系黄仁勋点赞 评论 收藏 分享 手机扫一扫分享分享 举报