终于有人把生成对抗网络(GAN)讲明白了
导读:简而言之,机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术,而本文的主角——生成对抗网络则是深度学习中的一种分类。
它们之间的关系可以通过图1-11清晰地表示。
▲图1-11 人工智能、机器学习、深度学习与生成对抗网络四者的关系
01 从机器感知到机器创造
机器学习与深度学习在过去几年取得了重大突破,尤其是深度学习的发展让计算机具备了非常强大的感知能力,计算机可以感知物体、识别内容,甚至理解人们说的话。
从机器学习到深度学习的不断发展过程中,机器一直在不停地模仿人类的思维方式,希望能像人一样思考,但仅仅具备感知能力似乎是不够的,人类思维能力的迷人之处更在于它的创造能力,我们希望计算机能够自己创作艺术作品,如写诗、谱曲、作画等。
越来越多的研究者将自己的研究方向从机器感知转向了机器创造,希望通过生成技术能够让计算机具备生成新事物的能力。在生成技术的研究中,本文的主角——生成对抗网络应运而生,它打破了人们对传统生成模型的理解,并取得了非常令人满意的效果。
要了解生成对抗网络,不得不先认识一下“生成对抗网络之父”Ian Goodfellow(见图1-17,以下简称Ian)。
▲图1-17 GAN 发明者:Ian Goodfellow
Ian本科与研究生在斯坦福大学计算机科学专业就读,读博士时期在蒙特利尔大学研究机器学习,师承深度学习的顶级大师Yoshua Benjo(业界公认他与Geoffre Hinton、Yann LeCun并列为深度学习领域的“三驾马车”),而生成对抗网络正是Ian在蒙特利尔大学读博士期间提出的想法。
Ian在毕业后先后在Google和OpenAI进行深度学习相关的研究,在此期间对GAN的持续发展做出非常大的贡献。
Ian发明生成对抗网络是出于一个偶然的灵感,当时他正在蒙特利尔大学和其他博士生一起进行生成模型的研究,他们想通过该生成模型让计算机自动生成照片。
当时他们的想法还是希望使用传统的神经网络方法,希望通过模拟人的大脑思考方式来进行图片的生成。但是生成的图像质量始终不理想,如果继续对现在的模型进行优化,需要非常大量的训练数据集,而且最终的可行性也不得而知。
当时的Ian对使用传统神经网络的方式产生了怀疑,他认为也许这并非最理想的解决方案。一天晚上,他突然想到一种全新的思路,如果不是只用一个神经网络,而是同时使用两个神经网络,会不会有更好的效果呢?
这一想法为他打开了一种全新的思路,在Ian的构思中,两个神经网络并非合作关系,而是一种博弈与对抗的关系(见图1-18),这就是生成对抗网络最初的思想。
▲图1-18 图片来自《麻省理工科技评论》的2018十大技术突破
就如同人类自身在发展过程中经历的那样,只有在和同类竞争的环境下,对于某项技能的学习才会更加快速,比如各类比赛,尤其是体育类竞赛每年的成绩都在不断逼近人类极限,这其中有很大一部分原因在于比赛选手之间的比拼与较劲。
如果从仿生学的角度来看,其实在生物的发展过程中也有类似的状态,在与其他物种,尤其是与天敌的对抗中,自身会不断进化,从而向着一个更完善的状态转变。
这一理论是由进化生物学家Leigh Van Valen在1973年总结提出的,称为“红皇后假说”——一种关于生物协同进化的假说,物种间为了争夺有限的资源,不得不持续优化自身以对抗自身种族的捕食者与竞争者。而对于该物种的捕食者与竞争者来说,也同样需要不断进化来获取相应的资源。
Ian是一个非常果敢的执行派,同时也是一个代码高手,在基础理论大致清晰了之后,他立刻就开始了实践,并且在最初的几次实践中,这种对抗的思想就在实验数据的图像生成上取得了非常理想的效果。
生成对抗网络这种全新的技术为人工智能领域在生成方向上带来了全新突破。在之后的几年中,生成对抗网络成为深度学习领域中的研究热点,近几年与GAN有关的论文数量也急速上升(见图1-19),网络上有人整理了近年来的GAN模型,截至2018年2月已经有350多个,数量仍然在持续增加。
▲图1-19 GAN 论文数量趋势图
深度学习“三驾马车”中的另外一位顶级专家Yann LeCun(纽约大学教授,前Facebook首席人工智能科学家)称赞生成对抗网络是“过去20年中深度学习领域最酷的思想”,而在国内被大家熟知的前百度首席科学家Andrew Ng也把生成对抗网络看作“深度学习领域中一项非常重大的进步”。
在机器学习顶级会议NIPS2016上,为Ian专门开设了关于GAN的主题演讲(见图1-20)。
▲图1-20 Ian 在NIPS2016大会上进行分享
在2018年,这一对抗式神经网络的思想被《麻省理工科技评论》评选为2018年全球十大突破性技术(10BreakthroughTechnologies)之一。
2018年10月,由法国艺术创作团队Obvious使用GAN算法生成的画作以43万美元的高价被拍走,价格甚至远超同场拍卖的毕加索作品,这一事件也飞速提升了GAN在大众中的影响力。
https://deephunt.in/the-gan-zoo-79597dc8c347
02 什么是生成对抗网络
让我们先用一个小例子来认识一下生成对抗网络。首先来认识一下生成对抗网络的两方——生成器与判别器,在训练过程中两者的配合非常重要。
我们可以把生成器想象成一个古董赝品制作者(虽然这一比喻可能不太合适),其成长过程是从一个零基础的“小白”慢慢成长为一个“仿制品艺术家”。
而鉴别器担任的则是一个古董鉴别专家的角色,它一开始也许仅仅是一个普通等级的“鉴别师”,在与赝品制作者的博弈中它逐渐成长为一个技术超群的鉴别专家。
如图1-21所示,下面我们就以赝品制作与鉴别为例来说明生成对抗网络的工作原理。让我们来看一下最初的情况是怎样的:赝品制作者还是个什么都不懂的“小白”,也不懂真实的古董到底应该是什么样子,完全凭借自己的心意随意制作产品。
▲图1-21 生成对抗网络:创作者与鉴别师
面对简单易分辨的仿制品,初级鉴别者即便功力不深也能够一眼分辨出真假。在分辨完成的同时,鉴别者会将自己的判断结果写成报告,比如做工不精细、颜色不协调等。第一次对抗就这样完成了,似乎离我们期待的目标还非常远,但是没关系,这才刚刚开始。
现在进入第二阶段,仿造者通过一些渠道,拿到了鉴别者的判断报告,他认真研读了里面的每一条信息,根据这些信息重新制作赝品,虽然他依然不知道真实古董到底是什么样子,但他希望改进后的赝品能够骗过鉴别者。
这一次创作的赝品比之前的确实要成熟不少。到了鉴别者这边,当他再次拿到赝品和真品时,要重新判断作品的真假。这一次他也发现赝品制作者的能力有所提升,为了区分真假作品,他需要花时间去寻找一些更深入的区别点。
当然,一番努力过后,鉴别师顺利完成了任务,同时他也如第一次一样,将他区分真假的理由写成报告(之后依然会流出到赝品制作者手里)。第二次对抗到这里也完成了。
当然,对抗远远没有结束,如同上述的故事一直持续了很多很多次……
在经历了N次的互相博弈以后,两者在整个训练过程中都变得非常强,其中的仿造者几乎能制作出以假乱真的作品,而鉴别者也早已是“火眼金睛”的鉴别专家了。
最后一次博弈是这样的:赝品制作者已经完全摸透了鉴别师的心理,虽然他还是没有见过真的古董是什么样子,但是对古董应该具备什么样的特性已经十拿九稳,对于可能的鉴别过程也都了然于心。
对于如此以假乱真的赝品,虽然鉴别者拥有“火眼金睛”,但已然是无能为力了,他可以做的只能是凭运气猜测是真是假,而无法用确定的理由进行判断。
这也就是生成对抗网络最终的目的,而我们所需要做的就是培养出这个能够以假乱真的生成器。
关于作者:史丹青,语忆科技联合创始人兼技术负责人,毕业于同济大学电子信息工程系。拥有多年时间的AI领域创业与实战经验,具备深度学习、自然语言处理以及数据可视化等相关知识与技能。是AI技术的爱好者,并拥抱一切新兴科技,始终坚信技术分享和开源精神的力量。
本文摘编自《生成对抗网络入门指南》(第2版),经出版方授权发布。
延伸阅读《生成对抗网络入门指南》(第2版)
推荐语:揭秘AI如何生成逼真人脸图像,追踪GAN前沿技术更新。
推荐阅读
(点击标题可跳转阅读)
老铁,三连支持一下,好吗?↓↓↓