一张照片攻破人脸识别系统:能点头摇头张嘴,网友:太可怕!
共 2230字,需浏览 5分钟
·
2021-12-09 21:54
相关阅读:杭州程序员从互联网跳央企,晒一天工作和收入,网友:待一年就废
来源丨量子位(ID:QbitAI)
行早 发自 凹非寺
只需要一张照片的那种。
△ 图源:央视网微博
在视频的演示中我们可以看到,随便一个人,用一段包含点头、摇头、说话等动作的驱动视频。
但这样动起来之后,结果可就不一样了。搜索公众号互联网架构师回复“2T”,送你一份惊喜礼包。
△ 图源:央视网微博
让照片动起来的DeepFake
虽然央视网这次并没有直接点名具体所涉及到的技术。
但从效果上来看,DeepFake就可以做到这点。
DeepFake大家很熟悉了,简单来说有两种基本方法。
第一种是将两个人的大量面部照片输入编码器,编码器在压缩图像的同时提取出其面部共同特征。搜索公众号互联网架构师回复“2T”,送你一份惊喜礼包。
然后在恢复图像时,把第一个人的压缩照片输入另一个人的解码器中复原,产生“交换“面部的效果。
第二种是生成对抗网络(GAN),让两个AI算法(生成器和判别器)相互对抗。
由生成器输入随机噪声并转化为图像添加到真实图像中,经判别器判别。
经过大量的循环和训练后,二者都得到改进,能够输出不存在的逼真人脸。
△ 图源:3DCAT
但传统的DeepFake需要有大量的原始数据,并且要经过好几天的训练才能达到高质量的效果。
若是想达到实时的效果,怎么办?
黎颢(没错,就是那个杀马特教授)团队就提出,将DeepFake和他此前做的paGAN结合到一起,做了一个新系统。
如此以来,在不需要大量训练数据的情况下,这个系统也可以实时地渲染出合成图像。
paGAN弥补了DeepFake需要大量训练数据的不足,简单来说就是把训练的工作量都放到台下去做。
实时渲染有三个问题需要克服:
需要处理大量数据以及使用更深层网络训练更好的模型,需要生成高分辨率帧并且能够并行或者安排任务。
而paGAN预先经过大量的训练,分析过很多图片的面部和表情。这样内部数据模型就可以在接触到新的图形时做出“条件反射”。
再加上paGAN使用了新的ML方法和更好的底层优化,达到了实时渲染的效果。搜索公众号互联网架构师回复“2T”,送你一份惊喜礼包。
△ 图源:3DCAT
张钹:人脸识别算法非常不安全
而这样逼真的DeepFake人脸处理,只是诸多方法中的一种。
中科院院士、清华大学人工智能研究院院长张钹,也称这种算法很不安全,非常容易受到攻击:
△ 图源:央视网微博
而一旦人脸验证被攻破,一些门禁验证,支付验证都可能形同虚设。
这无疑给每个人的信息安全带来了巨大的隐患。搜索公众号互联网架构师回复“2T”,送你一份惊喜礼包。
对此,网友表示:早已没什么隐私可言了,相对于人脸识别还是密码更可靠。