面部识别必看!5篇顶级论文了解如何实现人脸反欺诈、跨姿势识别等-技术圈

新智元报道

来源：lionbridge

编辑：鹏飞

【新智元导读】面部识别或面部识别是计算机视觉中最大的研究领域之一。许多公司都投资于面部识别技术的研究和开发。本文筛选了5篇非常重量级的有关人脸识别的机器学习论文，并提炼出论文最关键的信息。来新智元 AI 朋友圈与AI大咖一起讨论吧～

面部识别是计算机视觉中最大的研究领域之一。现在，我们可以使用面部识别来解锁手机，在安全门上验证身份，并在某些国家/地区进行刷脸支付。许多公司都投资于面部识别技术的研究和开发，本文将重点介绍其中的一些研究，并介绍五篇有关人脸识别的机器学习论文。

1. 大规模多模式人脸反欺诈的数据集和基准

随着大量实际应用，人脸识别技术变得越来越重要。从智能手机解锁到人脸验证付款方式，人脸识别可以在许多方面提高安全性和监视能力。

但是，该技术也带来一些风险。可以使用多种面部欺诈方法来欺诈这些系统。因此，面部防欺诈对于防止安全漏洞至关重要。

为了支持面部反欺诈研究，本文的作者介绍了一种名为CASIASURF的多模式面部反欺诈数据集。截止本文撰写之日，它是最大的面部反欺诈开放数据集。

具体来说，该数据集包括以RGB，深度和IR方式从1000个主题中拍摄的21000个视频。除了数据集外，作者还提出了一种新颖的多模式融合模型，作为面部反欺诈的基准。

发布/最近更新– 2019年4月1日

作者和投稿人–Shifeng Zhang (NLPR, CASIA, UCAS, China) , Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macau, China), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, China), Sergio Escalera (University of Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, China).。

https://arxiv.org/pdf/1812.00408v3.pdf

2. FaceNet：人脸识别和聚类的统一嵌入

在本文中，作者提出了一种称为FaceNet的面部识别系统。

该系统使用深度卷积神经网络优化嵌入，而不是使用中间瓶颈层。作者指出，该方法最重要的方面是系统的端到端学习。

该团队在CPU集群上训练了卷积神经网络1000到2000小时。然后，他们在四个数据集上评估了他们的方法。

值得注意的是，FaceNet在著名的野外标记人脸（LFW）数据集上的准确性达到99.63％，在Youtube Faces数据库上达到95.12％。

发布/最近更新– 2015年6月17日

作者和撰稿人– Florian Schroff, Dmitry Kalenichenko, and James Philbin, from Google Inc.

https://arxiv.org/pdf/1503.03832v3.pdf

3. 概率脸部嵌入

用于面部识别的当前嵌入方法，能够在受控设置中实现高性能。这些方法通过拍摄一张脸部图像并将有关该脸部的数据存储在潜在的语义空间中而起作用。

但是，当在完全不受控制的设置下进行测试时，当前方法无法正常执行。这是由于在图像中缺少面部特征或模棱两可的情况。这种情况的一个例子是监视视频中的人脸识别，其中视频的质量可能很低。

为了帮助解决这个问题，本文的作者提出了概率面孔嵌入（PFE）。作者提出了一种将现有确定性嵌入转换为PFE的方法。最重要的是，作者指出，这种方法有效地提高了人脸识别模型的性能。

发布/最新更新– 2019年8月7日

作者和贡献者–Yichun Shi and Anil K. Jain, from Michigan State University.

https://arxiv.org/pdf/1904.09658.pdf

4. 人脸识别的魔鬼在噪音中

商汤研究院，加利福尼亚大学圣地亚哥分校和南洋理工大学的研究人员研究了大规模面部图像数据集中的噪声影响。

由于它们的规模和成本效益，许多大型数据集都容易产生标签噪声。本文旨在提供有关标签噪声源及其在人脸识别模型中的后果的知识。此外，他们的目标是建立并发布一个名为IMDb-Face的干净人脸识别数据集。

该研究的两个主要目标是发现噪声对最终性能的影响，并确定注释脸部身份的最佳策略。为此，该团队手动清理了两个流行的张开面部图像数据集，MegaFace和MS-Celeb-1M。他们的实验表明，仅在其清理的MegaFace数据集的32％和MS-Celeb-1M清理的数据集的20％上训练的模型与在整个原始未清理的数据集上训练的模型具有相似的性能。

发布/最新更新– 2018年7月31日

作者和贡献者–Fei Wang (SenseTime), Liren Chen (University of California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), and Chen Change Loy (Nanyang Technological University).

https://arxiv.org/pdf/1807.11649v1.pdf

5. VGGFace2：用于识别跨姿势和年龄的人脸的数据集

关于深度卷积神经网络的面部识别已经进行了许多研究。反过来，已经创建了许多大规模的面部图像数据集来训练那些模型。但是，本文的作者指出，先前发布的数据集并未包含有关面部姿势和年龄变化的大量数据。

在本文中，牛津大学的研究人员介绍了VGGFace2数据集。该数据集包含年龄，种族，照明和姿势变化范围广泛的图像。数据集总共包含331万张图像和9,131个对象。

发布/最新更新– 2018年5月13日

作者和撰稿人–Qiong Cao, Li Shen, Weidi Xie, Omkar M. Parkhi, and Andrew Zisserman, from the Visual Geometry Group at the University of Oxford.

https://arxiv.org/pdf/1710.08092v2.pdf

希望上面有关人脸识别的机器学习论文有助于加深您对该领域工作的了解。