基于VGG16架构的中国名人面孔识别
来源:用户上传
作者:
摘 要:人脸识别在现实生活中具有广阔的发展前景,本文设计了一种新的位姿不变的人脸识别深度神经网络算法,以极低的错误率识别中国公众名人。该算法首先是构建了一个新的数据集,数据集的每一张图片是带有标签的面孔。其次是对构建的新数据集上的深卷积神经网络(CNN)VGG-16架构进行了微调。文中算法和Fisherface相比,在识别精度和耗时上面均表现更好。
关键词:人脸识别;深度神经网络;CNN;VGG-16
中图分类号:TP391
人脸在我们的社会交往中扮演着重要的角色,承载着人们的身份信息。人脸识别系统有着非凡的突破。这种突破在很大程度上可以归因于基于深度学习技术[1]的成功,这些技术假设通过收集大量的训练集,深层网络将有足够的样本来说明主体之间和主体内部的外观变化。从这些变化中,人工神经网络可以学习产生辨别特征,放大主体差异,抑制其他混淆的外观变化。因此,为了训练基于深度学习的人脸识别系统,需要非常大的训练集和数百万张带标签的图像。然而,大型训练数据集并不是公开的,而且很难收集。此外,通过从搜索引擎下载图像来构建大型数据集是非常困难的,也是最具经济挑战性的。解决缺少大型人脸数据集的一个方法是通过合成包含人脸图像的新视图来扩充人脸数据集。因此,通过引入补充的受试者内部外观变化(如姿态变化),可以将现有的人脸集扩展到其大小的许多倍。
1 相关知识
1.1 Dropout(随机失活)
Dropout的工作原理是,在训练过程中,从指定的层中删除一个神经元,或者删除某些连接。
1.2 Batch normalization(批量归一化)
Batch normalization方法,允许我们训练归一化权值和归一化层。批处理规范化可以应用于网络中的任何层,因此非常有效。
1.3 Data augmentation(数据增强)
使用当前拥有的数据,并对其进行操作,以生成同一图像的更多版本,从而增加在训练期间看到的数据的多样性。
2 实验及分析
2.1 实验过程
文章提出了一种新的半自动方法来构建非常大的合成图像训练数据集,在最小的人为干预下,通过在一个小的数据集中合成真实的人脸图像。
2.2 实验分析
建立人脸数据集的第一步:获取公众人物和名人的初始列表,即在搜索引擎上具有高代表性的人。
第二步:过滤过程的应用,通过删除出现在LFW人脸数据集中的任何明星名字,消除与标准LFW基准的任何重叠,从而使在新的数据集上进行训练,同时仍然可以在LFW基准上进行公平的评估,产生4000个身份的列表。
第三步:为候选名单中的每个名人收集一组代表性的图片。
第四步:对前一阶段采集的所有图像运行Viola-Jones人脸检测器,获取每个给定图像中人脸的位置,然后裁剪并重新缩放到一个标准坐标系。为了使人脸对齐,我们使用了人脸对齐方法将它们相应地旋转到一个正面位置。
第五步:删除在两个不同网络中的位置发现的相同图像的重复图像。
最后,为了增加数据集的大小。我们考虑对上述方法进行扩展,来生成正面视图,从而最小化变异性,以获得更好的对齐(测试阶段),而我们做的增加了变异性,更好地捕获了内外观变化(训练阶段)。因此,为了生成每个人脸图像的多个视图,我们首先应用人脸和标记检测器。根据这些检测到的策略关键点,我们使用3D通用人脸模型上标记的人脸关键点2和关鍵点3之间的对应关系来估计给定图像中人脸的6自由度。同时,我们还通过采样不同角度的人脸,得到了新的合适的旋转矩阵R或新的多视图:
2.3 训练网络架构
为了进行人脸识别,我们在研究中提出了基于ImageNet训练的VGG16,用于图像分类和人脸识别。为了提高CNN的表示能力,使用我们的新数据集对这个预训练模型进行调优是必要的一步。
2.4 实验结果
实验中所有图像的大小都为96963像素。整个数据集分为60%用于训练、20%用于验证和20%用于测试。
整个CNN模型在python中使用深度学习框架TensorFlow实现。采用分类前的预处理和比对程序,识别率由90%提高到96%。文中算法和Fisherface相比较,识别率更好,时间复杂度更低。实验如下表所示。
2.5 实验总结
综上所述,与传统的OpenCV分类器fisher-face相比,我们的基于深度学习的方法在有限的硬件资源上取得了令人满意的结果,无论是速度还是准确率都达到了最好的性能。我们的算法能够以96%的准确率实时识别人脸。
参考文献:
[1]杨巨成,刘娜,房珊珊,等.基于深度学习的人脸识别方法研究综述[J].天津科技大学学报,2016(6).
基金:西藏自然科学基金(XZ2017ZRG-53(Z));校内重大培育(19MDZ03);陕西省教育厅专项(19JK0887);大学生创新创业训练项目(S201910695060);校内教改项目(3110319061)
转载注明来源:https://www.xzbu.com/1/view-15146698.htm