您好, 访客   登录/注册

基于改进卷积神经网络的人脸识别研究

来源:用户上传      作者:

  摘 要:由于传统的深度卷积神经网络用于人脸识别时,往往结构层数多,参数量大,训练难度高。本文在经典网络LeNet-5的基础上提出一种新的卷积神经网络模型来进行人脸识别。首先,结构上包含两个子卷积网络,实现多卷积的功效;然后,对于提取人脸特征的卷积层和池化层采取融合,以减少网络参数及训练时间;采用两个全连接层,第一个全连接层与前面完成特征提取的每个单层连接来实现对多尺度特征的采集;最后的分类层采用Softmax分类器。实验结果表明,与传统结构模型相比,识别率有所提高,其训练速度提升了,验证了新网络模型人脸识别方法的有效性。
  关键词:人脸识别;卷积神经网络;多子卷积网络;卷积池化层融合;多尺度特征采集
  近年来,人脸识别技术进展迅猛,在身份识别认证、金融支付、视频监控等领域都有良好的效果。这些传统的人脸识别算法通常是人工来提取特征,因而识别率普遍不高。卷积神经网络(Convolutional Neural Network,CNN)在图像处理、语音识别方面拥有其独特的优势,包括局部感受野、权值共享、空间池化。有鉴于此,本文在网络LeNet-5的基础上改进,提出了一种具有双子卷积神经网络的的六层卷积神经网络模型。
  1 卷积神经网络的原理
  神经认知机是由日本学者Fukushima基于Hubel&Wiesel感受野概念提出的第一个卷积神经网络。[1]卷积神经网络的特有优点主要有三个:局部感受野、权值共享、空间池化。现在的深度CNN是将深度学习概念应用到神经网络,由多个单层CNN堆叠而成的多层网络结构,然后级联到全连接层,最终输出。
  1.1 卷积层
  卷积层主要工作是通过卷积操作来对输入图像提取特征,卷积核的作用相当于滤波器,计算图像的每一个像素以及其领域像素和滤波器矩阵对应元素的乘积和,得到的结果即为输出。若卷积层为第l层,则其卷积公式如下:
  2 卷积神经网络的改进
  虽然LeNet-5网络在手写字符Mnist数据集上的识别率很高,但LeNet-5不能得到很好的人脸识别率。本文在LeNet-5基础上做出改进。改进后的网络结构共6层,特征提取层由两个并行独立的子卷积神经网络组成。网络第一层为输入层,输入26×26大小图片。第二层包含两个独立的卷积层C1、C2,卷积核数目均为40个;卷积层C1卷积核大小为3×3,这样C1大小为12×12×40;卷积层C2卷积核大小为7×7,这样C2大小为10×10×40。第三层包含两个独立的卷积层C3、C4,卷积核数目均为65个;卷积层C3卷积核大小为3×3,这样C3大小为5×5×65;卷积层C4卷积核大小为3×3,这样C4大小为4×4×65。四个卷积层的步长均为2。第四层为F1全连接层,该层设计有300个神经元,F1的输入来自C1、C2、C3、C4,对(5)式做出改进得到F1层的公式如下:
  第五层是F2全连接层,神经元数目根据人脸种类具体情况而定,F2与F1采用全连接,该层公式如式(5)所示。则公式(6)中的x′为该层的输出。第六层是输出层,由softmax函数判断分类。
  3 实验及结果分析
  3.1 实验数据集和预处理
  为了验证本文算法的有效性,采用AR人脸库作为实验数据集。AR数据库是Purdue大学建立,含126个人共2600张面部图片。这些人脸图像有正常、光照、表情变化、姿态变化、遮挡等多种情况。每张图片的像素大小为120×165。实验前,先对图像数据集进行预处理,图像归一化成大小为26×26,灰度值为[0,1]。然后从中随机抽取100人,每人20张,共2000张图像组成新的数据集。每人随机抽取的15张图片组成训练集,即1500张图像用于网络训练,剩下的每人5张,共计500张图像作为测试集用于性能验证。由于总人数为100人,则F2层神经元数目设置为100。学习率置为0.02,动量置为0.9。
  3.2 实验验证网络模型
  上下兩个子卷积神经网络分别称为CNN1、CNN2,由于两者平行独立,这里先对CNN1进行实验来获得其最佳网络参数。
  首先验证通过改变卷积核窗口滑动步长来取代池化层的有效性,作以下四种设置:(1)步长为1,无池化;(2)步长为1,有池化;(3)步长为2,无池化;(4)步长为3,无池化。对四种情况下的网络模型分别作3次实验,最后取平均值。识别结果:CNN1-(1)识别率为98.21%,训练时间为110.8s,CNN1-(2)识别率为97.13%,训练时间为41.4s,CNN1-(3)识别率为9785%,训练时间为30.5s,CNN1-(4)识别率为97.07%,训练时间为18.7s。总结得出,CNN1-(3)是最佳选择。同时验证了增大卷积核步长来代替池化层的方法是有效的。
  本文提出的网络模型各层参数,如下表所示。
   接下来验证拥有两个子卷积神经网络的模型方法的识别率是否高于普通单个卷积神经网络模型的识别率。对CNN1、CNN2及本文方法在数据集上分别作3次实验,结果取平均值。实验结果:本文方法测试集正确识别率为95.73%,CNN1为93.81%,CNN2为91.57%。
  3.3 实验分析
  由上表可知,CNN1的卷积核比CNN2的小,每张图像卷机操作的次数相对增加,得到较多特征信息,则识别率比CNN2较高。两者并行组成的本文算法的识别性能最好,验证了多个子卷积神经网络提取多局域特征的有效性。
  由上图可知,CNN1虽然比LeNet-5少一个卷积层,但因为其采用了多尺度特征采集的方法,即全连接层分别与每一个特征提取层全连接,融合不同尺度大小的特征图,所以CNN1的识别率比LeNet-5高,验证了该方法的有效性。本文方法、CNN1、LeNet-5、PCA在训练迭代到5000次时识别率依次为9573%、93.81%、90.15%、87.64%,本文方法得到了最佳识别率。
  4 结语
  本文针对人脸识别过程中受到非约束条件影响,基于已有的经典卷积神经网络LeNet-5设计了一个六层并行双子卷积神经网络。通过多组实验对比,验证了文中各方向改进方法的有效性。后续工作可以从增加子卷积神经网络的数量以及缩小各层神经元数目有效范围得到精准数目等方面着手,来进一步提高网络模型的识别率。
  参考文献:
  [1]吴尧,邱卫根.基于改进的深度卷积神经网络的人脸识别[J].计算机工程与设计,2017,38(08).
转载注明来源:https://www.xzbu.com/1/view-14765921.htm