您好, 访客   登录/注册

基于改进AlexNet卷积神经网络的手掌静脉识别算法研究

来源:用户上传      作者:

  摘  要: 在手掌静脉图像采集的过程中易受手掌摆放姿势、光源条件等外界因素的影响,造成识别准确度欠佳。为了提高手掌静脉图像识别的精准度和鲁棒性,提出一种基于改进AlexNet深度卷积神经网络的手掌静脉识别方法。该方法首先通过图像分割、指根关键点定位、感兴趣区域图像提取等三个阶段对采集的手掌静脉图像进行预处理;其次,针对人体手掌静脉识别的应用场景,通过适当调整经典的AlexNet卷积神经网络的结构并对卷积层的输出进行批标准化操作,同时,将深度学习理论中的注意力机制应用到该网络中,进而优化AlexNet神经网络,使用优化后的AlexNet神经网络对预处理后的图像自动进行特征提取、分类和识别;最后,在公开的Polyu和CASIA多光谱掌纹数据集上进行大量的实验,达到的最佳识别率分别为99.93%和99.51%,实验验证了所提方法的有效性。
  关键词: 手掌静脉识别; AlexNet神经网络优化; 图像特征提取; 图像预处理; 注意力机制应用; 有效性验证
  中图分类号: TN911.73?34; TP391.4                  文献标识码: A                 文章编号: 1004?373X(2020)07?0052?05
  Research on palm vein recognition algorithm based on
  improved AlexNet convolution neural network
  LIN Kun, LEI Yinjie
  (Institute of Intelligent Control, College of Electronics & Information Engineering, Sichuan University, Chengdu 610036, China)
  Abstract: In the process of palm vein image acquisition, palm vein images are susceptible to external factors like palm posture and light source conditions, which will result in poor recognition accuracy. Therefore, a palm vein recognition method based on improved AlexNet depth convolution neural network is proposed to improve the accuracy and robustness of the image recognition. Firstly, the collected palm vein image is preprocessed by image segmentation, finger root key point location and image extraction in the region of interest (ROI). Secondly, according to the application context of palm vein recognition, the classical AlexNet convolution neural network structure is adjusted appropriately, and the output of convolution layer is standardized in batches. The attention mechanism in deep learning theory is applied to the above?mentioned network to optimize the AlexNet neural network. The optimized AlexNet neural network is used to automatically extract, classify and identify the features of the preprocessed images. A large number of experiments were performed on public PolyU and CASIA multispectral palmprint datasets. The optimal recognition rates are 99.93% and 99.51% respectively. The experiments verify the effectiveness of this method.
  Keywords: palm vein recognition; AlexNet neural network optimization; image feature extraction; image preprocessing; attention mechanism application; effectiveness verification
  0  引  言
  隨着社会的进步和经济的不断发展,基于特征物品(如身份证、钥匙等)和特定知识(如用户名和密码、U盾、IC卡等)的传统身份鉴别方法面临着挑战。特别是在网络社会的今天,人们对于身份鉴别技术的可靠性、安全性有了更高的要求。而基于人的一个或多个身体特征(如人脸、指纹、虹膜、静脉、DNA等)和行为特征(如笔迹、步态、声纹等)的生物特征识别技术[1](Biometrics)为身份鉴别领域提供了一个有效、可靠的解决方法。   手掌静脉识别[2]是利用隐藏在人体手掌表皮下的静脉纹理进行身份鉴别。基于手掌静脉的生物特征识别具有广泛的应用前景,也得到了相关研究人员的广泛关注。基于人工提取图像特征和机器学习的思路取得了很多成果,其大多数方法可分为以下三类:基于结构特征的方法、基于子空间特征方法和基于纹理特征方法。基于结构特征的方法对图像质量的依赖性较大,容易因图像质量的下降而丢失大量结构信息;基于纹理特征的方法易受手掌静脉纹理的丰富度和清晰度的影响;基于子空间特征的方法目前研究相对较少,其准确性和鲁棒性有待进一步探讨。
  近年来,深度卷积神经网络被广泛应用到计算机视觉任务中,与基于人工提取手掌静脉图像特征和使用机器学习算法进行识别的思路不同,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)不需要人工提取图像特征信息,可以从大量的训练样本学习到合适的网络参数。使用训练后的深度卷积神经网络可以对输入图像提取深层次特征信息,并进行分类和识別。
  基于此,本文提出一种基于改进AlexNet深度卷积神经网络的手掌静脉识别方法。通过在基准数据集上的实验,该方法具有很好的有效性和鲁棒性。
  1  手掌静脉图像预处理
  受手掌摆放姿势、光照条件等因素的影响,采集到的原始手掌静脉图像质量不一,需要对原始图像进行预处理以方便后续的特征提取和识别。手掌的中心区域集中了手掌静脉图像的大部分有效特征,该区域即手掌静脉图像的感兴趣区域(Region of Interest,ROI)[3]。图像预处理主要是对手掌静脉图像的感兴趣区域进行提取:一方面通过图像预处理消除了全局几何变换对识别的影响;另一方面,选取预处理后的ROI图像进行处理和识别,将大大减小图像处理部分的运算量和神经网络的深度。
  本文提出一种详细的ROI提取方案,包括手掌图像分割、关键点定位和ROI提取三个阶段,具体包括图像剪裁、高斯平滑滤波、二值化、手掌分割、轮廓提取、质心定位、轮廓到质心距离计算、关键点定位、方向矫正、坐标系重建、ROI提取等11个步骤,如图1所示。
  1.1  手掌图像分割
  首先剪裁掉原始手掌静脉图像中对识别并不需要的手腕区域,加快预处理速度;而后进行高斯平滑滤波去除噪声;最后对去噪后的图像进行二值化得到二值图像,并将二值化后图像与二值化前的图像进行与操作,从而分割出手掌图像。
  1.2  关键点定位
  通过轮廓提取、质心定位、轮廓到质心的距离计算等步骤进行关键点定位。
  1) 轮廓提取:对二值化后的图像做轮廓检测。检测出的轮廓中取最大轮廓,即手掌轮廓。
  2) 质心定位:根据手掌轮廓图像的矩计算出轮廓的质心,其计算公式如下:
  [M00=ijVi,jM10=iji?Vi,j,      i∈I,j∈JM01=ijj?Vi,j]    (1)
  [x=M10M00,     y=M01M00 ] (2)
  式中:[I],[J]分别代表图像的横纵坐标集;[Vi,j]表示图像在点[i,j]上的灰度值;[M00],[M10],[M01]分别代表轮廓图像的零阶矩、一阶矩和一阶矩;([x],[y])为质心坐标。
  3) 关键点定位:逆时针方向计算轮廓上的每个点到质心的距离,并以此作幅值图。由手掌图像的特点可知,幅值图像的三个波谷即食指与中指、中指与无名指、无名指与小指之间的指根点。取食指与中指、无名指与小指之间的指根点作为两个关键点。
  1.3  ROI提取
  通过方向矫正、坐标系重建等步骤进行ROI提取。
  1) 方向矫正:以直线连接两个关键点,旋转图像至该直线的角度为0°。
  2) 坐标系重建:两个关键点连线为[x]轴,连线中点为原点,垂直平分线为[y]轴重建坐标系。在重建后的坐标系中在[x]轴上方,[y]轴两侧提取出固定大小的矩形ROI区域。
  2  改进的AlexNet卷积神经网络
  2.1  AlexNet神经网络
  AlexNet是深度学习经典的基础网络之一,由Hinton和他的学生Alex Krizhevsky于2012年提出,其主要结构为8层深度神经网络,包括5层卷积层和3层全连接层,不计入激活层和池化层。
  AlexNet卷积层中使用ReLU函数作为激活函数,而不是之前网络中广泛使用的Sigmoid函数,ReLU函数的公式为:
  [fx=0,     x≤0x,     x>0] (3)
  ReLU函数的引入解决了在神经网络较深时的梯度弥散问题。此外,AlexNet神经网络在卷积层中使用最大池化的方法对卷积层输出的特征图进行下采样,而不是此前普遍使用的平均池化。因此,AlexNet神经网络比之前的神经网络具有更优异的性能。
  2.2  注意力机制
  计算机视觉中的注意力机制(Attention Mechanism)[4?5]借鉴了人类的大脑在处理视觉信息时的注意力集中机制,即能够忽略无关信息而更多地关注重点信息。深度学习中可以通过让神经网络对输入数据或特征图上的不同部分学习不同权重分布的思路来实现注意力机制,权重不同所对应的专注度也不同。
  SE?Block (Squeeze?and?Excitation Block)[6]是深度学习中常用的一个实现注意力机制的神经网络模块,其通过学习的方式来自动获取到每个图像特征通道的重要程度,让神经网络利用全局信息有选择地增强有益特征图通道并抑制无用特征图通道,其原理如图2所示。SE?Block模块可以嵌入到当前流行的大部分经典深度学习网络中。   在图2中,[H],[W],[C]为经過卷积层之后特征图的尺寸,为特征图的通道数;[Fsq]为特征压缩(Squeeze)过程;[Fex]为特征激励(Excitation)过程;[Fscale]为特征融合过程。
  2.3  AlexNet神经网络的改进
  1) 将深度学习中的注意力机制理论应用在AlexNet深度卷积神经网络中,使神经网络在训练和识别的过程中更多地关注输入图像中对识别有益的静脉脉络部分,进而加快神经网络的训练,提高识别精度。本文将SE?Block嵌入到AlexNet神经网络的卷积层和全连接层之间。
  2) 由于神经网络输入的是对原始手掌静脉图像进行预处理后的ROI图像,而非采集到的原始图像,大大降低了对卷积神经网络深度的需求。在保证神经网络识别效果的前提下,可以考虑对经典的AlexNet卷积神经网络进行调整和精简。根据大量实验的实际效果,本文将经典的AlexNet神经网络中的3个全连接层调整为1个全连接层,并调整了全连接层的参数。全连接层的调整很大程度上减少了神经网络的参数,让网络更易训练。
  与此同时,为了抑制神经网络训练过程中的过拟合问题,对每个卷积层的输出进行批标准化(Batch Normalization)操作。其定义如下:
  [xi=xi-1mi=1mxi1mi=1mxi-1mi=1mxi2+ε,    i=1,2,…,m] (4)
  式中:[xi]表示输入第[i]个数据;[xi]表示输出的结果;[ε]表示偏置项。批标准化操作在一定程度上能够加快卷积神经网络的训练。
  通过将深度学习中的注意力机制应用到AlexNet卷积神经网络中,同时,根据手掌静脉识别的应用场景,调整了AlexNet网络的部分结构,并对卷积层的输出进行批标准化操作,进而优化了经典的AlexNet卷积神经网络。改进后的AlexNet神经网络的结构和参数如图3所示。
  3  实  验
  3.1  数据集
  香港理工大学的Polyu多光谱掌纹数据库(V2)是手掌静脉识别领域广泛使用的基准数据库之一,该数据集包括红、绿、蓝、近红外4个不同波长光线下的手掌图像,其中,近红外光下拍摄的是手掌静脉图像。采集来自250名志愿者左右手掌共6 000张手掌静脉图像,其中,195名男性和55名女性,志愿者年龄分布为20~60岁,每个手掌每次采集6张图像,分两次采集,平均间隔9天。
  中国科学院的CASIA多光谱掌纹数据集是以非接触方式采集的,该数据集包含来自100位志愿者的7 200张手掌图像,每个手掌包含了460 nm,630 nm,700 nm,850 nm,940 nm和白光6个光谱下采集的图像,每个波段采集6次,其中,850 nm,940 nm波长下采集的是手掌静脉图像,一共3 200张图像。
  3.2  评价指标
  本文选取准确度(Accuracy,Acc)和损失函数(Loss Function,Loss)来分别衡量模型的准确性和鲁棒性。准确率的计算公式如下:
  [Acc=TRTR+FA] (5)
  式中:TR(True),FA(False)分别是被正确分类的样本数、错误分类的样本数。
  损失函数使用交叉熵(Cross?entropy)损失函数,其计算公式如下:
  [Loss=-1Ni=0N-1k=0K-1yi,klog pi,k] (6)
  式中:[K]代表多分类任务中的类别数;[N]代表样本数;[y]代表样本真实的类别;[pi,k]是第[i]个样本预测为第[k]个类别的概率;[yi,k]代表第[i]个样本预测为第[k]个类别。
  3.3  实验环境和参数设置
  实验设备为一台 Intel[?] Xeon[?] E5处理器、NVIDIA1080Ti显卡、64 GB内存的系统、操作系统为Linux Ubuntu 16.04的微型服务器。使用的程序语言为Python 3.7,深度学习框架为Pytorch 1.0。
  神经网络的初始学习率设置为0.001,并在训练的过程中采用指数衰减策略,动态调整学习率。优化器为Adam,Batch Size设置为50,一共训练500个Epoch。
  3.4  实验结果和分析
  本文实验采用Polyu多光谱掌纹库和CASIA多光谱掌纹库中近红外光下拍摄的手掌静脉图像。其中,Polyu库训练集有3 600张图像,测试集有1 200张图像,验证集有1 200张图像;CASIA库训练集有1 920张图像,测试集有640张图像,验证集有640张图像。对所有图像进行预处理,提取出ROI区域后,全部归一化为127×127大小,并将其作为神经网络的输入。在3.3节中的环境和参数下进行实验,实验结果如图4,表1和表2所示。
  从图4的实验结果可以看出,相比经典AlexNet神经网络,使用注意力机制后的网络和在此基础上调整部分结构并对卷积层输出进行批标准化后的改进AlexNet网络,识别效果均得到了明显提升,其中,注意力机制的使用对识别准确度的提高贡献较大。上述实验结果也表明了本文改进措施的合理性。
  表1和表2的实验结果表明,和PCA,LDP等基于机器学习的方法以及经典的AlexNet深度卷积神经网络相比,本文基于改进AlexNet卷积神经网络的方法进一步提高了手掌静脉识别的准确度,具有更高的识别性能。识别准确度分别在Polyu和CASIA库上获得了0.92%和1.28%的提升。同时,更小Loss值表明该方法具有更好的鲁棒性,实验验证了本文方法的有效性和鲁棒性。
  相比之下,本文方法对Polyu库中手掌静脉图像识别效果更好,主要原因是,CASIA库中的图像是以非接触方式采集的,采集受更多光照、距离等条件的影响,同时也存在更多的旋转和平移等情况。   4  结  語
  手掌静脉识别技术因静脉特征的可靠性、高安全性使其成为生物特征识别技术中迅速发展的一员。相比经典的手掌静脉识别方法,本文使用改进后的AlexNet深度神经网络在基准数据集上取得了更好的识别效果。
  与此同时,该领域还存在待进一步研究的方向,如与其他生物特征融合识别、防止利用尸体或断掌进行识别等。
  参考文献
  [1] 张富友,王琼霄,宋利.基于生物特征识别的统一身份认证系统研究[J].信息网络安全,2019(9):86?90.
  [2] BHANUSHALI N, NIKAM P, TRIPATHI P. High security using palm vein recognition technology [J]. International journal of computer applications, 2015, 119(1): 170?175.
  [3] SUN Xiongwei, XU Qingshan, WANG Chunyi, et al. ROI extraction for online touchless palm vein based on concavity analysis [C]// 2017 32nd Youth Academic Annual Conference of Chinese Association of Automation (YAC). Hefei, China: IEEE, 2017: 1123?1126.
  [4] WANG Fei, JIANG Mengqing, QIAN Chen, et al. Residual attention network for image classification [C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017: 6450?6458.
  [5] JADERBERG M, SIMONYAN K, ZISSERMAN A, et al. Spatial transformer networks [C]// Advances in Neural Information Processing Systems. Montreal, Canada: [s.n.], 2015: 2017?2025.
  [6] HU Jie, SHEN Li, ALBANIE Samuel. Squeeze and excitation networks [C]// IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2018: 7132?7141.
  [7] 林森,徐天扬,王颖.基于Gabor小波和NBP算法的手掌静脉识别[J].激光与光电子学进展,2017,54(5):142?150.
  [8] 杨晓凤.掌纹和静脉特征融合算法的研究[D].北京:北京交通大学,2017:19?45.
  [9] 徐笑宇,姚鹏.基于HOG与改进的SVM的手掌静脉识别算法[J].计算机工程与应用,2016,52(11):175?180.
转载注明来源:https://www.xzbu.com/8/view-15245413.htm