浅析卷积神经网络的图像特征提取技术
来源:用户上传
作者:
【摘 要】本文对卷积神经网络的图像特征提取技术进行了综述,探讨了它的原理和发展方向,对于它的存在问题给出了相关的建议。
【关键词】卷积神经网络;图像特征;特征提取
中图分类号: TP183;TP391.41 文献标识码: A 文章编号: 2095-2457(2019)07-0083-002
DOI:10.19694/j.cnki.issn2095-2457.2019.07.033
【Abstract】In this paper, the image feature extraction technology based on convolutional neural network is summarized, its principle and development direction are discussed, and some suggestions for its problems are given.
【Key words】Convolutional Neural Network; Image features; Feature extraction
0 前言
目前,对于流行全球的深度学习,一般来说有三种基本架构:DBN结构,SAE结构与卷积神经网络结构(CNN),分别活跃于大数据挖掘,数据分类和图像处理等领域。其中卷积神经网络结构( CNN)由于在机器视觉方面的突出表现,使之成为图像处理的不二人选,本文介绍了CNN技术在图像特征提取中的应用。
1 卷积神经网络的原理及其经典的四种结构
卷积神经网络(CNN)是一种局部连接网络,相对于典型的BP全连接神经网络来说,具有局部连接性和权值共享性的的特点。这种神经网络不仅大量的减少了训练参数,还符合自然图像中越近的像素对旁边的像素影响越大的特点。卷积神经网络的权重共享构成卷积核,并且它与给定图像做卷积后就可以提取图像的某种特征。在图像处理的过程中,通过许多不同的卷积核参数的训练,就可以自动提取相同图像的不同图像特征。
目前,根据卷积神经网络的发展历程,共有四种经典结构用于图像特征提取:LeNet网络,AlexNet网络,VggNet网络,ResNet网络。
LeNet网络是在1994年由Yan LeCun提出,也就是第一代卷积神经网络。LeNet主要用来进行手写字符的识别与分类,准确率达到了98 ,已经在美国的银行中投入了使用,被用于读取北美约10 的支票。AlexNet网络由 Hinton的学生 Alex Krizhevsky于2012年提出,是 LeNet的一种更深更宽的版本,通过与其他各种图像识别算法的比较,确定了卷积神经网络在计算机视觉中的优势。VGGNet网络是由牛津大学计算机视觉组和Google DeepMind进一步开发的深度卷积神经网络[2]。ResNet(残差神经网络)由何华明等人于2015年提出。通过残差学习,可以做到更深的网络结构,从而存贮更多图像特征,识别更加精准。
2 卷积神经网络提取图像特征的原理
卷积神经网络识别图像是将一个完整的图片经过多次或者并行的自动特征提取,然后把每个图像特征汇总到一起,在比较相似性之后,可以从高概率完成图像识别的过程。从本质上说,这是一个深度的自动学习过程,我们前面所定义的图像特征可能并不适合卷积神经网络的特征分类,对于卷积神经网络的提取特征而言,虽然有很多的还原算法试图理解机器所提取的特征,但是就目前而言,机器所提取的特征不太适合人脑理解,甚至可能找到了人脑所没发现的图像特征。
2.1 图像特征提取技术构成
2.1.1 建立卷积层提取初步特征
卷积层的作用就是提取图片中的某个初步特征,类似一个滤波器(其细节不完全相同),经过大量的训练以后,机器自动调整卷积核的值,然后与图片矩阵做卷积,可以从图像中提取一定的特征出来,卷积核的数量对初步特征提取有很大影响,但是时间消耗相应地增加。
2.1.2 建立池化层提取主要特征
汇集层连接到卷积层,因此汇集层的输入是由卷积层和相应的卷积核输出的原始数据的输出矩阵。目前,有很多文章指出,不用池化层也不影响特征提取的质量,但是,池化层的主要作用是可以减少训练参数的数量,降低卷积层输出的特征向量的维数[3]和减少过度拟合现象,仅保留最有用的图像信息,并减少噪声的传播。
2.1.3 建立一个完全连接的层来汇总每个部分的功能
卷积层和池化层的共同作用下,不仅可以提取图像特征,同时大大减少原始图像带来的参数。最后,我们应用完全连接的层来生成一个等于我们需要的类数的分类器。将权重矩阵相乘,添加偏移值,然后使用ReLU激活函数使用梯度下降方法优化参数。
最后鉴别图像的图像特征都提取出来了,就可以从特征的不同和相同出发,用神经网络的来识别千万张图片中的特定一张了。
3 图像特征提取的发展方向
目前,對这种神经网络的改进集中于如上所述将图像特征提取到神经网络中的过程。首先,对于卷积层的改进有以下几种:卷积核小型化,1x1卷积,Network In Network,Inception机制,卷积分解(Factorization),反卷积运算等等。例如,Network In Network的主要思想是用小规模神经网络替换卷积层的线性滤波器[4]。1x1卷积可用于减少信道维数或用于完整卷积网络,确保卷积网络可接受任何大小的输入图像。并能做逐像素的预测。其次,对于池化层的改进主要有以下几种:L-P池化,混合池化,随机池化,Spatial pyramid pooling,ROI pooling。Spatial pyramid pooling在SPP网络中提出, ROI pooling在Fast R-CNN算法中提出。然后,还有其他功能可以更改网络的其他部分,例如激活功能。ReLU,ELU,PReLU等取得了良好的效果,其中ReLU及其改进型广泛应用于卷积网络。最后,目前发展最快的是网络结构的改进,比如残差网络和DenseNet等结构等等。
4 总结
目前,基于卷积神经网络图像分类的应用很多,识别效果非常好。但是,一些迫切的问题目前都没有解决:首先,还没有形成一套完整的结构理论或解释理论。现在许多识别系统都是根据特定的数据库,然后设计特别的网络,通过不断的训练,同时结合人工来发现最佳的参数和优化算法,这样应用的局限性比较大,同时也没有较系统的理论来纠正后期错误。第二,现有的算法和结构尚存在一些缺陷。比如对海量图像进行分类识别时,初始状态参数以及图片算法的选取,会对网络训练造成很大影响。但不可否认的是,卷积神经网络在图像处理领域的统治地位已经牢不可破,更多的可能是,我们需要更好的理论来解释和控制神经网络。
【参考文献】
[1]何立民,万跃华.数字图书馆中基于内容的图像检索关键技术[J].中国图书馆学报,2002,28(6):39-43.
[2]佘鹏,甘健侯,文斌,et al.经典深度卷积神经网络模型在手绘草图识别中的应用研究[J].云南师范大学学报:自然科学版,2018.
[3]常祥,杨明.基于改进的卷积神经网络的图像分类性能[J].重庆理工大学学报(自然科学版),2017(3).
[4]范青.卷积神经网络中减少训练样本时间方法研究[J]. 电脑知识与技术,2016(33):173-176.
转载注明来源:https://www.xzbu.com/8/view-14760896.htm