基于卷积神经网络的服装领型识别与分类研究
来源:用户上传
作者:尹光灿 罗戎蕾
摘 要:针对服装领型特征识别困难、分类效果不理想等问题,提出了一种基于Alex Net卷积神经网络的服装领型识别与分类方法,实现了服装衣领造型的自动识别与分类。首先,从电商平台收集服装样本图并对其进行剪裁和预处理,建立一个包含圆形领、方形领、一字领、V形领等15类服装领型的样本库;其次,利用Alex Net卷积神经网络中的卷积、池化操作,提取服装领型样本中的领型特征;最后,运用Softmax回归分类器来实现服装领型的分类。结果表明,该方法可以有效地对服装领型进行识别与分类,分类准确率达到98.67%,可以有效解决服装领型识别分类困难等问题,为服装商品的可视化分类提供有效方法。
关键词:卷积神经网络;Alex Net;服装领型;识别分类
Abstract:A new method of recognition and classification of garment collar typebased on Alex Net convolution neural networkis introduced to improve automatic recognition and classification of garment collar style, so as to overcome the difficulties in recognition and classification of characteristics of garment collar type. Firstly, different garment sample designs were collected from e-commerce platforms and edited and preprocessed,and a sample database consisting of 15 garment collar types (including round collar, square collar, off collar, V collar and so on) were built. Secondly, operations of convolution and pooling of Alex Net convolution neural network were conducted to extract the collar characteristics from the samples. Finally, Softmax regression classifier was used to realize the classification of the clothing collars. The experiment result shows that this method works well in identifying and classifying clothing collar types with an accuracy rate up to 98.67%. This method is an effective way to overcome the difficulties in identifying and classifying clothing collar types,and provide an effective method for visual classification of apparel goods.
Key words:CNN; Alex Net; garment collar type; identification and classification
衣領,从其字面意思理解,就是服装的领子部分,贴合于人体颈部,装缝在衣身领圈上的部件,具有保护、装扮颈部的作用[1]。领部在服装设计中,是组成服装款式的重要部件之一,也是服装设计师重点关注的部位。不同的衣领造型通常会给人不同的视觉效果和心理感受。在服装风格识别中,衣领的造型是影响服装风格的重要因素之一。但目前电商平台对于领型的识别和分类主要还是依靠人为添加标签来完成。由于不同的人对领型的认知不同,就导致在添加标签的过程中可能出现错误的分类。而消费者则是通过文本和关键词进行搜索,搜索出来的结果会出现词不对图的情况。使用传统方法对领型分类不仅浪费了大量的时间,且分类效果也不理想,这就需要寻找实现服装领型分类更简便的方法。
目前国内外学者对服装分类的研究主要集中在款式、风格、色彩、图案等方面。冯利等[2]通过量化服装的主要控制部件,例如领部、外形、袖部等的变化范围实现对服装风格的分类。张海泉等[3]对服装面料视觉风格的特点进行研究进而对面料风格进行了分类。陈雁等[4]通过专家调查和物理测试的方式对颜色风格进行研究,实现对颜色风格的分类。李一磊等[5]通过将服装的部件属性和决策者心理相结合,建立MDFT的服装风格决策模型,对服装风格进行了分类。早期的这些研究都是人为设定提取特征,提取出来的特征具有主观性和限制性。随着深度学习的发展使得机器学习与特征学习有了很大的突破。汪姗娜等[6]通过改进卷积神经网络实现了领带花型的情感分类。吴欢等[7]改进Caffe Net卷积神经网络的模型结构对5种女裤廓形进行分类。Bossard等[8]使用色彩、图案和服装轮廓等指标对 服装属性进行分类。上述方法都是使用深度学习对服装整体进行分类,没有对服装零部件进行分类。因此本文以服装领型为研究对象,通过微调Alex Net卷积神经网络模型的超参数,实现对服装领型的自动识别与分类,进而为实现服装类商品的可视化分类提供有效方法。可以将其运用于电商,便于在线商店标注与服装相关的描述,也便于消费者跨越语义鸿沟,找到想要的服装商品。
1 领型分类 衣领是由领线和领子两个部分组成,按照领线和领子的组合方式,可以分为无领和有领两大类[9]。无领是指仅有领线而无领子的领型;有领是指在领线上装有各种不同形式的领子。根据不同的分类标准,领子的分类不同。按领的高度可分为高领、中领、低领;按领的穿着状态可分为开门领和关门领;按领的造型结构可为无领、立领、翻领和驳领等基本类型。
本实验将按照领子的造型结构分类进行研究,总体分为无领、立领、翻领和驳领4大基本领型。
1.1 无 领
无领的特点是只有领线而无领面。它在基本领线的基础上改变领线的大小或形状从而形成不同的款式造型,例如圆形领、方形领、V形领和一字领等,如图1所示。
1.2 立 领
立领又称竖领,是立于颈周而无翻折的领造型,也就是说立领只有领座。改变其领座的造型,从而衍生出不同的立领造型,例如中式立领和系结领等,如图2所示。
1.3 翻 领
翻领是指领面摊贴在领圈上(无领脚)或翻摊在领脚外面(领脚将领面撑起)的领式。根据有无领腰,翻领又分为两种,有领腰的叫衬衫领(图3);无领腰的叫做平领。平领又根据其翻折领面大小幅度不同或形状不同,又形成不同的平领造型。例如海军领、波浪领、披肩领、娃娃领等,如图4所示。
1.4 驳 领
驳领是由衣领和驳头组成,将衣领和驳头缝接在一起,驳头两侧向外翻折呈驳口线型的领式。驳领根据其领形变化又可分为平驳领、枪驳领、大驳领和青果领等,如图5所示。
根据电商平台对领型的分类,再结合文献调研[1,10-11]及专家访谈等形式,最终确定15种特征较明显的领型作为本次的研究对象,分别是圆形领、方形领、V形領、一字领、中式立领、系结领、衬衫领、海军领、波浪领、披肩领、娃娃领、平驳领、枪驳领、大驳领、青果领。
2 卷积神经网络的构建
早在20世纪60年代,Duffy等[12]在对猫的大脑视觉皮层实验中,发现生物的视觉系统是通过多层级的视觉感受野逐层激发实现的。研究人员在动物的视觉系统实验启发下,设计出了类似的算法,通过多层级的视觉感受野对图像进行深层次的识别。随着机器视觉概念的提出,卷积神经网络凭借像素之间的距离与其相似性关系的优势,依靠网络自身,学习、提取训练样本特征的能力,成为当前识别图像分类领域的研究热点之一[13]。
本研究将Alex Net卷积神经网络模型应用于服装领型的识别分类,利用卷积神经网络反向传播算法的特点,通过调整Alex Net模型参数得到适用于服装领型识别分类的网络模型结构。
Alex Net网络模型共有8层,1~5层为卷积层,6~8层为全连接层,激励函数RELU(Rectified Linear Unit)和局部归一化(Local Response Normalization,LRN)处理存在于前五层的卷积层中,Alex Net网络结构的优势在于两个LRN层及最后一个卷积层后加入了最大池化层,最大池化层的作用在于提取训练样本中最显著的特征。表1为网络的隐含层参数。
3 算法流程
领型识别任务分为4个阶段,领型分类及样本空间确定、样本图片预处理、领型样本训练、特征提取和识别分类。算法流程如图6所示。
3.1 领型分类及样本空间确定
基于文献和专家访谈等形式确定领型的分类;按照对应的领型种类变量,确定样本空间量,包括领型训练样本空间量和领型测试样本空间量。
3.2 样本图片预处理
将收集的服装领型图片进行预处理,首先要防止样本图片中的服装非领型部分对机器学习造成干扰,其次防止样本图片中服装的色彩和面料对实验结果造成误差,最后对样本图片尺寸大小进行归一化处理。
3.3 领型样本训练
使用Alex Net卷积神经网络模型对预处理过的领型样本图片进行训练。Alex Net网络模型中的卷积核对图像进行自上而下、自左到右的加权求和操作,从而得到新的像素值,接着在池化层进行特征融合、降维操作。输入的领型样本图像经过交替的卷积和池化操作,模型已经学习到领型样本高度抽象的特征。
3.4 特征提取和识别分类
将卷积和池化操作之后得到的特征图输入到Softmax回归分类器中,结合领型的分类标签对Softmax分类器进行训练。完成一定迭代次数的训练后,输出15类目标的概率值。
4 样本数据采集及图像预处理
4.1 样本数据采集
在淘宝、天猫、京东、唯品会等购物APP及各大服装品牌官网寻找对应的领型样本,一共1 575个领型样本,为了提高Alex Net网络训练的精准度,防止其他无关内容的干扰,本实验选取去除背景且无其他内容干扰的白底图片。又因为图片中非领型部分会对卷积神经网络的训练造成干扰,因此需要对图片进行剪裁,只留下领子部分。裁剪方法使用labelimg软件对领子部位进行标记,产生对应的XML文件,用python-opencv读取XML文件并进行裁剪。图7为剪裁后的部分领型样本。
4.2 样本数据增强
为了增强Alex Net卷积神经网络的鲁棒性,减少数据过拟合,在保持数据集标签不变的情况下,增大数据集[14]。本研究主要采用两种方法,一是样本图片翻转,扩充数据集;二是使用正态分布的高斯噪音,人工添加一些干扰,提高卷积神经网络的鲁棒性。
4.2.1 样本图片翻转
由于卷积神经网络具有很强的泛化能力,即使样本图片在空间中发生位移、拉伸或旋转等变化,卷积神经网络也能很好地完成识别任务。因此在实验中将每一张样本图片分别向左、向右翻转90°,这样将数据集扩充至4 725张图片。图8为部分样本图片翻转。 4.2.2 正态分布的高斯噪音
使用正态分布的高斯噪音处理,人工添加一些干扰,增强Alex Net卷积神经网络的鲁棒性,同时又将数据集扩充至6 300张图片。图9为添加高斯噪音处理前后对比。
4.3 样本图片预处理
4.3.1 灰度化
为防止图片中服装的色彩对卷积神经网络训练造成误差,对样本图片进行灰度化处理。
4.3.2 边缘检测
在灰度化处理的基础上,利用边缘检测技术,将样本图片的边缘检测出来,减少样本图片的色彩和面料对模型造成的影响。处理前后对比如图10所示。
4.3.3 Imageresize处理
利用Imageresize对样本进行预处理,图片尺寸归一化为227×227像素,防止因图片大小不一引起誤差。Imageresize可以对图片的大小进行处理而不受图片格式的影响。
4.4 样本训练过程
将预处理过的6 300张训练样本图片导入Alex Net网络模型进行训练,其中训练样本6 225张,测试样本75张。也就是每种领型有420张图片,从中随机选取5张领型图片作为测试样本,剩下415张作为训练样本。训练过程是从领型训练样本的某一类别中任意选取一个参与训练的领型图片,进行卷积、池化操作,随着对图像不断进行卷积和最大池化,模型学习训练原始图像的特征;最后输出选取领型样本的所属类别,如图11所示。
5 结果与分析
实验环境:本次Alex Net卷积神经网络的搭建、训练是通过Matlab R2017b软件实现的。系统环境为 Windows10的64位操作系统,显卡型号为GTX1050Ti,4 GB内存,512 G固态硬盘,Intel八代I5。
将不同预处理方式处理后的领型训练样本作为卷积神经网络的输入,通过卷积和池化操作提取领型特征,最后将提取到的领型特征输入到全连接层,全连接层再将数据流分为15类。使用Alex Net模型对不同预处理方式处理的服装领型识别,分类结果如表2所示。
从表2可以看出,使用数据增强之后,模型的准确率提高了5.34%;使用数据增强加灰度化后,准确率提高了6.67%;而使用数据增强加边缘检测技术后,准确率达到98.67%,召回率(错误率)只有1.33%。可见色彩和面料对领型识别分类模型有一定影响,因此要减少色彩和面料对卷积神经网络识别分类领型时的误差。
6 结 语
根据服装领型的差异,结合电商平台对领型的分类、征询服装设计师及高校服装领域资深专家,将领型分为圆形领、V形领、方形领等常见的15类,提出一种基于卷积神经网络的Alex Net模型。该模型通过交替的卷积、池化操作,提取服装领型特征,实现服装领型的识别与分类,准确率在98%以上。从实验结果来看,色彩和面料对领型识别分类有一定影响,排除色彩和面料的影响后,该模型可以很好地完成服装领型的识别与分类,降低了在领型识别分类过程中对相关专业人员的依赖。可以将其与电商平台相结合,以便于在线商店标注与服装相关的描述。由于本研究是针对差别较大的领子造型进行研究,在后续工作中将扩充领型种类及领型样本数 据库,提高网络模型的泛化能力。
参考文献:
[1] 章瓯雁.服装衣领造型设计浅谈[J].温州职业技术学院学报,2002(2):53-55.
[2] 冯利,刘晓刚.服装风格的量化方法初探[J].东华大学学报(自然学版),2004(1):57-61.
[3] 张海泉,刘华.服装面料的视觉风格[J].纺织学报,2003(4):34-36,4.
[4] 陈雁,李栋高.服装颜色风格的客观评价[J].纺织学报,2003(1):80-83,6.
[5] 李一磊,李继云.基于MDFT的服装风格决策模型[J].计算机应用与软件,2011,28(10):170-173.
[6] 汪珊娜,张华熊,康锋.基于卷积神经网络的领带花型情感分类[J].纺织学报,2018,39(8):117-123.
[7] 吴欢,丁笑君,李秦曼,等.采用卷积神经网络Caffe Net模型的女裤廓形分类[J].纺织学报,2019,40(4):117-121.
[8] BOSSARD L,DANTONE M,LEISTNER C,et al.Apparel classification with style[C]//Asian Conference on Computer Vision.Korea: Springer-Verlag Vision,2012:321-335.
[9] 于媛媛,涂红燕,廖喜林.无领领型结构设计方法探讨[J].天津纺织科技,2017(2):35-37.
[10] 邓洪涛.衣领造型设计原理分析[J].丝绸,2005(3):44-45.
[11] 谭琳月,李晓燕,吴圆圆.衣领造型对服装风格的影响[J].轻纺工业与技术,2015,44(2):39-41.
[12] DUFFY K R,HUBEL D H.Receptive field properties of neurons in the primary visual cortex under photopic and scotopic lighting conditions[J].Vision Research,2007,47(19):2569-2574.
[13] SERMANET P,LECUN Y.Traffic sign recognition with multi-scale convolutional networks [C]//International Joint Conference on Neural Networks.California:International Neural Network Society,2011:2809-2813.
[14] 张玮,张华熊.基于卷积神经网络的纺织面料主成分分类[J].浙江理工大学学报,2019,41(1):1-8.
转载注明来源:https://www.xzbu.com/1/view-15195947.htm