对基于深度学习的商品图像识别方法分析
来源:用户上传
作者:汪家琦 郭源
摘 要:现如今,市场上商品数量不断增加,想要实现商品的高效流通就要对商品图像识别技术进行分析,以此切实提高服务质量。本文在简单了解商品图像特征的基础上,对深度学习技术进行了全面的了解,在此基础上,设计了商品图像识别平台,并且结合实际案例,具体分析这一平台的应用情况,以供参考。
关键词:深度学习 商品图像 识别方式 准确性
中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2020)01(b)-0129-02
零售店作为大型商超的有效补充,满足了互联网时代消费者的需求和偏好,在实际发展过程中,便利店占据了巨大的市场,但在发展过程中,运营成本不断增加,尤其是门店租金、人工成本等方面均呈现出上涨趋势。开发出基于深度学习的商品图像识别方法,可以让商品流通速度加快,为顾客提供优质的服务。
1 商品图像特征和深度学习技术
1.1 商品图像特征
商品在设计过程中,为了刺激消费者购买欲,同时保证商品的辨识度,商品图像特征非常丰富,常见的图像特征可以分为两大类,一种是底层视觉特征,也就是商品的全局特征和局部特征,另一种是商品的中间语义特征,在进行商品识别的过程中,主要应用的是底层视觉特征。也就是,商品的图像特征,可以具体分为以下几种,具体包括:颜色特征、形状特征、纹理特征、点特征、语义特征等多个方面。这几个特征中,颜色特征是最为直接的方式,利用颜色直方图就可以获取得到商品图像的颜色分布,而形状区域和轮廓边界都可以进行区分,通过具体的检测算法就能够有效提取出商品的特征点。图1是实体零售图像识别的一种过程。
1.2 深度学习技术
深度学习技术是建立在神经网络上的一种感知技术,常见的神经网络包括:神经元模型、感知机、BP算法、卷积神经网络等。以卷积神经网络为例,这是目前应用范围最广的一种神经网络,在人脸识别、语音识别、车牌识别、物体检测等方面得到了广泛应用。卷积神经网络和BP神经网络较为相似,都是由输入层、中间层、输出层形式,但相比较而言,前者的中间层更为复杂。在实际应用过程中,这种神经网络具有巨大的优势,尤其是在网络深度、巨量图像数据处理上,最为重要的是,利用这种神经网络可以更好地完成学习训练。在确定具体的神经网络后,就可以开展深度学习,利用海量的数据,借助网络模型进行学习,数据中的特征学习是非常重要的内容,可以保证模型预测准确度得到提高。经过对目前几种主流深度学习框架进行对比分析后,选择了MXNet作为实验框架[1]。
2 基于深度学习的商品图像识别平台设计
想要真正开发出符合零售店发展的商品图像识别技术,就要设计出合理的平台和数据库,在实际发展过程中,使用平台进行图像采集、图像预处理,建立图像数据库,为后续的图像识别分析奠定良好的基础。
2.1 实验平台设计
所谓实验平台就是要搭建出一个自动识别平台,主要硬件设备包括:相机镜头、光源、置物台、机械支架、计算机等,以此完成商品图像获取,并且商品图像数据库和模型训练等工作也会在该平台上完成。软件部分则采用了VS013和Python IDLE这两个软件作为主要开发环境,图像处理工具上则选择了OpenCV软件,这一软件具有完善的计算机视觉和图像处理算法。通过二者结合,就能够实现图像采集、处理、数据集构建等功能。
2.2 图像预处理
由上可知,商品外包装千姿百态,尤其是商品结构、形状都存在一定区别,想要确保商品被准确识别,就要对商品图像进行全面的收集,每个商品的拍摄总数必须要在50张以上,每个面都要拍摄图像。以长方体商品为例,要拍摄6个面商品图像,因此每个面至少要拍9~10张图片;如果是塑料包装商品,一般可以选择正反两个面进行拍摄,每个面至少25张图片。完成图片收集后,就可以进行图像预处理,通过阈值分割、提取关键区域,继而就可以生成预处理图像。
2.3 扩充数据集
在此基础上,对预处理后的图像加入椒盐噪声、高斯噪声、泊松噪声等方式,让模型训练更加准确,并且变换图形几何,利用镜面翻转、多角度旋转等角度,对预处理数据进行进一步数据扩展,以此满足深度学习模型训练对大量样本熟练的要求,从而提高基于深度学习的商品图像识别准确性。
3 基于深度学习的商品图像识别实际应用
由上可知,深度学习在图像分类识别上具有较大优势,现如今,在多个领域中都得到了广泛的应用,将其应用在商品图像识别领域中,可以进一步降低人工成本,跳脱出时间、空间的限制。由上可知,利用基于深度学习的商品图像识别平台,可以让商品運输水平、效率得到提高。在实际应用过程中可以分为五个阶段,分别为:Alex Net网络结构、数据库准备、数据迭代器生成、训练过程、商品识别过程的实际应用[2]。
第一,神经网络。根据上文设计的平台情况来看,Alex Net网络结构可以为后续的计算训练奠定良好的基础,这种模型具有6000万个参数和6.5万个神经元,其神经网络采用的是卷积运算,不仅运算效率较快,准确性也相对较高。需要注意的是,Alex Net网络结构中涉及了多个参数项目,包括:网络层数、内核数量、内核尺寸、步长、填充、输出尺寸等。第二,数据库准备。根据软件所在的环境系统,最终选择利用Python语言开发数据库,所有商品图像的命名都用字母和数字代替[3]。第三,数据迭代器的生成。基于深度学习的商品图像识别方法在实际应用过程中必须要进行大数据学习,在这个过程中,可能会应用到几十GB的数据,因此训练学习的时间也相对较大。通过设计数据迭代器,都可以提高训练学习效率,节约成本。本文使用的MXNet框架就具有数据迭代器功能。第四,实际训练。在创建网络模型的基础上,就可以正式进行训练,直到正确率趋于稳定后,训练模型就可以保存,最终将训练好的网络模型应用在商品识别系统中。根据实际应用情况来看,基于深度学习的商品图像识别方法的准确率较高,可以持续训练商品识别系统,并且更新网络模型的参数文件。最为重要的是,其可以满足多个不同零售点的识别要求。如图2商品画像识别示意图,就是利用这种识别方法完成的识别,可以一次性精准识别所有商品。
4 结语
综上所述,深度学习技术作为一种高效、新型的图像分类技术,在实际应用中,具有高效率、低成本、高准确率的特点,可以推动“无人零售”这一概念得到真正的实现。通过本文分析设计,开发出了一款全新的商品图像识别系统,准确率较高,但还需要对这一系统中的缺陷进行进一步的完善,扩大其应用范围。
参考文献
[1] 李玫洁,温昕,蒋娜.基于深度学习的图像识别研究[J].科技广场,2017(10):178-180.
[2] 胡正委.基于深度学习的超市商品图像识别方法研究[D].中国科学技术大学,2018.
[3] 梅啟成,吕文阁.基于深度学习的商品识别方法研究[J].机电工程技术,2018,47(9):41-44,164.
转载注明来源:https://www.xzbu.com/1/view-15192589.htm