远程抄表的人工智能设计
来源:用户上传
作者:
摘 要: 基于人工智能的卷积神经网络框架,对电表采用轮廓分析进行特征提取,实现0到9的电表数字识别。步骤是先通过设备拍摄电表读数,获得图像后对图像进行灰度化和二值化处理,然后进行字符分割、图像识别和相应的特征值提取,最后识别出电表的读数。
关键词: 人工智能; 抄表; 卷积网络; 分割
中图分类号:TP18 文献标识码:A 文章编号:1006-8228(2020)04-94-04
Design of artificial intelligence for remote meter reading
Ding Chenyang, Ma Xiaopu, Ye Jing
(School of software, Nanyang Normal University, Nanyang, Henan 473061, China)
Abstract: Based on the convolutional neural network framework of artificial intelligence, the contour analysis is used to extract the features of the meter, and digital recognition from 0 to 9 of the meter is realized. The step is to take the reading of the meter through the equipment, obtain the image, then grayscale processing and binary processing are carried out for the image, and carry out the character segmentation, image recognition and the corresponding feature value extraction, and finally recognize the reading of the meter.
Key words: artificial intelligence; meter reading; convolutional network; segmentation
0 引言
在我国,仍然有一些偏远地区和落后地区在用着比较老式的电表。而为了统计每家每户的电的使用情况,就会派遣大量的劳动力进行手动抄写与记录,投入巨大的人力物力。并且会因某些人为因素无法准确的抄写电表度数,出现读错和漏读的情况,其投入成本也大大提升。同时,我国某些地方的水电站或者其他需要用到仪表的危险区域,也需要派遣相关的工作人员进行手动抄写,增加了工作量和工作人员的生命危险,工作效率也低下。所以我们研究了基于人工智能的深度学习电表读数识别软件,希望能为一些人工抄取读数比较困难或者在比较危险地域工作的人员提供一些技术手段。我们的研究在一些电表使用需求比较多的地方,还可以进行电表数据的实时监控。
本设计通过基于深度学习将电表数字读出,减少人力物力的投入,并且减轻抄表工作负担和降低生命风险,具备了一定的科学研究价值和应用价值。
1 图片切割处理
电表数字是连在一起的,需要进行分割,然后对单个数字进行识别处理。图像分割,可以看作是通过图像的某些特征或者某些特征的相关集合,例如灰度,颜色,纹理等等的相似性原则,从而对某些图像的像素进行分类,把图像的平面分成具有一些一致性的不重叠的区域。图像分割的常用方法有基于阈值的分割方法[1],基于边缘的分割方法,基于区域的分割方法,基于图论的分割方法,基于能量泛函的分割方法等[2-4]。
阈值法的主要原理是通过图像的灰度特征从而得到计算灰度相关阈值,然后把每一个像素的灰度值和规定好的阈值进行数值上的比较,并且通过相关的计算机语言算法把比较的结果放入到较合适的组中。足以可见,阈值的确定是关键,因为可以通过阈值将我们获取的图像进行合理切割。而如今在图像切割问题上,有许多高效的切割方法为我们提供了有效的解决方案。比如边缘法、区域法、图论法、能量泛函法等等。
边缘法指的是对灰度值的边缘进行检测,但是对噪声比较敏感是一个不足点。当噪声的频率较大时,即使其幅值很小,也可能会导致错误的测试结果。所以我们通常需要结合滤波器一同使用。比较常见的有Sobel算子等。
区域法是通过相似性原则将我们所获取的图像区分为不同的模块,通常会使用种子区域生长、区域分裂合并和分水嶺等方法。
图论法是将图像分割与图的最小剪切问题进行融合。其实质便是将特定的边移除,将图像分成为几个子图,从而完成对目标图像的分割。因为每一个像素之间都会被赋予一个权值。由此可见,图论法对目标的形状并不敏感,有可能会出现运算时间过长的问题。
能量泛函法主要指的是基于活动轮廓模型的相关算法,其基本原理是通过连续曲线来表示所需的目标边缘,而分割过程便是求解能量泛函的最小值的过程,可以使用欧拉方程来实现这个需求,当能量达到最小时其曲线位置就是我们目标轮廓所在。
图像分割技术一直以来与信息领域的其他学科有着许许多多的内在联系,数学、人工智能、计算机等学科中新理论和新技术的出现,蕴育出了许多结合特定理论的分割方法,例如基于小波分析的多尺度分割技术、基于人工神经网络的分割技术、基于随机场理论的分割技术等,新的分割方法出现,使得图像分割的研究趋向实用化、智能化、多样化。
我们采用了简便的阈值法进行电表图像分割。因电表表盘图像每个像素点都是三色的。一般在这种三色RGB通道下,我们很难将我们所需要的数字和背景很好的区分出来,所以需要对电表表盘图像进行一些相关的预处理,首先我们将每个像素的RGB值都用一个权值代表,该值一般被称为灰度值。如果大于设定好的阈值就为黑色,反之为白色,我们在这里将阈值设置为160。我们可以用0或1来分别表示白与黑。为了更加方便理解,我们可以假设现有一张电表表盘图像,背景的灰度值集中在200上下,而字符的灰度值集中在30左右,那么就可以规定一个中间值,如果这个像素点小于这个值我们不妨将其全部变成0,大于这个值的像素点全部设为1,如此一来就实现了简单的分类。经过上述处理,图片已成为一个二进制矩阵,0是背景,1是字符(也可定义以0为字符,1为背景,具体根据研究需要),然后将每一列的1和0分别统计,根据每一列的二进制总和来切割字符。 2 卷积神经网络识别电表数字
深度学习常用架构分为深度神经网络,卷积神经网络等[5]。深度神经网络是基于感知机的扩展,有很多层或很多感知机的神经网络。英文名字叫multi-Layer perceptron或者deep neural network。初始的深度神经网络存在一些问题,采用的是全连接的形式,隐藏层可以用很多层,每相邻的两层之间是全连接的。导致出现数量巨大的权值参数,容易过拟合。
随着神经网络的加深,优化函数易陷入局部最优解,与真正的最优解偏离太多,性能甚至不如浅层网络。选用sigmoid来激活传递函数,梯度会衰减,随着层数的增加衰减累积,最后梯度基本为0。关于数值为1的元素,在举行反向传播梯度运算时,每传送一层,梯度衰减为本来的1/4。梯度指数衰减后低层基本上接受不到有效的信息,进而无法对时间序列上的变化进行建模。卷积神经网络(convolutional neural network),适合处理高维的大数据。因为不是全部的上下层神经元都直接连接,而是通过卷积核进行操作。同一个卷积核在所有图像内是同享的,图像经过卷积操纵后仍然可保留原先的位置干系。对于图像,若是没有卷积操纵,学习的参数量将庞大无比。由于卷积神经网络缩小了参数的个数并突出了局部结构的这个特点。每层神经元的信号只可向上一层传播,样本的处置在各个时候独立,于是卷积神经网络又被称为前向神经网络。
基于深度学习框架的卷积神经网络,包括卷积层,激活层,池化层,全连接层等。卷积层主要的功能是进行提取特征,我们通过卷积核进行特征提取与映射,在卷积层中它的内部包含一个或者多个卷积核,同时,构成卷积核的每一个元素都会同时对应一个权重系数w和一个偏差量b,类似于一个前向传播神经网络的神经元。与此同时,卷积层中的每一个神经元都与前一层中地方靠近区域的多个神经元连接。最重要的是,区域的大小取决于卷积核的大小。在我们研习的过程中,卷积层包含卷积核大小、步长和填充三个元素,三者协同决定了卷积层输出特征图的大小。我们在对图像特征提取的过程中,时常会使用按0填充或重复边界值填充。由于卷积是一种线性的运算,所以我们需要增加一些非线性的映射,比如卷积层中包含激励函数来帮助表达其复杂的特征。在这里要说明一点,激励函数的操作通常在卷积层之后,但是激励函数在一些预激活技术的算法中是位于卷积层之前使用的。
通过卷积层和激活层后,我们将使用池化层来进行下采样,对切割后的电表表盘图做一些稀疏处理,因为这样可以减少一些数据运算量。在卷积层做特征提取后,输出的特征图会被传送到池化层进行信息过滤和特征拣选。其中,池化层包含预设定好的池化函数,预设定好的池化函数的功能是将特征图中的单个点结果替换为它的相邻区域的特征图统计量。池化层选择池化区域与卷积核扫描特征图的过程一致,由池化大小、步长和填充控制三个元素共同来确定。在我们的小组学习中,学习到较于均值与极大池化,混合池化与随机池化也具有正则化功能,这样对避免卷积神经网络的过拟合有好处。
全连接层的作用是通常在卷积神经网络的尾部进行重新拟合,这样的话就可以减少特征信息的损失。卷积神经网络中的全连接层与传统前向传播神经网络中的隐含层等同。全连接层正常情况下位于卷积神经网络隐含层的最后部分,且只向其他全连接层传递信号。相关的特征图在全连接层中将失去空间拓扑结构,同时会被展开为向量与激励函数。在学习中,我们明白了卷积神经网络中卷积层和池化层能对输入数据进行一些特征提取,而全连接层的作用是对提取的特征进行非线性组合来获得输出,故我们不期望全连接层本身具有特征提取的功能,而是希望利用现有特征来完成本项目的学习目标。
3 实验与结论
整理收集数据集,从生活中和互联网上搜集,搜集到相关仪表数字图片,图片数字按照0-9共计10个数字分门别类进行保存和整理,每个数字大约有50张数据图片,整个数据集共计500张,整理到一个文件夹,并制作成相关的数据集,以方便在后续的模型训练中使用和提取。电表图片分割之后,将每一个字符的图片分割出来并且制作好相应的数据集后,就可以根据模板来判断是哪个字符了。对制作的500张图片的数据集不断的纠正和优化。然后,将制作好的0-9的数据集喂入卷积神经网络,提取数字,经过前向传播,反向传播等方法进行训练,并且得到相应的训练模型,并通过一些相关的算法进行模型的准确率的调整和提升,检验相应模型的准确率。经过卷积神经网络模型训练,可以达到良好的准确率。最后将准备好的电表图片喂入模型,进行测试,实验证明,都可以识别出来。电表数字如图1所示,灰度图片如图2所示。数字的识别效果如图3所示。
基于深度学习的卷积神经网络框架实现了对电表读数识别,在排除干扰的基础上,识别精度可以达到98%以上。但仅适用于要求不高的一些场景,对电表仪表数字图片的清晰度有较高的要求。项目的成果可以为社会带来很大的经济效益,我国国土辽阔,有很多地方交通不方便,抄表需要消耗巨大的人力物力,费时费力效率低,而我们通过远程拍照就可以实时识别出电表读数,进而提高工作效率。抄表的工作人员不再需要一家一户的上门登记,各方都得到了便利。
参考文献(References):
[1] 舒红平,蒋建民.基于灰度最优阈值的图像分割方法及应用[J].重庆工商大学学报(自然科学版),2003.20(4):80-83
[2] 劉瑞林,谢芳,肖承文.基于小波变换图像分割技术的电成像测井资料裂缝、孔洞面孔率提取方法[J].地球物理学报,2017.60(12):4945-4955
[3] 陈超,宣士斌,雷红轩.基于狼群算法与二维最大熵的图像分割[J].计算机工程,2018.1:233-237
[4] 张军国,冯文钊,胡春鹤.无人机航拍林业虫害图像分割复合梯度分水岭算法[J].农业工程学报,2017.33(14):93-99
[5] 曾锋,曾碧卿,韩旭丽.基于双层注意力循环神经网络的方面级情感分析[J].中文信息学报,2019.33(6).
转载注明来源:https://www.xzbu.com/8/view-15229418.htm