基于形态学的数字符号图像骨架的识别方法研究
来源:用户上传
作者: 张胜军 赵雪萍
摘要:在数字符号图像骨架的识别中,对于数字符号图像骨架的多样性和复杂性,尚缺乏一种准确和通用的识别方法,对此提出了基于形态学的数字符号图像骨架的特征值提取方法。该方法定义了骨架中的端点、节点等概念,利用数学形态学的方法识别图像骨架。计算机仿真表明,该方法不仅具有通用性,而且具有很高的准确性。
关键词:数字符号;图像骨架特征值;数学形态学;识别方法
0 引言
图像骨架特征提取是图像处理的重要内容。图像骨架往往反应了图像的重要特征,提取骨架的特征值,是要使目标图像更加准确地被反应出来,特征值提取的好坏,会直接影响图像识别的正确率。但是,由于图像的复杂性和不确定性,对图像骨架的特征值提取,会受到骨架结构特征的影响。
图像识别方法已初步形成三大类:统计识别、结构识别、人工神经网络识别等。具体到统计决策识别,句法结构识别和人工神经网络识别这三种方法它们各具优缺点。结构法采用分而治之的方法,把一个复杂的任务分解为若干个复杂程度较低的子任务。这种方法对细节特征敏感,容易区分相似文字,文字变形后适应性好。缺点是需要进行笔划抽取,在图像质量不佳的情况下,结构特征难以抽取,且不稳定。
本文主要研究数字仪表表盘数字的识别。数字图像的骨架结构比较简单,图像都是在比较好的室内条件下拍摄,经过图像的前期处理后,数字符号图像骨架都能比较好地反应数字符号的特征,因此,采用结构法识别对数字图像符号,可以尽可能地发挥方法的优点。结构识别我们将通过数学形态学方法。实现。
1 基于数学形态学的特征值提取方法介绍
形态学图像处理是以几何学为基础的,其基本思想是:利用一个称作结构元素的“探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分间的相互关系,从而了解图像的结构特征。
本文主要是利用形态学对图像骨架的端点进行识别。本文定义了图像骨架端点:表示8连同域中,只用―个像素与其相邻,我们称之为端点。如2,5,7,6,9的端点数是2;而3,4的端点数是3,表示8连同域中,只用―个像素与其相邻,我们称之为端点。
在考察分析图像时,要设计一种收集图像信息的探针,称为结构元素s。它是E(n),或其子空间E(m)(ffKn)中的一个集合。结构元素可以设置为一定的几何形状,如菱形、正方形、圆形、线段等的集合。设计者通过对图像的分析和理解,选择合理的结构元素,在图像中不断移动结构元素便可以考察图像中各个部分之间的关系,从而分析图像中图像背景、目标图像等各种区域之间的关系。结构元素s在形态学运算中的作用类似于在信号处理时的“滤波窗口”或一个参考模板。
根据本文的定义,我们可以选取8连同域中,只用一个像素与其相邻的结构元素。这样的结构元素有8个。这样我们可以对端点进行统计和定位。
2 数字符号图像的特征值提取
为了使数字能够区分出来,本文采用了以下几个特征表示参数:欧拉系数(Enul),斜率(K),端点数(N),端点集中区域(D)。
在对数字图像处理后的细化二值图像的辨识上,上面给出的几个特征参数是本文所述数字图像识别技术的亮点之一。借助于这些参数克服了以前数字匹配识别、特征提取识别等方法容错能力和通用性较差的弊端。通过对数字符号骨架图的分析我们可以对图像特征作如下的区分:
(1)小数点、1和其他数字的区分
小数点和1在分割原始图像的时候,它们的水平宽度是小于其他的数字的,从而,我们可以把小数点和1与其他的数字进行区分。1和小数点的区别在于它们的水平投影是不同的。因此,我们可以区分小数点、数字1和其他数字。
(2)欧拉系数区分
欧拉系数是用来表示骨架途中圆形环与骨架整体数目之差的值。例如2,3,5,7的欧拉系数是1;而4,6,9的欧拉系数是0;8的欧拉系数是-1。
(3)端点数区分
定义端点如4.3节中,表示8连同域中,只用一个像素与其相邻,我们称之为端点。如2,5,7,6,9的端点数是2,而3,4的端点数是3。
(4)端点分布域
首先把单个数字分成上左、上右和下左、下右四个域。端点分布域是指端点落在我们分好的一个域中。如6和9的区份是:6的端点是分布在上域中,而9的端点分布在下域中。这样我们就可以很容易区分6和9的区别了。2和5的区分是:2的端点分布在上左和下右两个区域,5的端点分布在上右和下左两个域中,这样我们就能区分2和5了。
(5)2和7的区分
由于7的写法不一样,因此,我们只能用垂直面投影法来区分2和7。显然,7的投影上部分像素点与下部分像素点的比值是不一样的。
1 2 3 4 5 6 7 8 90
1 2 3 4 5 6 7 8 9 0
图1仪表数字的数字与字体显示形式
从上面的分析中,我们发现最常见的上面的两种数字显示形式(图1所示),都符合上述的区分方法。
3 试验仿真及结果
本文所采用的数字图像是对仪表表盘的数字和汉字进行识别时候的图像。
图3是图2经过细化后的得到图像。在利用上述的方法进行识别的时候都能得到满意的识别结果,识别率达到98%以上;而且我们通过图1可以看出,在工业现场遇到的数字的形式也是多样的和复杂的。这说明本文的方法具有兼容性强,准确率高的特点。通过使用matlab试验进行识别显示,运算的速度也比其他的方法快,具有一定的实用性。
参考文献:
[1]张晋阳等.手背静脉图像骨架特征提取的算法[J].计算机应用,2007.27(1):152-154.
[2]杨志平.数学彬态学在空间格局图像骨架提取中的应用[J].地球信息学,2003.32(5):411~413.
[3]黄凤岗,杨国,宋克欧.柔性形态学在图象边缘检测中的应用[J].中国园像图形学报,2000.5(A).4:254~287.
[4]徐志平.基于交叉视觉皮质模型二值图像形态学算法[J].计算机辅助设计与国形学学报,2007.19(8):990~994.
[5]戴汝为,郝红卫,肖旭红.汉字识别的系统与集成[M].浙江科学技术出版社,1998.
[6]赵春晖,张兆礼,梅晓丹.现代图像处理技术及Matlba实玩[M].人民邮电出版社,2001.
转载注明来源:https://www.xzbu.com/8/view-1085384.htm