基于图像处理的人眼检测技术研究
来源:用户上传
作者: 陈景福 杨扬
摘要:人眼的自动定位是人脸识别研究中的一个基本且非常重要的课题,因此快速准确的定位人眼对许多实际的应用是十分重要的。
关键词:人眼定位 人脸检测 肤色提取
引言
人眼的检测与自动定位是人脸识别研究中的一个非常重要的课题,鉴于目前眼睛检测算法存在的问题,尝试并提出改进算法,具有重要研究价值。人的面部特征,特别是人眼在日常交往中(包括眼神、示意、表情和目光等)对外界信息的理解,不仅能解读出复杂的“弦外之音”,而且能感受到默契、示意和友善等微妙的“言外之意”,是单存的语言所不能完全包容的。人眼自动识别作为一种重要的身份鉴别方法,广泛的应用于公安、银行、海关、邮政和商业等部门。与利用指纹等其他人体特征进行身份鉴别相比,它有直观、友好和方便的特点。基于这种原因,人眼识别的研究近几年来得到广泛的重视。
眼睛自动定位是人脸识别中一个非常重要的课题,因为与人脸其他部件如鼻子、 嘴巴相比,眼睛区域不仅包含了丰富的区别于其他人的重要信息,而且是对图像进行旋转校正、归一化和均匀化的前提,同时也是人脸其他部位检测和提取的基础。目前人眼定位的算法有:可变形模板法,灰度投影法,边缘提取法等。可变形模板法虽然能同时得到眼睛的位置和形状信息,但定位速度慢,而且其中包含的寻优过程是否收敛往往依赖于参数初始值的选择。灰度投影法是根据波峰波谷的分布信息来定位眼睛,定位速度较快,但波峰波谷的分布对不同的人脸和姿势的变化非常敏感,定位精度较差,容易陷入局部最小而导致定位失败。边缘提取法是首先对人脸图像进行边缘提取,然后用霍夫变换检测眼球,构造一个包括眼睛、眼睑的眼部模板,用一系列函数从能量角度找出眼睑,该方法需要做大量预处理,参数过多的眼部模板不适用于个体差异太大的人脸。
常用的眼睛定位算法眼睛定位在人脸识别中具有如此重要的地位,于是人们研究各种算法来实现眼睛定位,主要可以分为以下几类:霍夫变换法、变形模板法、边缘特征分析法和对称变换法等。本文将肤色信息、人脸面部几何特征和人眼灰度信息相结合,可以提高定位效率,更好的适应背景、尺寸等细节,在人脸实时检测系统中具有很好的应用价值。
(一)霍夫变换法
假设经预处理已经得到包含眼球的图像EP ,为了节省检测眼球的时间并避免镜片反光点边缘产生的干扰,先用小灰度聚类法粗定眼球中心点,以此缩小检测范围,聚类的过程是将图像 Ep 中灰度值最小的 n 个像素,按列递增的顺序排序,若相邻的列数差值都未超过预先设定的门限T,说明只有一个聚类中心,求出这些像素行列的平均值就是要找的眼球中心点;若超过了门限T,说明这 n 个像素可以聚成两类,对左眼,因为阴影、镜脚集中在左边,所以取右边那类的平均值;对右眼,则取左边那类的平均值;n 的选择可根据图像 Ep 的总像素数目及眼球占图像的大致百分比决定。在用霍夫变换检测眼球前,先用 Canny 算法提取边缘。对于比较细长的眼睛,由于眼球的上半部分较多地被眼皮覆盖,所以改用检测下半圆,这样更可靠且省时。
(二)变形模板法
模板匹配法主要是模板的选择,根据所选模板的维数可分为二维可变形模板和三维可变形模板。二维简单眼睛模板,由于人脸的旋转角度是任意的,当旋转角度比较大时,其中一部分眼白就会看不见,所以为了适应人脸向两侧作较大角度的旋转,就增加了两个单眼白的简单眼睛模板,当垂直旋转角度大于 30°时,就使用仅有左眼白的简单眼睛模板,当旋转角度大于-30°时,就使用仅有右眼白的简单眼睛模板,若旋转角度介于-30°和 30°之间,就使用正常的双眼白简单眼睛模板。简单二维眼睛模板可以用如下数学形式表示:SimpleEye= SimpleEye(S,x,y) 公式 在进行眼睛定位时,不断改变简单眼睛模板的尺寸参数 S和眼球中心位置参数(x,y),当模板与人脸图像取得最佳匹配时的对应的尺度 S 就是眼睛的大小,中心位 置(x,y)就是眼睛在人脸图像中的位置。匹配时采用的能量函数与三维可变形模板中的能量函数类似。
(三)边缘特征分析法
此算法所处理的图像为单人灰度图像,是利用图像的垂直灰度投影曲线,根据凸峰宽度确定人脸的左右边界,然后利用人脸区域的水平灰度投影曲线确定头顶及鼻子中部形成的上下边界。利用预测法先确定人眼在眉眼区域的大概位置,通过检测眉眼部位的边缘及边缘分组,确定双眼的坐标位置。观察不同单人脸图像的垂直灰度投影曲线时,可以发现人脸所在区域将使垂直灰度投影曲线形成一个具有一定宽度的凸峰。这个凸峰的左右边界大致代表了人脸的左右边界。取左右边界之间的人脸区域作为研究对象,作该图像的水平灰度投影曲线。曲线的第一个极小值点对应人的头顶,因为头发的低灰度产生了水平投影曲线的低谷,而曲线的最大值点和次最大值点分别对应人的额头部位和人的鼻中部,从而大致确定眼眉所处的水平位置。在边缘检测前先对眉眼区域进行去噪、增强处理,使图像平滑,这是保证下面边缘检测获得较好效果的关键步骤。然后用 Canny 算子求出眉眼区域的边缘图像,求解时阈值取得较高,使得边缘点仅由眉毛和眼睛的强边缘以及瞳孔产生的强边缘组成,而不会包含由鼻子的轮廓产生的弱边缘。随后将边缘点进行分组,其中位于下面的两分别为左右两眼产生的边缘,取这两个边缘组的中心作为人眼的中心。
(四)对称变换法
在计算机视觉研究中,对称性被认为是物体的基本性质之一,通常在将物体从背景中分割出来后,用来简化物体形状的描述,或物体的近似。目前研究最多的是点对称(也叫中心对称)和轴对称,对人脸而言,眼睛、鼻子、嘴巴等都有很弱的点对称性,广义对称变换 GST(Generalized Symmetry Transform)是用来描述物体的点对称。利广义对称变换定位人眼进而提取脸部特征,在广义对称变换的基础上,定义了一种方向对称变换 DST(Directional Symmetry Transform),用于人眼的精确定位。以上的对称变换利用了人眼的中心强对称和脸部特征的生理几何分布,对人脸偏转、脸部表情变化、光照变化等因素的左右不敏感,因而具有很好的适用性。但是,以上对称变换的计算需要在大范围的尺度上进行,计算量很大,而且,由于只是描述了各点的局部对称性,当它用于人眼的定位时产生的候选点较多,不太利于眼睛的精确定位。
结合广义对称变换和方向对称变换的优点,提出一种新的对称变换――离散对称变换。离散对称变换实际上可看成一种非线形滤波,由于对每个像素点都进行 相同的领域处理,适合于并行处理,在定位圆形物体圆心时,算子领域采用圆环。通过图像的离散对称变换后,眼睛中心点附近像素的对称值一般都处在对称值最大的前四、五位,对具有强对称值的候选点,采用两条简单的规则进行筛选。规则1:邻近像素合并,一般选取对称值内最大的前 10 位候选点,将其中位置相邻的候选点合并到它们中对称值最大的像素处;规则2:几何约束判别,对经过规则1筛选后的候选点,利用眼在脸部的几何分布性质进一步筛选,取基本符合眼睛分布规律的两点作为最终的定位双眼结果。
转载注明来源:https://www.xzbu.com/1/view-1665097.htm