人工智能中图像识别技术的应用分析
来源:用户上传
作者:
摘要:随着时代的发展,图像识别技术作为人工智能领域中的一项核心技术,在人们的工作和生活中发挥着越来越重要的作用。本文从图像识别技术的基本原理出发,分析了其在人工智能中的发展现状,寄希望图像识别技术能得到更广泛的应用。
关键词:人工智能;图像识别技术;应用
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2019)12-0172-02
图像识别技术作为信息时期的一项重要技术,其主要用途是通过计算机对相关的物理信息进行识别,识别过程主要包含获得信息、信息预处理、图像特征分类、分类设计与决策等。目前,在人们的日常工作和生活中,通常会不经意地接触到图像识别技术,例如,指纹识别、条形码的识别、人脸识别等[1]。且随着时代的发展,科技的进步,图像识别技术在不断演变过程中将具有更为广阔的运用空间,尤其是在安全检查、产品质量、信息搜集、医疗设备等各个领域,都需要图像识别技术的参与,因此,图像识别技术的深入研究,对社会的进步和经济的发展都具有重要的意义。
1 图像识别技术原理
图像识别包括人类图像识别和计算机图像识别,人类图像识别通常与计算机形式的图像识别并无本质区别,只是机器不会被人类所具备的听觉、视觉等感官差异所影响。人类的图像识别不只依靠脑海中所存储的图像进行辨认,其在进行图像识别过程中,还会依赖于图像识别自身所具备的特征对其实施分类,并依据不同特征的类别,对图像进行处理。例如当人们看到某张图片的时候,大脑通常会依据存储在脑海当中已经完成分类的图片进行识别,并查找脑海中已知相似的或者具有相似特征的图片,由此完成对该图像的识别[2]。通过计算机完成图像识别的技术与人类的识别相似,也是依据分类以及提取相似特征,对多余的信息进行排除的方式完成图像识别。计算机所获取的相关特征有时表现极为明显,有时却比较普通,其通常会对计算机所具备的识别速率造成一定影响。因此,通过计算机进行视觉识别,图像表现的内容通常是以图像的特征对其实施描述。
2 人工智能中图像识别技术的应用
2.1 神经网络的图像识别技术
神经网络式图像的识别技术可以进行图像的识别,主要是因为其能够对神经网络的算法进行应用,而在图像的识别中运用神经网络,首先要对有关图像实施预处理,其预处理的方式包含真彩图转为灰度图、灰度图的放大以及旋转、灰度图实现归一化等相关内容。想要确保神经网络可以更有效对图像进行识别,还要根据图像识别的具体领域以及对象,设计出具有针对性的神经网络,该设计通常包含设计输入层、隐含层、输出层,以及选取初始权值、期望误差等5方面[3]。具体表现为:1)在对输入层进行设计的时候,需要依据识别对象的具体需求,对求解的实际问题以及数据的具体表示方式进行确定,本次研究当中,为了便于对神经网络的理解,输入层的设计统一成为尺寸为16×16大小的图像样本,网络输入为256维;2)在对隐含层实施设计的时候,需要对隐含层的具体数目以及单元数进行确定,当前领域已经对隐含层的具体神经元数目进行了明确,以确保误差的精度得以有效降低。因此,对隐层数目进行适当的增加,就可以对神经网络实现有效的设计,而在对隐含层的单元数进行选择的时候,通常以经验公式作为参考,其可以使神经网络出现较弱的泛化能力得以有效避免[4]。对样本的识别率较低的问题而言,公式当中的M通常表示为输出层的神经元数目,N通常表示输入层的神经元数目。需要注意的是,对具有较小影响的隐含层的单元进行删除,能够使神经网络所具备的性能得以有效提高,但是,该结构的唯一缺陷就是需要花费较长的时间;3)在对输出层进行设计的时候,通常会选择较多的输出型,对神经网络实施设计;4)在对初始权值进行选取的时候,想要使神经网络在实际学习的时候具有良好的收敛,初始权值通常选择为(-1,1)两者间的随机数;5)在对期望误差进行选择的时候,其通常需要对训练的时间以及预期的误差值进行参考,研究通常以0.001为研究的期望误差值[5]。
神经网络完成相应设计之后,就需要对神经网络实施训练,以此确保对图像识别的需求进行满足。例如,研究中以MATLAB7.0当中的newff函数进行运用,构建相应的两层网络,该网络通常包含输出神经元1个、输入层16×16个、隐含层26个单元,学习的函数为learngdm,初始的学习速率通常为0.01-0.6,训练性能的函数为“mse”,训练的指标为0.001,训练的最大循环为2500。通过对上文的神经网络完成设计以及训练之后,就需要对其实施运用实验,该实验当中,通过神经网络,对手写的26个英文字母图实施识别,表1为该实验的识别结果,由此可知,不同节点所具有的数目通常会对图像识别所具备的识别率产生直接的影响。
2.2 非线性降维的图像识别技术
对于计算机而言,其图像的识别技术属于异常高维的一种识别技术。不论图像具备任何分辨率,其所形成的数据通常都是多维的,这就会对计算机实现有效的识别产生较大的困难。想要使计算机自身具备较有效的识别能力,最有效且直接的方式就是进行降维。降维主要分为非线性降维以及线性降维[6]。例如,实施线性的奇异分析(LDA)以及主成分分析(PCA)等,就属于线性的降维方式,其虽然具备易理解、简单的特点,但是,以线性降维实施处理的属于整体性的数据集合,所获得为数据整個集合最佳的低维投影。通过验证,线性降维的方式,计算通常具有较高的复杂度,且占用的空间以及时间通常较多,这就会形成非线性的降维式图像的识别技术,其通常属于较为有效、科学的非线性的提取方式。该技术不仅可以对图像所具备的非线性结构进行发现,而且还能够在不破坏图像自身结构的前提下实施降维,以此使计算机式的图像识别能够在尽可能低的维度上实施,从而使图像的识别速率得以有效提高[7]。例如,在对人脸进行识别的系统中,通常会被图像维度所影响,其不仅会使人类的识别系统通常需耗费较多的时间,而且还会对计算机系统造成较严重的损坏,其主要是因为人脸处于高纬度空间的时候,会具有不均匀分布的特征所导致的,而非线性的降维识别技术在实现运用后,人脸的图形就能够实现有效的紧凑,从而使人脸的识别系统效果得到有效的提高。
3 结束语
综上所述,图像识别技术虽然在人工智能的应用中属于一种新兴技术,但是已经在社会的各个领域发挥着越来越重要的作用。目前,我国已经进入信息化时代,只有让人工智能技术和图像处理技术得到不断融合、发展,才能进一步保障人民的财产安全,促使经济得到持续、有效发展。
参考文献:
[1] 张嘉丰.关于人工智能中图像识别技术的研究[J].电子技术与软件工程,2018(23):250-251.
[2] 吕萌.计算机人工智能识别技术类型及其应用[J].电子技术与软件工程,2018(20):249.
[3] 鲁琴,孟瑶.基于互联网的动态图像信息智能提取系统的设计[J].电视技术,2018,42(09):47-51.
[4] 徐勤涛,杨自恒,朱伟男,等.基于神经网络的图像识别技术与方法探讨[J].通讯世界,2018(07):100-101.
[5] 宋炯,柏松平,王燕华.基于人工智能的图像识别技术探讨[J].科技传播,2018,10(01):106-107.
[6] 张瑞,赵秀峰.浅析用于监控智能报警系统的图像识别技术[J].中国新通信,2017,19(08):144.
[7] 周林妹.基于计算机图像技术的系统识别技术应用研究[J].信息系统工程,2016(10):35.
【通联编辑:唐一东】
转载注明来源:https://www.xzbu.com/8/view-14789206.htm