基于BP神经网络对薇甘菊预处理方法的选取
来源:用户上传
作者:
摘要 以入侵植物薇甘菊高光谱图像为研究对象,基于4种预处理方法对薇甘菊高光谱图像进行降低噪声处理,分别研究了基于主成分分析的特征提取方法和基于BP神经网络的分类模型,筛选出薇甘菊高光谱识别的最优预处理方法,以实现薇甘菊的快速准确识别。结果显示,预处理方法为一阶、二阶微分的识别率分别为81.2%和76.92%;标准正态变量变换(SNV)和一阶微分+SG平滑的识别率分别为89.74%和87.18%。多次试验得到基于SNV预处理方法的识别率最稳定,即得到最优预处理方法为SNV。
关键词 高光谱技术;薇甘菊目标识别;特征集选取;BP神经网络模型
中图分类号 S126 文献标识码 A
文章编号 0517-6611(2020)05-0246-04
doi:10.3969/j.issn.0517-6611.2020.05.069
开放科学(资源服务)标识码(OSID):
Abstract With invasive plants Mikania mikania Kunt hyperspectral image as the research object,based on four kinds of pretreatment method of M.micrantha hyperspectral image noise reduction processing,we studied the feature extraction method based on principal component analysis and the classification model based on BP neural network.The optimal pretreatment method for M.micrantha hyperspectral identification was screened,in order to realize fast and exact recognition of M.micrantha.The experimental results showed that the recognition rates of first and second orders were 81.2% and 76.92%,respectively.The recognition rates of standard normal variable transformation (SNV) and first order differential +SG smoothing were 89.74% and 87.18%,respectively.Multiple experiments showed that the recognition rate of SNVbased pretreatment method was stable,in other words,the optimal pretreatment method was SNV.
Key words Hyperspectral technology;Mikania micrantha Kunt target recognition;Feature set selection;BP neural network
薇甘菊(Mikania micrantha Kunt)與附主植物在可见光下视觉辨识度低,分布无规律,受复杂多变的野外环境限制,一般检测方法很难实现对薇甘菊实时精准监测。人工踏查[1]是比较普遍的针对薇甘菊的监测方法之一,但其受地形影响,无法对薇甘菊的分布及危害进行准确的定量评测。由于具有光谱分辨率高、波段多、信息量丰富等特点,高光谱监测技术应用于薇甘菊入侵的监测上具有很大的优势。
目前,监测方法主要有图像识别法、高光谱监测法、雷达数据辅助识别法和中低分辨率时序序列数据分析法等[2]。 Chance等[3]利用小型光谱成像仪(CASI)的图像,在加拿大不列颠哥伦比亚省萨里的非森林植被环境中提取喜马拉雅黑莓(Rubus armeniacus)、英国常春藤(Hedera helix)和其他物种的光谱,对所有的光谱通过光谱通道选择算法处理,结果表明对英国常青藤和喜马拉雅黑莓的检测准确率分别为80.0%和76.4%。而Narumalani等[4]对光谱图像进行去噪处理,基于光谱角匹配法检测了某区域内4种入侵物种及其分布,总体准确率为74%。
高光谱数据降维方法主要分为2种[5]:一种是基于变换的特征提取法,即通过数据变换产生一个新的特征空间,将全部波段的特征属性完成从高维空间到低维空间转换,从而保留尽可能高的分类精度。特征提取中典型的算法有包括主成分分析(principal components analysis,PCA)[6]、奇异值分解(singular value decomposition,SVD)[7]等。另一类是基于非变换的特征选择,也称局部特征波段选取。常见的波段选择方法包括基于信息量的波段选择以及基于类间可分性的波段选择[5]。鉴于此,笔者使用主成分分析法完成特征提取,以较低的维数达到较好的识别结果,提高识别效率。
准确地识别外来入侵植物是对其开展监测工作的前提与基础,任智伟等[5]通过将基于用PCA法和信息量改进PCA法对高光谱图像数据降维的结果输入最小距离分类器比较其分类精度来对比分析2种降维方法的效果。喻俊等[8]先利用S-Golay滤波剔除异常光谱数据,再采用光谱微分法与植被指数法构建光谱特征最后应用人工神经网络法结合因子分析法对典型植被进行分类识别。而吴培强等[9]以黄河口湿地为研究区分别建立支持向量机、人工神经网络和光谱角制图3种分类模型开展利用全波段的和所选择特征波段的分类对比试验。笔者通过成像光谱仪获取以薇甘菊为识别目标的高光谱图像,人工筛选获取薇甘菊类和非薇甘菊类高光谱数据来用作识别薇甘菊目标的研究,并基于主成分分析方法(PAC)对其做适当的降维处理。 1 薇甘菊数据的采集
高光谱图像的采集采用人工手持德国Cubert公司生产的S185高速成像光谱仪。共采集到薇甘菊高光谱图像27张,分辨率为1 000×1 000。部分薇甘菊高光谱图像样本如图1所示。观察统计显示,样本中包括3类其他植物叶子以及其中1类植物的花,还有一些黑色背景。
Cube Ware是与S185配套的光谱分析软件。通过易于操作的用户界面来记录和分析高光谱图像。主要用到信号即图像处理模块,即从Cube Ware中获取的高光谱数据样本的预处理,数据降维、BP神经网络模型的构建等都在Matlab 2018a中实现。
1.1 高光谱数据样本获取
通过Cube Ware软件打开样本集的薇甘菊高光谱图像,随机从18张图像中以像素点为单位采集高光谱数据,每个像素点对应1条高光谱曲线,每1条曲线所对应的光谱数据都能以ASCII码的格式保存(图2)。共采集到高光谱数据样本720个,该研究主要对薇甘菊进行识别,因此图片中出现的其他类植物分别记为其他类植物1,其他类植物2,其他类植物3叶子和其他类植物3叶子花,具体的样本采集数目见表1。
在主成分分析的基础上还可以通过主成分得分图初步地对样本进行分析判别。由图5可知,薇甘菊与非薇甘菊类(图中的其他类)样本均以坐标原点为中心聚集分布,证明第一、二主成分对高光谱数据具有一定的聚类效果。比较发现,标准正态变量变换聚类效果较好。同时,各主成分得分图中非薇甘菊类样本比薇甘菊类聚集更紧密,聚类效果更明显,但2类样本间交叉重叠明显,还需要基于支持向量机分类器对其进行精确分类。
4 BP神经网络建模
BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络[16]。BP神经网络是一种多层前馈,并通过误差反传训练的一种网络,其主要方法是梯度下降法,使网络的实际输出值和期望输出值的误差均方差达到最小[16]。该研究使用了BP算法信号的前向传播和误差的反向传播2个部分,计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行[17]。BP神经网络结构如图6所示。
将4种预处理后的主成分作为BP神经网络的输入建立神经网络模型,并相互对比,确定最优分类准确率的预处理方法。BP神经网络建模后,进行参数调节,隐藏层均设置为10,输出层神经元个数均设置为2,而后调试隐藏层和输出层学习率、训练次数等重要参数。对神经网络的参数进行反复调整直到获得最佳分类准确率。基于4种预处理方法分别建立4个神经网络模型。建模时按2∶1分为训练集和测试集。
从表2可以看出,基于SNV和一阶微分+SG预处理方法进行分类得到的分类准确率较优,但是就维度而言,SNV预处理方法的维度降到9,比一阶微分+S-G卷积平滑预处理方法降维程度要好。通过比较得到二阶微分对薇甘菊的识别效果最差。
从图7和8可以看出,通过SNV方法处理过得薇甘菊数据,得到的识别程度相比于一阶微分+S-G卷积平滑的更加稳定。结合上述分析,得出基于SNV对薇甘菊的识别效果更好。并得到最优的预处理方法为SNV,且主成分个数为9时,对薇甘菊的识别效果最佳。
5 结论
该研究主要以外来入侵植物薇甘菊为研究对象,对野外环境下高光谱数据进行分析研究。研究了高光谱数据的异常数據样本剔除及预处理方法,基于高光谱数据降维特征提取方法,基于BP神经网络的模型建立方法。该研究得出了以下结论:
(1)采集野外薇甘菊高光谱图像过程中,应用马氏距离剔除法剔除异常样本,分别剔除了薇甘菊类9个异常样本,以及非薇甘菊类9个异常样本,得到用于后续研究的光谱数据样本共702组,薇甘菊类351组,非薇甘菊类351组。
(2)通过4种预处理方法对高光谱数据预处理,从而达到了降噪、消除基线漂移等预期的效果,但其对识别模型建立的影响还需要进一步验证分析。
(3)对上述所得4个特征集分别进行了基于主成分分析法的高光谱数据降维,得到最大主成分为前25个主成分用于识别薇甘菊的特征集。比较分析显示,标准正态变量预处理方法使得高光谱数据聚类效果更好。
(4)对降维方法降维后特征集建立基于BP神经网络分类模型。在针对主成分分析降维后的4个特征集分别建立BP神经网络分类模型,确定了4个特征集中最终的主成分数目以达到特征集进一步降维的目的,并且得出所选主成分数目对应的测试集识别准确率。其中SNV-BP对应的测试集不但识别准确率高且其所建立的BP分类模型最稳定,最终确定基于前9个主成分数目基础上测试集识别准确率最佳为89.74%,从而验证了BP神经网络能够对野外薇甘菊进行识别。
参考文献
[1]柳帅,林辉,孙华,等.基于Pleiades-1卫星数据薇甘菊信息提取[J].中南林业科技大学学报,2014,34(11):116-119.
[2]孙玉芳,姜丽华,李刚,等.外来植物入侵遥感监测预警研究进展[J].中国农业资源与区划,2016,37(8):223-229.
[3]CHANCE C M,COOPS N C,CROSBY K,et al.Spectral wavelength selection and detection of two invasive plant Species in an urban area[J].Canadian journal of remote sensing,2016,42(1):27-40.
[4] NARUMALANI S,MISHRA D R,WILSON R,et al.Detecting and mapping four invasive species along the floodplain of North Platte River,Nebraska[J].Weed technology,2009,23(1):99-107. [5]任智伟,吴玲达.基于信息量改进主成分分析的高光谱图像特征提取方法[J].兵器装备工程学报,2018,39(7):151-154.
[6]张兵.高光谱图像处理与信息提取前沿[J].遥感学报,2016,20(5):1062-1090.
[7]VILLA A,CHANUSSOT J,JUTTEN C,et al.On the use of ICA for hyperspectral image analysis[C]//2009 IEE international geoscience and remote sensing symposium.Cape Town,South Africa:IEEE,2009.
[8]喻俊,李曉敏,张权,等.基于实测高光谱数据的太湖湖滨带典型植被分类[J].江苏农业科学,2017,45(5):240-244.
[9]吴培强,张杰,马毅,等.基于地物光谱可分性的CHRIS高光谱影像波段选择及其分类应用[J].海洋科学,2015,39(2):20-24.
[10]闵顺耕,李宁,张明祥.近红外光谱分析中异常值的判别与定量模型优化[J].光谱学与光谱分析,2004,24(10):1205-1209.
[11]FILZMOSER P,HRON K.Outlier detection for compositional data using robust methods[J].Mathematical geosciences,2008,40(3):233-248.
[12]况润元,曾帅,赵哲,等.基于实测高光谱数据的鄱阳湖湿地植被光谱差异波段提取[J].湖泊科学,2017,29(6):1485-1490.
[13]陈彦兵,况润元,曾帅.基于高光谱数据的鄱阳湖湿地典型植被识别分析[J].人民长江,2018,49(20):19-23.
[14]顾绍红,王永生,王光霞.主成分分析模型在数据处理中的应用[J].测绘科学技术学报,2007,24(5):387-390.
[15]唐红,郑文斌,李宪霞.主成分分析在光全散射特征波长选择中的应用[J].光学精密工程,2010,18(8):1691-1698.
[16]邱晨,罗璟,赵朝文,等.基于BP神经网络的空气质量模型分类预测研究[J].软件,2019,40(2):129-132.
[17]来纯晓,武振国,金松林,等.基于 BP 神经网络的小麦抗寒性模型构建[J].河南科技学院学报(自然科学版),2019,47(3):72-78.
转载注明来源:https://www.xzbu.com/1/view-15152617.htm