您好, 访客   登录/注册

二次主成分提取高光谱的病害薯叶特征波长

来源:用户上传      作者:

  摘要:针对马铃薯晚疫病,提出了将病害叶片和健康叶片联合测试并提取有效特征波长的检测方法。对健康和病害叶片的光谱图像进行主成分分析,并从主成分图像的权重系数曲线中提取出6个健康叶片特征波长和病害叶片特征波长。基于健康叶片与病害叶片的6个特征波长做第二次主成分分析,将特征波长优化至712、19nm、749.70 nm和841.47 nm,再基于这3个特征波长做主成分分析,选用主成分中对比度最明显的图像来识别病害区域。研究表明,采用健康叶片与病害叶片联合使用并结合二次主成分分析可实现马铃薯叶片病害的设别,且识别率可达100%。
  关键词:高光谱成像技术;马铃薯晚疫病;健康病害结合;二次主成分分析;特征波长
  中图分类号:0433.4 文献标志码:A
  引言
  马铃薯作为一种粮食作物在世界上占据重要的地位,尤其在中国,马铃薯的种植越来越广泛,晚疫病作为马铃薯种植过程中常见且高发的病害之一始终威胁着马铃薯的生长。目前针对马铃薯晚疫病的诊断大都是采用传统的经验定性诊断方法,但该方法的精确度有待提高且受多种因素影响。有效诊断、预防、治疗晚疫病不仅能保证马铃薯的产量,而且能确保经济效益和社会效益。
  近些年,高光谱成像技术飞速发展,该技术在许多方面得到应用,尤其是在农作物的检测方面。相比其他技术,高光谱成像(hyper-spectralimaging)技术具有图谱合一优势,能够对待测样品的内外部数据信息进行可视化的表达,可以采集大量数据,并对多个指标进行同时采集。但是高光谱的数据量巨大,其中包含了大量与被测样品无关的信息,这些信息会对数据的处理产生干扰,削弱模型的预测能力,甚至会造成大量误判。为了避免这种误差的产生,需剔除不相干的数据,简化模型,使模型具有稳定准确的预测能力,因此特征波长的提取就显得尤为重要。科研人员在农产品的特征波长选取方面已做了许多研究:冯洁等采用波段指数对水稻的特征波长进行提取,提取的10个波长能有效地反映出水稻的特征光谱信息;孙静涛等对哈密瓜的可溶性固形物和硬度的波长进行筛选,根据特征波长对成熟度进行识别,设别的准确率达94%;王海龙等使用相关系数法和竞争性自适应重加权算法对番茄叶片真菌的特征波长进行提取,分别得到4个和5个特征波长,并对叶片的真菌进行了预测;董明等用ABS算法提取了小白菜的8个特征波长,这些波段可作为小白菜的有效特征波段,反映其光谱信息;尤笛等利用一阶微分曲线选取了9个特征波长,并对4种不同苹果的损伤区域进行了识别;古文君等采用连续投影法选取了蓝莓的6个特征波段,并对蓝莓的内部品质进行了检测。以上研究均以伤病样本为特征提取对象。在实际分类中,分类对象多为病害与健康样本的合集,但把健康与病害样本合用来提取马铃薯晚疫病特征波段的报道较少。主成分分析在数据降维方面具有显著的效果,尤其是在特征波长选取方面。所以本文提出将健康样本与典型病害样本合用作为研究对象,结合主成分分析对采集的高光谱数据进行特征波长的选取。
  1材料与方法
  1.1实验材料
  实验材料选用云南师范大学生命与科学学院马铃薯种植基地种植的马铃薯叶片,生长时间为80 d,其中健康叶片18片、病害叶片(感染晚疫病的叶片)18片(发病时间为7 d),共36片。用高光谱成像系统快速采集这36片马铃薯叶片的高光谱图像。
  1.2高光谱成像系统与数据采集
  高光谱成像系统如图1所示。光谱仪为北京卓立汉光公司出产的GaiasSorter-Image-V10E,可以采集520个波段,波长范围为400nm至1 000nm。系统两侧的线光源为4个50 w的卤素灯,在步进电机驱动的载物台上放置待测样本,采集样本图像的CCD相机为Lumenera Infi-nity,垂直放置在平台上方。为避免在样本采集过程中受到其他光源干扰,将整个系统封装在密闭的暗箱内。
  为避免采集的图像出现失真,根据光源的照度调整好系统的参数。通过反复测试优化,最终CCD相机的曝光时间确定为9.732 ms,步进电机的速度为0.6 mm·s-1,相机到载物台的垂直高度为23 cm。为了减少采集工作的重复性,对多个病害样本同时进行采集,在载物台上放置2排样本,每排有3个,总共6个。采集健康样本时,载物台上每次只放1个作为参照。CCD相机对载物台上的样本进行线扫描,载物台在与CCD相机垂直的被扫平面内移动。
  1.3高光谱图像校正
  为了减少因光源造成的图像颜色失真,需对采集的高光谱图像进行黑白校正。在相同环境下分别采集白帧图像数据Pw和黑帧图像数据Pd,对采集得到高光谱图像数据进行校正,设PS为初始图像数据,则R为校正后的高光谱图像数据,可表示为
  所有高光谱图像数据的采集采用Specview软件,数据处理采用ENVI 5.1、MATLAB R2010a軟件。
  2结果与分析
  2.1光谱反射率曲线
  采集36个样本的光谱反射率曲线,此过程在Specview软件中实现。如图3所示。
  从图3中可以看到:健康和病害叶片的光谱反射率的走势相似,两者在550 nin附近都存在一个反射峰,在680nm附近存在一个吸收峰,在680~750 nm范围内光谱反射率急剧升高,表明近红外范围内的光谱反射率明显比可见光范围的高;在600~690nm范围内健康叶片光谱反射率比患病叶片的光谱反射率稍低,在720~900 nm范围内健康叶片的光谱反射率却远高于病害叶片的光谱反射率。在可见光范围内产生这种差异的原因是:在发病初期叶片本身存在自我保护机能,致使某种元素活性提升从而使得病害叶片的反射率数值略高;在近红外范围内,病害逐渐侵染,叶片组织破损,水分丧失,使其光谱反射率数值比健康叶片低。
  2.2特征波长选取   主成分分析(principal component analysis,PCA)是一种去除波段之间多余信息,且将多波段的图像信息压缩到比原波段更有效的少数几个转换波段的方法。该方法既能避免信息间的互相重叠,还能通过简化数据得到最具代表性且互不相关的变量子集。
  首先对马铃薯晚疫病样本的全波段高光谱数据进行降维,并对全波段进行主成分分析,得到分析后的前6个主成分图像PC-1~PC-6,如图4所示。
  图4中PC-1、PC-3、PC-5的主成分图像保留了大部分的图像信息,而其中第3主成分(PC-3)和第5主成分(PC-5)包含的病害区域最明显,PC-1病害与健康部位对比不是很明显,不利于后期处理,故选择PC-3和PC-5进行处理。
  权重系数曲线的波峰处或波谷处被认为是显著特征波长,对区别感兴趣特征波段贡献最大。图5为PC-3、PC-5主成分图像的权重系数曲线,对PC-3、PC-5分别选取2个特征波长,即PC-3为563.32nm、749.70nm,PC-5为719.03nm、841.47 nm。
  同样,对健康马铃薯叶片进行主成分分析,得到前3个主成分图像。如图6所示,PC-3图像特点明显,叶脉清晰,其他主成分图像噪声过大,因此选取PC-3进行分析。
  健康马铃薯叶片PC-3图像权重系数曲线,如图7所示。通过分析可选取2个特征波段,即712.19nm、958.48nm。
  2.3基于特征波长的二次主成分分析
  经过主成分分析,对病害叶片选取4个特征波长,即563.32nm、719.03nm、749.70nm、841.47nm,对健康叶片选取2个特征波长,即712.19nm、958.48nm。为使检测结果更具实效性,将病害叶片的4个特征波段与健康叶片的2个特征波段联合使用,用选取出来的6个特征波长对病害叶片进行二次主成分分析,主成分图像如图8所示。由主成分图像可以看出,PC-1、PC-2和PC-6因噪聲较大或对比度较低不利于观察病害区,PC-3、PC-4和PC-5可明显观察到病害区域。
  为了得到更少更优的波段,我们通过PC-3、PC-4和PC-5的权重系数曲线进一步将6个特征波长最终缩减为3个,即712.19 nm、749.70 nm和841.47nm。
  对优化提取的3个特征波长进行主成分分析,得到的灰度图像如图9所示,图中的PC-3能明显地区分病害区域。
  2.4病害叶片二值化
  采用ENVI软件对最终提取的PC-3灰度图像进行二值化处理,经过二值化处理后的图像的病害部位更加明显,更利于我们进行区分,如图10所示。对其余的病害叶片和健康叶片进行同样的处理,经实验可以发现,该方法对所有实验样本的识别率达100%。
  3结论
  二次主成分分析对马铃薯晚疫病特征波长的选取具有显著的实效。健康叶片与病害叶片联合使用效果佳,二值化处理更加利于病害的区分。此方法为马铃薯叶片病害分级和缺陷检测提供了参考,也为其他植物的病害检测提供了可行性方法。
转载注明来源:https://www.xzbu.com/1/view-15103749.htm