基于自动阈值选取的旱地信息提取方法
来源:用户上传
作者:
摘要:我国是农业大国,快速、准确获取旱地信息可为农业监测、灾害识别、发展规划等提供重要的基础数据。为提高农业信息提取效率,本研究基于自动阈值,提出一种针对我国北方旱地光谱特征的旱地提取方法。该方法基于归一化建筑指数(NDBI),通过直方图双峰法确定初步分割阈值;针对灰度直方图中正态拟合后的旱地信息,使用波峰分离度指标和适用条件以确定精确的分割阈值。该方法成功应用于4个研究区的26景Landsat8 OLI影像,分类精度优于常用的监督分类法、非监督分类法及面向对象分类法,可以实现自动、准确的旱地分布信息提取。
关键词:旱地信息提取;自动阈值选取;NDBI;直方图双峰法;全自动
中图分类号: P237 文献标志码: A
耕地是人类生存的基本资源和条件,是人类生活的保障和基础[1]。我国耕地资源常分为水田和旱地2种类型,其中旱地占耕地总面积的568%。遥感技术在提取旱地信息中因具有操作灵活、提取准确等优势,备受关注[2]。实时、高效获取旱地信息以实现对旱地面积的监测、分析与预测是我国目前农业研究领域的热点之一。目前,国内外常用的监督分类、非监督分类与面向对象分类等旱地分类方法,均取得了较为理想的提取效果[3-8],如李丹等采用多时相遥感影像对黑龙江省鹤岗市进行旱地信息提取,使用全球土地覆盖(GLC)和支持向量机(SVM)的监督分类方法,为研究区旱地利用保护提供基础数据[9];曹倩倩等使用Landsat 8数据对安徽省泗县进行旱地信息提取,分别使用了非监督分类的迭代自组织数据分析技术(ISODATA)和K-均值(K-means)算法,提取精度分别为80.48%、 81.02%[10];李敏等以江苏省盐城市作为研究区域,采用面向对象的方法,利用eCognition软件提取了该地旱地信息,最终提取精度为94.1%[11];邓劲松等运用简单决策树模型区分旱地和水田,并去除了容易混淆的园地,相比常规的监督分类方法有很大的提高[12]。
虽然上述方法在旱地提取中被广泛应用,但在分类过程中人工干预较多,具有一定的主观性与倾向性。例如监督分类方法虽然是通用方法,但是严重依赖解译人员的经验;非监督分类与面向对象分类都存在运算量大、迭代实验的问题,严重影响了提取效率;决策树方法虽然分类精度较高,但是某一区域的分类条件难以适用于其他地区,可移植性较差。基于通用模型的旱地信息自动提取仍然是一个挑战。因此,本研究提出一种基于自动阈值选取的旱地信息提取方法,并将该方法应用于Landsat8 OLI影像数据,同时利用高空间分辨率影像作为真值,对提取方法的性能进行评价。
1 研究区与数据源
1.1 研究区
选取我国黑龙江省齐齐哈尔市富裕县、河南省焦作市修武县、山东省济南市长清區和安徽省蚌埠市怀远县等作为研究区域。黑龙江省、河南省、山东省和安徽省均位于平原地区,地形平坦,降水丰沛,水资源丰富,土壤肥沃,农业发达,在2018年全国31个省市粮食产量排行中居于前4名,并称为“中国粮仓”。根据调查和试验发现,富裕县、修武县、长清区及怀远县农田分布较广且在归一化建筑指数(NDBI)灰度图中与其他地物分离明显,因此选为研究区域。各区域的地理位置与直方图双峰信息如图1所示。
1.2 数据源
研究数据来源于地理空间数据云(http://www.gscloud.cn/)30 m空间分辨率的Landsat8 OLI卫星遥感影像数据,自动提取旱地信息;选择来源于LocaSpace Viewer软件中0268 m空间分辨率的谷歌卫星影像为底图,采用目视解译法,得到各区域真实的旱地与非旱地信息。区域与遥感影像的总数分别为4、26。表1为数据源信息,主要为2013—2018年4—9月植被正常生长、云层覆盖较少、大气状况良好的数据,每期数据均完全覆盖研究区域。多景数据以判定初始阈值,加粗的日期为旱地精确提取的主影像时间。
2 自动阈值选取模型
基于精确阈值分割方法,通过NDBI的计算、阈值统计与粗定阈值、拟合正态分布函数及确定精确阈值等步骤,构建旱地信息的全自动提取模型(图2)。由于本研究选择NDBI提取旱地信息,且所选影像的成像当日天气状况良好,多发生瑞利散射,所以不考虑大气对遥感影像的影响。
2.1 NDBI与旱地
结合NDBI计算公式与使用经验可知,在NDBI图像中,城镇用地与裸地的值均大于0,非城镇用地的值小于0。非城镇用地分类一般包括水体、林地、耕地等。纯净的自然水体在近红外和短波红外波段的呈象近似于一个“黑体”,即水几乎吸收了其全部的能量而不进行反射,因此,在近红外和短波红外波段,较纯净的自然水体的反射率也很低,几乎趋近于0。经大量试验证实,在NDBI小于0的范围内,其灰度直方图(图3)中存在2个明显的峰(P林地与P旱地),且其中1个峰为旱地信息。为了清晰辨别旱地,本研究提出自动阈值选取模型,自动选择直方图中2个峰之间的精确分割阈值。
2.2 直方图双峰法
直方图双峰法在遥感领域中,常用于陆地和水体图像分割中的阈值选择[13-15]。其应用前提是使用灰度图创建柱状直方图,当其灰度级直方图具有较为明显的双峰特性时,将直方图中2个峰值之间的谷值用作图像分割的阈值。若背景地物的灰度值在整个图像中可以合理地看作为恒定,而且所有目标地物与背景地物都具有几乎相同的对比度,则选择一个正确的、固定的全局阈值会有较好的分割效果[16]。为了避免阈值的偶然性和不稳定性,本研究通过计算多幅影像的直方图、提取大量谷值形成阈值范围Rt(图3),将平均谷值定义为初始阈值Ti[17]。基于直方图双峰法,初步分离旱地与其他地物信息,为精确提取做准备。
2.3 精确阈值
贾祎琳等在应用直方图双峰法选取阈值时,将2个峰之间的谷值,即最小值点,作为分割阈值[18-19]。但经试验表明,直接取最小值作为分割阈值在实际应用中效果并不理想。为找寻更精确的阈值,本研究经大量试验发现NDBI灰度直方图中旱地的波形与正态分布函数基本吻合(图4),可以 取灰度直方图中的旱地信息,计算均值(μ)及标准差(σ),并将其拟合为正态分布函数。如图4所示,正态分布函数的“经验法则”为精确阈值选取的基础:约68%的数值分布在距离μ有±σ之内的范围,约95%的数值分布在距离μ有±2σ之内的范围,以及约99.7%的数值分布在距离μ有±3σ之内的范围。为了提高模型的适用性,本研究提出动态阈值确定方法,根据不同区域的旱地面积及分布形态的特点,分别从±σ、±2σ、±3σ这3种范围中,动态选取最为精确的阈值范围,以确保旱地提取的有效性与灵活性。
为解决在3个阈值取值中选取最优阈值的難题,本研究对多个区域进行试验,通过分析NDBI直方图分布特征,发现阈值的选择与波峰的分离程度息息相关,因此建立波峰分离度指标Si(公式1):若S3<0,则以±3σ为阈值,否则继续计算S2;若S2<0,则以±2σ为阈值,否则以±σ为阈值。计算公式如下:
式中:i表示σ取3、2、1倍;Ti表示阈值取值;Pl表示旱地信息的波峰所对应的灰度值;Po表示林地信息的波峰所对应的灰度值。利用上述方法获得图像分割的专用阈值,并成功地实现了旱地的自动提取。
2.4 精度评定
为探索模型的可用性,并对所提模型的实用性进行更好的评价,本研究将自动阈值选取模型的提取结果与直方图双峰法初步提取结果作比较,用于判定自动阈值选取模型的提取效果是否优于最小值阈值提取模型。同时,通过与其他常规方法(监督分类、非监督分类、面向对象分类)比较,对自动阈值模型进行定量精度分析。另以±4σ作为评定标准,评价自动阈值模型提取效果是否随阈值范围的扩大而效果更优。
为了定量评价不同旱地提取方法的精度,本研究采用遥感目视解译法,在0.268 m空间分辨率的谷歌卫星影像上明确旱地分布,并进行二值化处理,作为真值。选择总体分类精度(Rall)为主要评价因子,对整体分类情况做出评价;选择伪阳性率(FPR)与真阳性率(TPR)构建接收器操作特征(ROC)空间[20],作为辅助评价因子,便于分析自动阈值选取模型的提取精度。FPR与TPR计算公式如下:
式中:FP为自动提取结果中旱地被漏判为非旱地像元的个数;TN为自动提取结果中非旱地被正确判识为非旱地像元的个数;TP为自动提取结果中旱地被正确判识为旱地像元的个数;FN为自动提取结果中非旱地被误判为旱地像元的个数。
3 结果与分析
本研究以富裕县、修武县、长清区和怀远县为例,使用自动阈值选取模型进行旱地信息提取,从图5可知,4个研究区域内均有少量旱地信息的边界未被正确识别,但总体而言提取精度较高。结合表2可知,富裕县、修武县、长清区、怀远县等研究区据初始阈值提取的精度分别为0.641 3、0.851 2、0858 2、0.747 0,相比之下,自动阈值选取模型的精度分别达到0.814 1、0.891 5、0.923 5、 0.828 4,证实了自动阈值选取模型的提取精度更高,改进了单以2个谷值最低点为阈值的方法。此外,本模型精度明显优于常用的监督分类法、非监督分类法及面向对象分类方法,证明了本模型的可用性与优越性,既实现了全过程自动化,也大大提高了分类方法的可移植性。与距标准差±4σ为阈值的提取结果相比,自动阈值选取模型的提取结果与遥感目视解译结果的一致性更高,解决了模型提取效果是否随阈值范围的扩大而更优的疑问。
通过对比4个区域旱地面积占各区域总面积的百分比以及对应的提取精度,发现旱地面积比大于40%的地区提取精度稍差。其原因可能是对于旱地面积比相对较小的地区,其直方图中旱地波形范围较小,因此2个峰相距较远、分离明显,导致提取精度较高。
图6为4个研究区不同旱地提取算法的ROC空间构建结果。ROC空间特征:离左上角(0,1)越近的点表示分类准确率越高;离右下角(1,0)越近的点,准确率越低。从(0,0)到(1,1)的对角线将ROC空间划分为左上、右下2个区域,结果显示几乎研究区的全部提取结果都集中在左上部分,分类结果较好。以(0,1)为圆心,以模型提取结果的ROC点到(0,1)点的距离为半径画1/4圆,发现除自动阈值选取模型外,其他方法的ROC点均不位于圆内,进一步证明本研究提出的自动阈值选取模型的准确率最高。
虽然本研究所提自动阈值选取模型在Landsat8 OLI卫星影像中取得了较高的精度,但该算法仍然存在一定的局限性:(1)由于本模型的提出是基于NDBI指数,所以自动计算阈值法更多地依赖于地物的波谱特征,更适用于提取农作物成熟期的旱地,4—9月提取结果更加精确;(2)阈值的自动选取是基于直方图双峰法,这就要求影像中有较为明显的目标地物和背景地物,因此对于贫瘠地区,旱地提取效果并不十分明显。
4 结论
考虑到当前常规旱地分类方法的不足,本研究提出了一种针对我国北方旱地光谱特征、基于自动阈值选取的旱地提取方法,利用2013—2018年多景遥感数据,精确提取了富裕县、修武县、长清区及怀远县的旱地信息。通过与其他常规分类方法、不同阈值选取结果进行比较发现,自动计算阈值模型简单、易操作,具有较高的通用性和灵活性,可以有效提高旱地信息提取的精度和效率。
参考文献:
[1]盖 乐. 盘山县农村居民点整治潜力评估及分区研究[D]. 北京:首都师范大学,2013.
[2]王 丹,葛大兵,唐伊凡,等. 洞庭湖生态经济区农田景观格局变化及其驱动力[J]. 江苏农业科学,2018,46(8):245-250.
[3]Julien Y,Sobrino J A,Jiménez-Muoz J C. Land use classification from multitemporal Landsat imagery using the Yearly Land Cover Dynamics (YLCD) method[J]. International Journal of Applied Earth Observations and Geoinformation,2011,13(5):711-720. [4]牛鲁燕,张晓艳,郑继业,等. 基于Landsat8 OLI数据的山东省耕地信息提取研究[J]. 中国农学通报,2014,30(34):264-269.
[5]Goodin D G,Anibas K L,Bezymennyi M. Mapping land cover and land use from object-based classification:an example from a complex agricultural landscape[J]. International Journal of Remote Sensing,2015,36(18):4702-4723.
[6]杨 栩,杨润书,朱大明,等. 基于遥感数据的耕地信息提取方法研究[J]. 软件导刊,2018,17(9):166-170,174.
[7]Frohn R C,Reif M,Lane C,et al. Satellite remote sensing of isolated wetlands using object-oriented classification of Landsat-7 data[J]. Wetlands,2009,29(3):931-941.
[8]李 峰,王 昊,秦 泉,等. 基于HJ-1 CCD影像的玉米种植面积估算研究[J]. 山东农业科学,2016,48(2):138-142.
[9]李 丹,梁 欣,孙丽娜,等. 基于多时相遥感影像的耕地利用信息提取研究[J]. 现代测绘,2018,41(4):21-24.
[10]曹倩倩,黄袁升. 基于Landsat8 OLI影像的泗县耕地信息提取[J]. 阴山学刊(自然科学版),2017,31(3):58-60.
[11]李 敏,崔世勇,李成名,等. 面向对象的高分辨率遥感影像信息提取——以耕地提取为例[J]. 遥感信息,2008(6):63-66,89.
[12]邓劲松,王 珂,沈掌泉,等. 基于特征波段的SPOT-5卫星影像耕地信息自动提取的方法研究[J]. 农业工程学报,2004,20(6):145-148.
[13]Prewitt J M S, Mendelsohn M L. The analysis of cell images[J].Annals of the New York Academy of Sciences,1966,128(3):1035-1053.
[14]Li J L,Sheng Y W,Luo J C. Automatic extraction of himalayan glacial lakes with remote sensing[J]. Journal of Remote Sensing,2011,15(1):29-43.
[15]Khandelwal A,Karpatne A,Marlier M E,et al. An approach for global monitoring of surface water extent variations in reservoirs using MODIS data[J].Remote Sensing of Environment,2017,202:113-128.
[16]杨修国. 关于直方图双峰法的研究与改进[J]. 电子设计工程,2012,20(12):176-179.
[17]Zhang F F,Li J S,Zhang B,et al. A simple automated dynamic threshold extraction method for the classification of large water bodies from landsat-8 OLI water index images[J]. International Journal of Remote Sensing,2018,39(11):3429-3451.
[18]賈祎琳,张 文,孟令奎. 面向GF-1影像的NDWI分割阈值选取方法研究[J]. 国土资源遥感,2019,31(1):95-100.
[19]李景福,赵进辉. 基于阈值的彩色农业图像分割方法研究[J]. 安徽农业科学,2007,35(28):8869-8870.
[20]陈 亮. 基于频域分析和结构聚类的fMRI数据处理方法研究[D]. 大连:大连海事大学,2017.
文章编号:1002-1302(2020)14-0248-07
收稿日期:2019-07-29
基金项目:国家自然科学基金(编号:41706194);山东科技大学人才引进科研启动基金;山东省自然科学基金(编号:ZR2016DB23)。
作者简介:张晓冉(1997—),女,山东济南人,主要从事定量遥感研究。E-mail:sloth1601020536@163.com。
通信作者:黄 珏,博士,讲师,主要从事定量遥感研究。E-mail:huangjue@sdust.edu.cn。
转载注明来源:https://www.xzbu.com/1/view-15301513.htm