您好, 访客   登录/注册

基于GF-2号影像的森林优势树种分类

来源:用户上传      作者:王熊 胡兵 韩泽民 菅永峰 梁杰 周欢 周靖靖 佃袁勇

  摘 要:利用遥感数据开展森林资源优势树种的分类对森林资源的监测、森林可持续经营及生物多样性研究具有重要意义。研究针对复杂地形区域的破碎化森林,采用高分二号(GF-2)的多光谱影像作为基础数据进行森林优势树种的精细分类。本文以地形复杂、森林破碎化的湖北省竹山县九华山林场为研究对象,采用面向对象分类方法对树种进行精细分类,比较支持向量法、最近邻法(KNN)和随机森林(RF)三种不同分类算法的分类效果。在尺度阈值为30、合并阈值为95时分割的基础上,利用SVM、KNN和RF分类结果和分类精度差异较大。分类精度最高的是SVM分类方法,总体精度为68.52%,Kappa系数为0.62;其次为随机森林分类法,总体精度为60.29%,Kappa系数为0.54;KNN分类方法精度最低,总体精度为59.41%,Kappa系数为0.53。GF-2号数据能满足树种分类基本需求,在复杂地形和景观破碎化地区用支持向量机进行树种的分类精度更高,但仍存在一定的局限性。
  关键词:优势树种分类;支持向量机;最近邻法;随机森林;高分二号
  中图分类号:S758.51   文献标识码:A   文章编号:1004-3020(2020)01-0001-08
  Abstract:The use of remote sensing data to classify forest r dominant tree species is of great significance for monitoring forest resources,sustainable forest management and biodiversity research.In order to study the fragmentation forests in complex terrain areas,the multi-spectral imagery of GF-2 is used as the basic data to carry out the fine classification of forest tree species.This paper focuses on the tree species classification in complex terrain area with GF-2 imagery.The study site was located in Jiuhua forestry station in Zhushan County,Hubei province.The object-based classification method was used in research and then the support vector machine (SVM),K nearest neighbors (KNN) and Random forestry (RF) were compared.The results show that,based on the scale threshold (SL) 30 and the merge threshold (ML) value of 95,the SVM,KNN and RF classification results and classification accuracy are quite different.The results found that the SVM method had the best classification accuracy with the overall accuracy 68.52%,kappa coefficient was 0.62.The RF method had the second accuracy with the overall accuracy 60.29%,kappa coefficient was 0.54.The KNN had the lowest accuracy.The data of GF-2 can meet the basic requirements of tree species classification.The classification accuracy of tree species in the complex terrain and landscape fragmentation area is higher,but there are still some limitations.
  Key words:tree species classification;support vector machine;Random forestry;K nearest neighbors;GF-2
  森林作為地球上可再生自然资源及陆地生态系统的主体,在人类生存和发展的历史中起着不可替代的作用。森林资源的监测是森林研究的一项重要内容,对森林类型进行分类研究是森林资源监测中的研究热点。传统的森林资源调查和监测多以地面调查为主,工作量大、成本高、费时费力且周期长,许多学者致力于研究新的技术体系和方法应用于大范围森林群落或树种的调查与制图[1-3]。
  随着航天遥感技术的快速发展,遥感数据以其快速性、宏观性、高效性等传统技术不可比拟的优势,在林业调查和森林经营管理中得以深度应用,尤其在进行地类划分、植物群落分类的方法大量应用。高空间分辨率遥感影像如IKONOS、QuickBird以及GF-2号卫星,影像细节清晰,提供了能够区分林分尺度优势树种的可能,已越来越多地被应用到林分尺度森林类型信息的提取中。
  高空间分辨率遥感影像的像元反射率受森林冠层结构、地形和阴影等因素影响,其像元光谱响应曲线并不能充分表达出林分尺度树种的光谱特征,因此,基于像元光谱数据对高空间分辨率遥感影像树种进行分类并不合适,而且会产生“椒盐”现象[4-5]。面向对象的分类方法能充分利用高空间分辨率遥感影像中地物丰富的几何形状与纹理信息等特征,有效提取林分尺度的树种类型信息[6-7]。   采用面向对象技术的遥感分类方法相较于基于像素的分类方法可更加高效的获取以图斑为基本单元的地物类别信息,在森林植被精细分类中展现了明显的优势[8-10]。大量的学者发现利用高空间分辨率的纹理和光谱特征结合,可以更精细的区分植被的类别,较高精度的分类树种。如Forester等利用QuickBird遥感影像对德国南部地区林区采用面向对象的分类识别方法进行植被类别的提取研究,有效提取出云杉、落叶松、毛榉等多种树木类型[11]。Pham等应用面向对象分类方法,对新西兰沿海地区的一个单一树种进行识别,其识别精度比仅仅利用光谱信息进行分类所得结果的精度高了近10%[12-16]。
  高分辨率数据比高光谱数据成本低,且能充分利用影像中森林斑块大小、形状和和灰度分布在空间位置上反复出现而形成的纹理信息。但是目前针对国產高分辨率卫星遥感数据针对复杂地形和景观破碎化下进行森林植被精细区分仍存在一定的难度。本研究以湖北省十堰市九华山林场为研究区域,以GF-2号国产高空间分辨率卫星数据为数据源,拟建立针对森林类型高层次类别识别为目的复杂地形条件下森林优势树种的识别与分类方法。
  1 研究区域概况与数据源
  1.1 研究区域
  本研究区位于湖北省十堰市九华山林场,位于湖北省十堰市竹山县南部,其地理位置位于东经100°8′~110°12′,北纬32°1′~32°6′。地处堵河中上游,高山地貌,属于大巴山余脉;最高海拔2 036 m(位于羚羊庙沟峰),最低海拔400 m(位于百里河口),平均坡度为36.8°。研究区属于北亚热带湿润气候区。因境内高峰叠起相对高差大,气候变化较大,山地气候明显。四季分明,雨热同季,空气较湿润。年平均温度12.9 ℃,全年一月最冷,七月最热,有效积温3 750 ℃。无霜期长,为219 d,平均降水量1 000 mm以上。研究区内土壤以山地黄棕壤、黄棕壤、黄棕壤性土和山地黄棕壤性土为主,黄棕壤和黄棕壤性土主要分布在海拔800 m以下的低山;山地黄棕壤和山地黄棕壤性土主要分布在海拔1 200 m的高山。
  九华山林场区域内植被资源丰富,种类繁多。森林类型以人工纯林、人工针阔混交、天然阔叶林和茶园为主。人工种植的主要树种有杉木Cunninghamia lanceolata、日本花柏Chamaecyparis pisifera、马尾松Pinus massoniana,还分布有檫木Sassafras tzumu、华南桦Betula austrosinensis、柳杉Cryptomeria fortnei,天然阔叶树种有榉树Zelkova serrata、青冈Cyclobalanopsis glauca、樟Cinnamomum camphora、木荷Schima superba、麻栎Quercus acutissima。但因丘陵起伏、地块破碎、土层贫瘠导致森林景观总体异质性高、形状复杂、聚集程度高、斑块分布无规则和景观格局复杂。
  1.2 数据源
  本研究采用高分二号多光谱影像作为数据源,影像获取时间为2017年7月4日,共包含4个波段,分别为红(0.45~0.52 μm)、绿(0.52~0.59 μm)、蓝(0.63~0.69 μm)和近红外波段(0.77~0.89 μm)。其他辅助数据包括国有九华山林场矢量边界图、数字高程模型数据、实地调查的小班数据、样点数据和森林资源二类调查数据。
  实地调查的时间为2018年4月13日~20日,所调查的结果主要用于提供用于分类精度评价和基于样本面向对象分类的训练样本。结合树种组成,将地物类型分为非林地、水体、茶园、阔叶、杉木、柳杉、马尾松、针阔混交共计8类,非林地是指除水体外的地物类型,主要以人工建筑,道路为主;茶园包括正在种植的茶园以及未种植的耕地;阔叶树种包括桦木、枫香、栎类、化香等树种,由于阔叶树种分布过于破碎,且树种组成太过复杂,因此将阔叶树种统一归为一类。本研究采集了511个样本:水体(2)、硬阔(73)、马尾松(74)、针阔混交(26)、茶园(53)、柳杉(41)、杉木(101)和非林地(141),(见图1)。
  2 方法
  本研究采用面向对象的分类方法进行分类,分类算法主要的步骤包括影像的分割、分类特征确定、分类器的比较分析、分类精度的评价(见图2)。
  2.1 GF-2号遥感数据预处理
  GF-2影像预处理的基本内容包括:辐射定标、正射校正、辐射校正、图像裁剪和图像增强,真(假)彩色合成。本研究中通过软件ENVI(5.3)进行辐射定标,定标参数如下表1所示。采用30m DEM分辨率进行正射校正。预处理图像如图3所示。
  2.2 影像分割
  本研究采用基于边缘特征的分割算法,该算法根据邻近像素光谱特征对全色影像进行分割,通过设定尺度阈值(Scale Level,SL)和合并阈值(Merge Level,ML),根据邻近像素的光谱差异进行分割。
  2.3 分类特征的构建
  本论文中选择了三类特征用于树种类型的分类:光谱特征、纹理特征和地形特征(见表2)。从GF-2多光谱影像中提取的光谱特征包括:蓝(B)、绿(G)、红(R)和近红外(NIR)四个波段,以及主成分变换的前2个主成分PCA1、PCA2和归一化植被指数NDVI。纹理特征包括:对主成分变换的第1主成分,利用灰度共生矩阵计算其纹理特征包括均值、方差、同质性、对比度、非相似性、熵、二阶矩、相关性共8个参数。地形特征包括高程、坡度和坡向。
  2.4 分类方法
  本研究采用采用基于样本面向对象分类方法分成8类,其地物类型的样点影像与实地地物对应图如表3。选取其中70%的样本作为训练样本,分别采用最近邻算法(KNN)、支持向量机(SVM)和随机森林(RF)三种分类算法进行分类,并将剩余30%样本作为检验样本进行精度验证和分类效果评价。   最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法之一,在理论上的研究已经非常成熟。其思路是:寻找到一个样本在特征空间中的K个最相似或者最邻近的样本,如果这K个样本中的大多数属于某一个类别,那么该样本也属于这个类别[17]。KNN算法中,所选择的邻近样本都是已经正确分类的对象。该方法在定类决策时只依据最邻近的一个或者几个样本的大多数类别来决定待分样本所属的类别。把它应用到遥感影像分类中,就是要计算待分类样本与训练样本之间的距离,找到最近K个邻居,根据它所选择的这K个邻居的类别来判断。选择K个邻居所属类别最多的哪一类,那么待分类样本也属于这个类别[18]。
  支持向量机SVM(Support Vector Machines)是由Vapnik和他的合作者提出来的一种新的学习方法[19],是建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限样本信息在模型复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。在遥感图像的分类研究中,应用SVM最大的优点是进行分类时无须进行数据降维,并且在算法的收敛性、训练速度、分类精度等方面都具有较高的性能[20]。
  随机森林算法(Random Forestry,RF)是由Breiman(2001)提出,是一个树形分类器的集合,该算法利用多棵决策树组合构成新的学习算法。该算法利用bootstrap策略从原始数据集中抽取N个训练集,每个训练集的大小为原始数据的2/3;然后对每个训练集分别建立分类决策树;最终形成由N棵决策树组成的森林进行预测结果,采用投票表决的方式决定新样本的类别[21]。随机森林的算法关键参数在于决策树数量N的确定。在本实验中,发现当N>=300时,分类结果趋于稳定。
  2.5 分类精度评价
  利用混淆矩阵评价分类精度,采用的精度评价指标包括总体分类精度、Kappa系数和每类地物的用户精度、制图精度、错分率和漏检率。
  3 结果
  3.1 影像分割结果
  影像分割的结果与分割的尺度阈值与合并阈值有关,通过人工目视判别的方法发现尺度阈值(SL)30,合并阈值(ML)为95时能最好分割地出各地物的边缘特征。不同阈值下影像分割效果如图5所示。
  3.2 分类精度评价结果
  遥感影像分类完成后,要对其分类结果使用混淆矩阵法进行精度的验证与评价,得到以下结果。
  根据分类精度统计结果,SVM分类方法精度最高(见表4),总体精度为68.52%,Kappa系数为0.62,RF的分类方法次之,KNN精度最低,仅有59.41%。在类别划分中,水体的分类效果在四种分类方法都是制图精度最高,三种方法的制图经度均高达99.08%;其次是阔叶类、针阔混交和非林地,制图精度最高的方法分别是SVM、RF和SVM,制图精度分别为82.86%,81.84%和73.61%,制图精度最低的方法均为KNN。在具体树种的分类中,杉木的制图精度最高,分类精度高达80.98%,其次是柳杉的59%和马尾松50.30%,制图精度最低的树种为茶园,仅有45.50%。杉木和马尾松的制图精度最高的方法为SVM,柳杉的制图精度最高的方法为KNN,茶园的制图精度最高的方法为RF。
  4 结论与讨论
  4.1 讨论
  (1)影像分割是面向对象分类方法中的关键步骤,直接影响分类精度,其中分割参数决定了分割内的同质性、分割间的异质性以及分割大小,影像分割效果会直接影响影像后续分析处理的结果和精度[22-23]。由于地理对象的复杂性,自动获得最优尺度参数仍然具有挑战性和不确定性,因此大量研究均采用反复试验、目视解译的方法来确定最优尺度参数[24-25]。提高遥感影像分割质量,最有效的方法就是依据不同的分割影像在不同应用中的具体特点,同时结合有效的分割质量评价方法确定最优分割尺度,因此有必要研究不同分割尺度参数分割不同遥感影像的效果和自动化确定合适的分割参数,定量评价尺度参数对面向对象分割和分类的影响[5]。
  (2)研究中对树种分类的三种方法中分类效果最佳的是SVM,其总体精度为68.52%,而KNN和RF的总体精度分别是是59.41%、60.29%。SVM属于多参数分类器,能够有效利用样本的特征参数,进行样本训练得到超平面函数,根据超平面函数直接判定预测点的label;而KNN方法中只有一个参数和RF属于无参数监督学习算法,并且样本过少会导致基RF分类器的性能较差。在地形复杂和景观破碎化的研究区域中,三种分类器因算法特性在具体树种的分类上效果存在差异,总体上SVM有效的利用了研究中18个特征参数使得分类精度较高。
  对比不同分类方法下不同地物类型的分类精度,水体的分类效果在4种分类方法都是精度最高,阔叶类次之,原因是水体的光谱特征明显,与其他类别有着明显差异,而阔叶由于面积较大,分类时可以作为样本的点更多,使得阔叶分类精度也比较高。运用不同的分类器对杉林的分类精度变化较小,是具体树种类别里分类效果最佳,主要原因可能是所在研究地区杉木人工林面积较大,分布较为集中,使得不同的杉木林之间的光谱特征值相差较小,容易提取。对于马尾松、柳杉、阔叶、茶园,不同的分类器的分类结果差别较大,主要原因是在于这四类树木的分布较为破碎,个体之间差异较大。尤其是茶园,虽然小范围内分布较为集中,但受人为干扰較大,且茶叶本身属于阔叶灌木,这也使得分类效果较差。
  (3)相比较其他研究,本研究分类总体精度适中。例如在南京的中山陵园风景区使用最大似然分类器对5种绿化树种的分类总体精度为66%[26],在福州大学旗山北校使用34个特征对7种城市绿化乔木树种进行分类时精度达到74.95%[27],在常熟市国营虞山林场利用全部特征变量进行4个典型树种分类时,总体精度为64.6%[28],在福建省三明市将乐林场使用Quick Bird高空间分辨率遥感影像进行面向对象分类,采用KNN和SVM分类方法的分类总精度分别为79.67%和83.33%[29]。   以上的研究中区域平坦,群落相对简单,分布较为规整。本研究三种方法整体精度一般的原因可能在于地形复杂且景观破碎化,高山地形造成阴坡和阳坡、沟壑和山脊间的光照差距大。阴坡和沟壑间的森林树种反射的能量低,甚至出现异常值,这给遥感影像的分类产生误差。因此需要我们进一步地研究以减少因地形复杂造成的阴影干扰,以减弱同物异谱、同谱异物现象。
  一般可采用更高空间分辨率的亚米级遥感影像,增强地物的光谱特征和形状特征以提高分类精度;中低分辨率遥感数據分类精度不高的原因是其像元对应的地面面积较大,像元光谱大多是像元内不同地物的混合光谱。使用多源数据协同进行树种分类以减少同物异谱和异物同谱现象;魏晶昱等研究发现多光谱Landsat 8 OLI与高空间分辨率Quick Bird遥感影像协同进行面向对象分类精度比单独使用Quick Bird可以提高6%[34]。采用时间序列影像,时间序列影像能够反映植被的物候信息,减弱地形带来的影响,有助于大幅度提高植被聚类精度[30]。
  4.2 结论
  本文以竹山县九华山林场为研究区域,在实地调查和二类调查的基础上,以GF-2多光谱影像为基础,将研究区域地类分类层次确定为8类,即水体、非林地、马尾松、杉木、柳杉、阔叶类、针阔混交、茶园。采用面向对象的分类方法,对研究区域的影像进行分割,反复调整,并找到了最佳的分割尺度:分割阈值为30,合并阈值为95。在此基础上,采用SVM、KNN、RF三种分类器分别进行分类。发现基于样本下的SVM分类效果最好,总体精度为68.52%,Kappa系数为0.62。而具体到不同类别而言,水体、阔叶类和针阔混交的分类效果相对较好,而对于柳杉、茶园而言,不同的分类方法其结果差别较大,这表明对于具体到树种的类别而言,分类效果一般。研究发现对于面向对象而言的空间特征,由于研究区域和森林结构的过于复杂破碎,仅仅通过光谱纹理特征等特征对于森林类型精确划分帮助有限。总体而言GF-2号数据可以满足正常的分类需求,但在复杂地形的景观破碎化地区进行树种的精细分类还存在一定的局限性,需要额外增加其他分类指标以提高精度。
  参 考 文 献
  [1]李晓红,陈尔学,李增元,等.综合应用多源遥感数据的面向对象土地覆盖分类方法[J].林业科学,2018,54(02):68-80.
  [2]刘鲁霞,庞勇,任海保,等.基于高分2号遥感数据估测中亚热带天然林木本植物物种多样性[J].林业科学,2019,55(02):61-74.
  [3]王怀警.森林类型高光谱遥感分类研究[D].中国林业科学研究院,2018.
  [4]Johansen K,Arroyo L A,Phinn S,et al.Comparison of Geo-Object Based and Pixel-Based Change Detection of Riparian Environments using High Spatial Resolution Multi-Spectral Imagery[J].Photogrammetric Engineering & Remote Sensing,2010,76(2):123-136.
  [5]毛学刚,陈文曲,魏晶昱,等.分割尺度对面向对象树种分类的影响及评价[J].林业科学,2017,53(12):73-83.
  [6]Hossain S M Y,Caspersen J P.In-situ measurement of twig dieback and regrowth in mature Acer saccharum trees[J].Forest Ecology & Management,2012,270(none):0-188.
  [7]Mutanga O,Adam E,Cho M A.High density biomass estimation for wetland vegetation using WorldView-2 imagery and random forest regression algorithm[J].International Journal of Applied Earth Observation and Geoinformation,2012,18(none):0-406.
  [8]马浩然,赵天忠,曾怡.面向对象的最优分割尺度下多层次森林植被分类[J].东北林业大学学报,2014(9):52-57.
  [9]孙晓艳,杜华强,韩凝,等.面向对象多尺度分割的SPOT5影像毛竹林专题信息提取[J].林业科学,2013,49(10):80-87.
  [10]陈启浩.面向对象的多源遥感数据分类技术研究与实现[D].中国地质大学,2007.
  [11]M.F rster,B.Kleinschmit.Object-based classification of QuickBird data using ancillary information for the detection of forest types and NATURA 2000 habitats[J].2008:275-290.
  [12]Reddy S,Research Assistant,Truax D D,et al.Comparing spectral and object based multispectral imagery[J].2004.
  [13]Frohn R,NavenduChaudhary.Multi-scale Image Segmentation and Object-Oriented Processing for Land Cover Classification[J].Giscience & Remote Sensing,2008,45(4):377-391.   [14]Pham L T H,Brabyn L,Ashraf S.Combining QuickBird,LiDAR,and GIS topography indices to identify a single native tree species in a complex landscape using an object-based classification approach[J].International Journal of Applied Earth Observations & Geoinformation,2016,50:187-197.
  [15]张雨果,王飞,孙文义,等.基于面向对象的SPOT卫星影像梯田信息提取研究[J].水土保持研究,2016,23(6):345-351.
  [16]李春干.面向对象的遥感图像森林分类研究与应用[M].北京:中国林业出版社,2009.
  [17]裴欢,孙天娇,王晓妍.基于Landsat 8 OLI影像纹理特征的面向对象土地利用/覆盖分类[J].农业工程学报,2018,34(02):248-255.
  [18]Alimjan G,Sun T,Liang Y,et al.A New Technique for Remote Sensing Image Classification Based on Combinatorial Algorithm of SVM and KNN[J].International Journal of Pattern Recognition and Artificial Intelligence,2017:1859012.
  [19]李楠,朱秀芳,潘耀忠,等.人工蜂群算法优化的SVM遥感影像分类[J].遥感学报,2018,22(4):29-39.
  [20]胡玉福,邓良基,匡先辉,等.基于紋理特征的高分辨率遥感图像土地利用分类研究[J].地理与地理信息科学,2011,27(5):42-45.
  [21]Breiman L.Random Forests[J].Machine Learning,2001,45(1):5-32.
  [22]Dorren L K A,Maier B,Seijmonsbergen A C .Improved Landsat-based forest mapping in steep mountainous terrain using object-based classification[J].Forest Ecology and Management,2003,183(1-3):0-46.
  [23]Kim M,Madden M,Warner T.2008.Estimation of optimal image object size for the segmentation of forest stands with multispectral IKONOS imagery.Object-Based Image Analysis. Berlin:Springer.
  [24]马浩然.基于多层次分割的遥感影像面向对象森林分类[D].北京林业大学,2014.
  [25]李伟涛.高分辨率遥感森林植被分类提取研究[D].北京林业大学,2016.
  [26]王妮,彭世揆,李明诗.基于树种分类的高分辨率遥感数据纹理特征分析[J].浙江农林大学学报,2012,29(2):210-217.
  [27]温小乐,钟奥,胡秀娟.基于随机森林特征选择的城市绿化乔木树种分类[J].地球信息科学学报,2018,20(12):1777-1786.
  [28]申鑫,曹林,徐婷,等.基于高分辨率与高光谱遥感影像的北亚热带马尾松及次生落叶树种的分类[J].植物生态学报,2015,39(12):1125-1135.
  [29]魏晶昱,毛学刚,方本煜,等.基于Landsat 8 OLI辅助的亚米级遥感影像树种识别[J].北京林业大学学报,2016,38(11):23-33.
  [30]徐佳栋.基于时间序列GF-1遥感影像林分类型的分类研究[D].东北林业大学,2017.
  (责任编辑:唐 岚)
转载注明来源:https://www.xzbu.com/1/view-15207574.htm