您好, 访客   登录/注册

基于POI和夜光数据的滇中地区人口空间化模拟研究

来源:用户上传      作者:赵政权 罗虹

  摘要:夜光数据可以间接反应人类活动的强度和范围,因此被广泛用于人类社会经济总量、城市空间格局、城市扩张等领域的数据挖掘。基于NPP/VIIRS(national polar-orbiting operational environmental satellite system preparatory project/visible infrared imaging radiometer)和LJ1-01两种夜光数据,采用空间滞后模型和空间误差模型两种回归模型进行对比,以选择适合的方法同时融入POI(point of interest)数据,分别基于500 m×500 m、150 m×150 m的格网进行人口值预测,并对预测值进行修正,最后以445个乡镇(街道)的人口统计值计算相对误差进行精度验证。结果表明:1)无论对于哪一种类型的夜光数据,空间滞后模型的精度要稍高于空间误差模型的精度。2)从R2大小比较,LJ1-01模型人口预测精度要优于NPP/VIIRS,而LJ1-01与POI融合后的模型精度要优于LJ1-01。3)LJ1-01与POI融合后的预测精度分别比LJ1-01、NPP/VIIRS总体误差提升了2.1%、3.8%,反映出夜光数据与POI融合后可以提升模型预测的精度。4)基于LJ1-01与POI融合后的夜光数据人口预测结果,相对误差小于20%的较为准确区间段比之前的NPP/VIIRS、LJ1-01两种数据占比分别增加了19.3%、10.3%,说明LJ1-01与POI融合后数据比LJ1-01数据更具优势。
  关键词:NPP/VIIRS;LJ1-01;POI;滇中地区;人口空间化模拟
  中图分类号:P237文献标志码:A人口问题一直是社会经济发展的热点,人口数据空间化是采用合适的方法,筛选适合的解释因子对人口统计数据搭建模型,进行离散化处理后探讨区域人口的空间分布规律,模拟人口的地理分布[1-3]。主要的方法目前都基于土地利用数据[4-8]、兴趣点数据[9]、多源遥感数据融合[10]、位置大数据[11-12]进行研究。获取高精度的人口分布信息对于人口、资源和环境的合理规划、管理及区域的可持续发展研究都具有重要的意义[13]。
  夜间灯光数据作为重要的人类活动强度发展指标,因其成本低、周期短、获取方便,对于人口的研究具有无可比拟的优势。早前使用较为广泛的是美国军事气象卫星计划搭载的业务线扫描系统传感器夜光数据(defense meteorological satellite program/operation linescan system,DMSP/OLS),其拍摄的夜光产品空间分辨率为1 km,适用于大尺度范畴的州、国家及地区研究。因DMSP/OLS夜光数据分辨率较低,2012年美国开始启用新一代的国家极地轨道运行环境卫星系统预备工程搭载的可见光红外成像辐射仪夜光数据(national polar-orbiting operational environmental satellite system preparatory project/visible infrared imaging radiometer,NPP/VIIRS),共有22个波段,星下点空间分辨率为375 m,比DMSP/OLS夜光数据分辨率更高,适用于中小尺度范畴的区域研究。2018年我国也发射了全球首颗专业夜光遥感卫星――珞珈一号(LJ1-01),该卫星是武汉大学与相关科研机构研发的全球第一颗专业遥感卫星,LJ1-01卫星获得的系统几何纠正产品,空间分辨率可达130 m,可以识别更细节的灯光。兴趣点(point of interest, POI)与人类活动密切相关,如何基于兴趣点数据更好地进行人口分析也是现在的研究热点[14-15]。很多学者对于人口空间化进行了研究,胡云锋等[16]以DMSP/OLS、NPP/VIIRS夜间灯光数据及其他辅助数据为基础,对川渝地区的人口分布进行了研究,同时随机抽取500个乡镇样本对人口空间化的精度进行对比检验。高义等[17]基于DMSP/OLS夜光数据、NPP/VIIRS夜光数据及人口普查等数据,采用建筑物与裸地增强指数法对海岸带人口进行了空间化处理分析。陈晴等[18]基于LUC数据和夜光数据,以黄河三角洲高效生态经济区为研究区域,生成1 km的人口空间化网格,最后以县及乡镇人口数据进行了精度验证。赵鑫等[19]利用NPP/VIIRS灯光数据、土地利用数据及POI数据,采用主成分赋权法构建广州市人口空间化指标体系,最后对人口进行了空间化处理。目前,人口分布的研究大多在国家、省级的尺度上,且主要集中在经济发达区域[20],鲜有ξ鞑壳域的研究。本研究选用NPP/VIIRS、LJ1-01夜间灯光及POI数据,以滇中经济区为研究区域,分别生成500 m×500 m、150 m×150 m的格网,采用空间滞后模型(spatial lag model, SLM)和空间误差模型(spatial error model, SEM)对人口数据建立回归模型,并以县级人口统计数据修正预测人口数,对比模型的预测精度,最后以乡镇人口统计数据来进行精度评价。
  1研究区域概况及数据预处理
  1.1研究区域概况
  滇中地区指云南中部以昆明市为核心,半径约150~200 km左右,包括曲靖市、玉溪市和楚雄彝族自治州4个州市组成的行政辖区,该区域位于全国“两横三纵”城市化战略格局中包昆通道纵轴的南端,面积约10万km,占全省土地面积的24%,集中了云南省约4成的人口和6成的经济总量,位于长江、珠江和红河上游,属亚热带气候,日照充足,四季如春,气候宜人,干湿季分明,土壤类型以红壤为主,植被类型多样,属于滇东高原盆地,以山地和山间盆地地形为主,地势起伏和缓,集中了云南全省近一半的山间平地(坝子),滇中地区的行政区划图如图1所示。滇中地区是我国连接东南亚、南亚国家的陆路交通枢纽,是面向东南亚、南亚对外开放的重要门户,是云南融入国家“一带一路”和“长江经济带”战略的关键支撑,是云南经济跨越发展的“引擎”和重要增长极,也是全省经济转型升级的主战场,因此研究滇中人口分布具有重要的参考价值。

nlc202211161127



  1.2数据来源
  本研究中的主要数据类型包括了人口统计数据、行政区划数据、POI数据及两种夜光数据。
  1)2018年滇中地区县级人口统计数据来自中国县域统计年鉴2019(县市卷)及云南省统计年鉴(2019);2018年滇中地区乡镇人口统计数据来自中国县域统计年鉴2019(乡镇卷)及云南省统计年鉴(2019)。其中,全国的统计数据中缺少的部分由云南省统计年鉴补充。
  2)行政区划数据来自云南省地理信息公共服务平台2017版的云南省行政区划图,下载地址:https://yunnan.tianditu.gov.cn/MapResource,通过地理配准,以底图为基础进行矢量化。
  3)POI数据通过高德地图进行爬取,POI数据类型主要有餐饮服务、住宿服务、汽车服务、体育休闲服务、生活服务、购物服务、金融保险、医疗保健服务、科教文化、购物服务、公共服务设施、旅游景点等,共获取了387 145条数据。
  4)NPP/VIIRS数据来自美国国家地球物理数据中心(NGDC)2018年发布的夜间灯光月度数据,下载地址:https://ngdc.noaa.gov/eog/download.html。
  5)LJ1-01数据来自高分辨率对地观测系统湖北数据与应用网发布的2018年10月夜光数据,下载地址:http://www.hbeos.org.cn/。
  1.3数据预处理
  NPP/VIIRS可以识别微弱灯光,该下载数据还包含了火山、极光、月光、火灾以及冰川积雪的噪声影响,需要进一步处理。研究采用2018年12个月的月度数据,分别针对12个月的数据去除负值和噪声点,取12个月灯光数据的平均值,之后进行裁剪并重投影为Albers投影,重采样至500 m,夜间灯光数据分布图如图2(a)所示。
  LJ1-01在社会经济统计方面具有非常大的潜力,研究数据采集时间为2018年10月,需对夜光数据进行几何纠正,镶嵌、裁剪并重投影为Albers投影,重采样至150 m,夜间灯光数据分布图如图2(b)所示。LJ1-01数据的辐射亮度值与NPP/VIIRS数据不一致,因此需把LJ1-01的灯光值归化至0~236的范围,以便于之后的回归分析比较。
  2研究方法
  2.1人口空间化流程
  人口空间化流程图如图3所示,首先以行政区划图为基础分别生成500 m×500 m、150 m×150 m的格网,NPP/VIIRS和LJ1-01夜光数据分别经过预处理和归一化处理后,提取两种格网内的夜光值,同时将收集的人口数据加入空间滞后模型和空间误差模型进行回归预测,比较两种夜光数据的回归模型的精度,并加入兴趣点以提高模型的预测精度,再以区县人口统计数据对格网预测值进行修正,然后基于乡镇人口统计数据进行最后的精度评价。
  2.2空间滞后模型
  人口的分布常常会受到周围环境的影响,经典的最小二乘法不能满足人口空间化的需求,考虑到因变量的空间相关性,故采用空间滞后模型和空间误差模型搭建人口回归模型。
  空间滞后模型的计算公式为
  y=αWy+βx+γ (1)
  式中:y是因变量,指的是格网内的人口数;x是自变量,指的是格网内两种不同夜光数据的辐射亮度值,是n×k的矩阵;W是n阶空间权重矩阵;α和β都表示的是空间回归系数,γ是独立误差项。
  2.3空间误差模型
  空间误差模型的计算公式为
  y=βx+ρWμ+μ (2)
  式中:y是因变量,指的是格网内的人口数;x是自变量,指的是格网内两种不同夜光数据的辐射亮度值;W是n阶空间权重矩阵;ρ和β都表示空间回归系数,μ是不相关、同方差的独立误差项。
  2.4POI融合
  POI数据与人类的活动密切相关,且属性丰富,因此可以把POI数据融入夜光数据,提高夜光与人口的相关性。首先对POI进行核密度分析,大于核密度平均值的格网直接进行灰度值的对数处理,目的是缩小像元间差别,降低模型整体差异[14];小于核密度平均值的像元,需先进行归一化处理,再进行对数变换。
  2.5模拟结果精度评定
  3结果与分析
  3.1人口空间化模型比较
  基于NPP/VIIRS夜光数据和人口统计数据建立的模型,其中空间滞后模型的R是0.882 661,空间误差模型的R是0.882 353;基于LJ1-01夜光稻莺腿丝谕臣剖据建立的模型,其中空间滞后模型的R是0.959 567,空间误差模型的R是0.949 470;基于LJ1-01夜光数据、兴趣点和人口统计数据优化后的模型,其中空间滞后模型的R是0.993 504,空间误差模型的R是0.989 537。通过比较发现,两种模型进行回归分析的精度相差不大,但无论对于哪一种类型的灯光数据,空间滞后模型的精度要略高于空间误差模型的精度,因此,后续的回归模型全部采用空间滞后模型进行计算,且整体上LJ1-01模型预测精度要优于NPP/VIIRS,而LJ1-01与POI融合后的模型精度要优于LJ1-01。
  3.2人口格网空间化结果
  3种模型的人口空间化结果如图4所示。由图4可知:1)3种模型的人口空间化结果大致相同,但以LJ1-01为基础的人口空间化结果明显比NPP/VIIRS更能反应人口细节特征;LJ1-01与POI融合结果为基础的人口空间化结果比LJ1-01具有更丰富层次的人口信息。2)滇中地区人口稠密区分布仍旧集中在昆明主城区,并沿着呈贡方向有向玉溪市集中连片的趋势,其次是曲靖、楚雄行政中心所在地人口较为集中,呈现城市多核心圈层分布结构,其余地区人口都较为稀疏。3)因POI数据的加入,人口格网打破了行政界线处的突变式变化,城市中心区域与周边变化自然,更能对比人口的空间差异和人口的真实分布状态。

nlc202211161127



  3.3模拟结果精度评定
  从整体上看,基于NPP/VIIRS、LJ1-01及LJ1-01与POI融合后夜光数据修正后的人口数分别是1 540.72 万人、1 571.27 万人、1 608.53 万人,与2018年滇中地区人口统计数1 813.94 万人相比,几种数据统计结果均与实际值接近,效果较好,各类数据误差分别为15.1%、13.4%、11.3%,LJ1-01对比NPP/VIIRS结果总体精度提升了1.7%,说明珞珈一号夜光数据在人口细节刻画上比NPP/VIIRS精度更高;LJ1-01与POI融合后夜光数据对比LJ1-01总体精度也提升了2.1%,说明与POI数据融合后可以提升模型的精度。
  为了验证人口空间化模型的精度,全区域共445个乡镇(街道)的行政单元人口统计数据参与计算,同时以乡镇(街道)为单元进行格网人口修正值的区域统计,以相对误差f的大小来衡量人口空间化的精度。若人口预测结果相对误差小于20%的乡镇个数占比较高,则说明精度较高;相反人口预测结果相对误差大于60%的乡镇个数占比较高,则说明精度较低。3种模型的乡镇(街道)单元验证表如表1所示。
  由表1可知,从整体上看,NPP/VIIRS夜光数据人口预测结果相对误差占比最大的区间为20%~40%,LJ1-01结果在小于10%以下的区间占比较大,且比NPP/VIIRS在10%以下的区间占比有所提升,说明LJ1-01比NPP/VIIRS夜光数据更能识别一些细节,精度较高;LJ1-01与POI融合后数据相对误差占比最大的区间为0~10%,比前两种数据在同等区间占比有所提升,说明LJ1-01与POI融合后数据在人口识别方面更具优势。
  基于NPP/VIIRS夜光数据人口预测结果相对误差小于20%的乡镇有175个,占比39.3%;基于LJ1-01夜光数据人口预测结果相对误差小于20%的乡镇比前者增加了40个,占比也增加了9%;基于LJ1-01与POI融合后夜光数据人口预测结果相对误差小于20%的乡镇有261个,比之前的两种数据分别增加了86个、46个,占比分别增加了19.3%、10.3%,说明LJ1-01与POI融合后数据比LJ1-01数据精度有所提升,在人口模拟方面具有更大优势。
  在相对误差大于60%的^间段,LJ1-01预测结果的乡镇个数有49个,占比11%,LJ1-01与POI融合后数据预测结果的乡镇个数有20个,比LJ1-01减少了29个,占比减少了6.5%,进一步说明了POI与人口的密切相关,融入后可以明显改善模型质量。
  人口预测结果相对误差小于20%的乡镇个数占比越高,则越能准确估计人口[14]。与已有的研究对比发现,胡云锋等[16]基于DMSP/OLS夜光数据和NPP/VIIRS夜光数据能准确估计人口的乡镇占比为33%、38%;高义等[17]基于两种灯光数据得到的能准确估计人口结果为24%、26%;李爽等[6]利用DMSP/OLS灯光数据得到的乡镇占比为55%,均低于本研究的59%,再一次说明珞珈一号夜光数据的高分辨率可以识别出灯光细节特征,同时融入兴趣点数据可以提高人口模拟的精度。
  4结论
  夜间灯光数据可以间接反映人类活动的范围和强度,实时可靠、高精度的人口空间分布信息对于研究和表征人类对环境、社会和经济影响有着重要的意义[16]。本研究基于NPP/VIIRS、LJ1-01两种夜光数据,采用回归模型进行人口预测,并融入POI进行人口的预测修正,最后以乡镇为单元进行模型的精度评价。
  1)通过比较发现,空间滞后模型和空间误差模型两种模型进行回归分析的精度相差不大,但无论对于哪一种灯光数据,空间滞后模型的精度要稍高于空间误差模型的精度;LJ1-01模型人口预测精度要优于NPP/VIIRS,而LJ1-01与POI融合后的模型精度要优于LJ1-01。
  2)以NPP/VIIRS、LJ1-01及LJ1-01与POI融合后夜光数据为基础的3种模型人口预测结果分布大致相同,人口稠密区仍旧集中分布在昆明主城区及地(州)、区县级行政中心,并呈现城市典型圈层结构,同时LJ1-01为基础的人口空间化结果明显比NPP/VIIRS更能反应人口细节特征。
  3)LJ1-01与POI融合后夜光数据对比LJ1-01、NPP/VIIRS总体精度提升了2.1%、3.8%,反映出夜光数据与POI融合后可以提升模型预测的精度。
  4)基于LJ1-01与POI融合后夜光数据人口预测结果相对误差小于20%,较为准确估值的区间段乡镇个数有261个,比之前的NPP/VIIRS、LJ1-01两种数据占比分别增加了19.3%、10.3%,说明LJ1-01与POI融合后数据比LJ1-01数据更具优势。在相对误差大于60%的严重高估区间段,LJ1-01与POI融合后数据比LJ1-01的结果占比减少了6.5%,进一步说明了POI数据融入后可以提升人口预测模型的精度。
  文中融入POI数据后,虽然在一定程度上提高了模型预测的精度,但考虑到多源遥感数据的快速发展,目前研究仍有一些不足,下一步还将融入土地利用数据、手机定位数据等与人口指示因子密切相关的数据,丰富建模的变量,进一步提高精度。参考文献:
  [1]郭雨臣, 黄金川, 林浩曦. 多源数据融合的中国人口数据空间化研究[J]. 遥感技术与应用, 2020, 35(1): 219-232.
  [2] 杨续超, 高大伟, 丁明军, 等. 基于多源遥感数据及DEM的人口统计数据空间化――以浙江省为例[J]. 长江流域资源与环境, 2013, 22(6): 729-734.
  [3] 王璇璇, 赵明松, 谢毅, 等. 基于NPP-VIIRS夜光遥感的江苏省人口数据空间化研究[J]. 黑龙江工程学院学报, 2020, 34(3): 31-35.

nlc202211161127



  [4] 李欣欣, 王利, 何w. 基于NPP/VIIRS夜间灯光数据和土地利用数据的人口分布图绘制: 以大连金普新区为例[J]. 遥感信息, 2018, 33(4): 35-41.
  [5] 陈晴, 侯西勇. 集成土地利用数据和夜间灯光数据优化人口空间化模型[J]. 地球信息科学学报, 2015, 17(11): 1370-1377.
  [6] 李爽, 赵翠薇. 基于土地利用和DMSP/OLS夜间灯光数据的河南省人口空间化研究[J]. 湖南师范大学自然科学学报, 2019, 42(2): 9-15.
  [7] 潘颖, 黄万里, 叶士琳, 等. 基于土地利用类型数据的统计人口空间化模型研究: 以福建省为例[J]. 云南大学学报(自然科学版), 2020, 42(4): 701-711.
  [8] 马钰琪, 朱秀芳, 刘宪锋, 等. 基于夜间灯光数据和多地理因子数据的人口空间化方法――以辽宁省为例[J]. 北京师范大学学报(自然科学版), 2015, 51(S1): 57-61.
  [9] 成方龙, 赵冠伟, 杨木壮, 等.集成地理探测器与随机森林模型的城市人口分布格网模拟[J]. 测绘通报, 2020(1): 76-81.
  [10]杜培培, 侯西勇. 基于多源数据的中国海岸带地区人口空间化模拟[J]. 地球信息科学学报, 2020, 22(2): 207-217.
  [11]王晓洁, 王卷乐, 薛润生.基于普查和手机定位数据的乡镇尺度人口空间化方法研究[J]. 地球信息科学学报, 2020, 22(5): 1095-1105.
  [12]吴中元, 许捍卫, 胡钟敏. 基于腾讯位置大数据的精细尺度人口空间化――以南京市江宁区秣陵街道为例[J]. 地理与地理信息科学, 2019, 35(6): 61-65.
  [13]白雪, 关逸民. 粤港澳大湾区人口与经济空间格局演变[J]. 地理信息世界, 2020, 27(2): 68-74, 80.
  [14]邹雅婧, 闫庆武, 黄杰, 等. 基于LJ1-01夜间灯光影像的苏锡常地区人口空间化研究[J]. 长江流域资源与环境, 2020, 29(5): 1086-1094.
  [15]黄金侠, 李德平, 周亮, 等. 基于多源数据的人口空间化多方法对比研究[J]. 测绘与空间地理信息, 2020, 43(12): 58-62.
  [16]胡云锋, 赵冠华, 张千力. 基于夜间灯光与LUC数据的川渝地区人口空间化研究[J]. 地球信息科学学报, 2018, 20(1): 68-78.
  [17]高义, 王辉, 王培涛, 等. 基于人口普查与多源夜间灯光数据的海岸带人口空间化分析[J]. 资源科学, 2013, 35(12): 2517-2523.
  [18]陈晴, 侯西勇, 吴莉. 基于土地利用数据和夜间灯光数据的人口空间化模型对比分析――以黄河三角洲高效生态经济区为例[J]. 人文地理, 2014, 29(5): 94-100.
  [19]赵鑫, 宋英强, 刘轶伦, 等. 基于卫星遥感和POI 数据的人口空间化研究――以广州市为例[J]. 热带地理, 2020, 40(1): 101-109.
  [20]王珂靖, 蔡红艳, 杨小唤. 多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用[J]. 地理科学进展, 2016, 35(12): 1494-1505.
  (责任编辑:曾晶)
  Spatial Simulation of Population Distribution Based on Nighttime
  Light and POI Data in Central Yunnan Province
  ZHAO Zhengquan, LUO Hong
  (College of Land and Spatial Information, Yunnan Land and Resources Vocational College, Kunming 652501, China)Abstract: Nighttime light data can indirectly reflect the intensity and scope of human activities, so it is widely used in data mining of human socio-economic aggregate, urban spatial pattern, urban expansion and other fields. In this study, based on NPP/VIIRS and LJ1-01 nighttime light data, the spatial lag model and spatial error model were used to compare the regression models, and the suitable method was selected to integrate the POI data to predict the population value in the 500 m×500 m and 150 m×150 m grid, and then the values were corrected. Finally, the relative error of 445 towns (streets) was calculated to verify the accuracy. The results show that: 1) the accuracy of spatial lag model is higher than that of spatial error model for each light data; 2) compared with R2, the prediction accuracy of LJ1-01 model is better than NPP/VIIRS, and the accuracy of LJ1-01 and POI fusion model is better than LJ1-01; 3) when compared with LJ1-01 and NPP/VIIRS, the total error of the fusion of LJ1-01 and POI is increased by 2.1% and 3.8%, which reflects that the accuracy of model prediction can be improved with the fusion of LJ1-01 and POI; 4) based on the population prediction results of the fusion of LJ1-01 and POI, the accurate interval with relative error less than 20% is increased by 19.3% and 10.3% respectively compared with the previous NPP /VIIRS and LJ1-01 data, indicating that the data of the fusion of LJ1-01 and POI has more advantages than LJ1-01 data alone.
  Key words: NPP/VIIRS; LJ1-01; POI; central Yunnan Province; spatial simulation of population distribution

nlc202211161127




转载注明来源:https://www.xzbu.com/1/view-15442207.htm

相关文章