基于GPS大数据的租车人群出行行为分析
来源:用户上传
作者:
摘要:本文利用GPS所采集到的数据,把租车群体的外出行为进行深入分析。通过对大数据进行预先处理,然后建立数据处理模型,分析租车人群的出行规律,推测租车人群的需求,从时问和空间上研究城市租车人群的分布,为城市交通运输提供科学依据和理论支持。
关键词:GPS;出行行为;租车人群;数据采集
中国分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)20-0048-03
如今,城市人口密集,道路交通拥挤,能源消耗,环境污染成为出行所面临的一个巨大问题。人们的出行行为分析已经成为城市进行交通道路建设及城市规划的一项重要参考。由于GPS技术具有实时、客观以及数据量大等特点,GPS移动轨迹数据的挖掘和分析为解决城市拥堵和用户出行提供新思路方法,可以很好地描述和分析用车人群出行行为特征,特征,蕴含着巨大的价值,挖掘移动轨迹数据背后隐藏的有用信息,可改善出行交通流,实行交通预测预警。随着当代生活节拍和都市住民生活多元化的加快,住民外出的调查的难度也日益提高。出租车作为一种不同于公交车的交通器材,其营运具有随机性、全天候行驶以及即停即走等特征,其运营规律能够很好地反映搭客出行特征。此次调查主要面向的对象是针对人流量较大的租车人群,实施的范围是我国人口密度较大的省份和城市。通过出行行为分析,也对租车行业车辆调度,提取租车人群用户画像标签信息发现商业圈,热点旅游区、采摘季山区路况及农户出行行为等,具有一定的研究意义和价值。
1问题分析
拟解决问题一:如何对数据来源采集与提取。随着人们生活质量越来越好,车辆逐渐变成每家每户的必备工具之一。这为我们的对人们出行研究提供了基础保障,传统方式的数据采集必须通过对租车人群进行走访调查,或者是通过租车户登记等信息来进行数据收集与分析,其不规律性和采集信息的困难度很大。这样处理起来的误差会比较严重。而随着科学技术地不断发展,GPS的引入为采集用户出行信息提供了强有力的保障。可能只需要些许设备,或者调用第三方已经处理好的工具。那么我们就可以实时地获取到相对传统方式更加可靠且精细的数据来源,便于我们能够根据租车人群的移动轨迹,能够更好地對风险驾驶、道路规划、出行时间和空间上进行深维度的分析,从而对驾驶行为、租车人群时间和空间上的分布都可以对其指定策略。
拟解决问题二:租车人群轨迹数据分析,在已经通过GPS的方式收集到可靠数据的前提下,那么就可以根据定位实时位置,来获取到经纬度信息。之后在地图上进行详细的标注,并且按照路段不同情况下车辆的加速度,减速,转弯根据特定的算法对车辆的轨迹在地图上进行描述与展现。这样计算下来的一条轨迹即是一名租车人群出行轨迹图。那么之后我们就可以通过对各种不同路段进行采集,加大采集数据量。以大数据的统计方式来减小误差的产生。有了一定的数据基础后,我们便可以对数据进行数据清洗并进一步地优化轨迹与总结。
拟解决问题三:数据人群时间和空间上分析。除了对轨迹处理之外,根据不同的城市,时间和空间上的分析也是必不可少的。时间上我们采用与法定工作日的时间,对数据进行日常的采集,然后我们会将一日时间划分为四个阶段,分别是第一阶段凌晨零点至凌晨六点,第二阶段为凌晨六点至午时十二点,第三阶段为午时十点至下午十八点,第四阶段为下午十八点至凌晨零点。然后分析人们在不同阶段的出行情况。绘制成统计图。这样就能直观地表述人们在一天中不同时候的外出情况。一周多次采集求取均值,以缩小误差产生。再将一周作为一个梯度,重复采集3-4周,以减小因各种原因产生的周误差。这样提取的数据就会变得更加的精确。在空间上的分析就根据一线都市车辆与普通二三线都市进行比较。但因一线城市交通方式更多种多样,各种不确定性较多。而且在一线城市不同的地段,在绘制图形时可能会出现不同的峰值情况。这时候就采用去掉峰值与最低值,再对数据进行处理来减小空间上分布不均匀造成的误差。
2实施方案
2.1建立数据处理模型
首先需要把出租车GPS大数据集放到Hadoop平台上,将其存储在Node2的HBase数据库中,接下来对受天气、环境及操作误差影响较大的数据进行预处理,如果不对这些大数据进行预先处理,将会有很大的可能产生非常大的误差,在使用这些数据之前进行预先处理,可以使得最终的结果更为准确,实行预处理后首先使用DBSCAN算法把预处理后的所得的数据进行处理得到合适的K值,然后把K值作为K-means算法的初始簇心对数据进行最终处理。
在收集数据之前,先根据经纬度对区域进行划分,在区域内的数据进行收集和处理,区域外的则进行剔除。划分区域后对产生的无效数据进行排除,当GPS终端收到车辆的经纬度数据长时间没有发生改变时,表示车辆速度为0,处于静止状态,这样的数据需要对其进行剔除。或者接收的经纬度数据在短时间内发生极大的改变,这样所得到的数据不能真实地反映车辆情况,也属于无效数据。
2.2数据分析
2.2.1租车人群时间和空间上分析
一般而言,租车人员的出行特征会有一定的地域性,不同的租车人员,有着完全不同的出行特征,根据租车人员的起始地和目标地,得出租车人员的外出时间,外出距离和外出高峰期,这里首先分析研究出租车辆工作日和非工作日的GPS数据然后把工作日和非工作日的研究数据分开研究,然后在DB-SCANS算法得出K值后,用K-means算法进行处理,聚类分析不时间段的状态,从而分析出某一天的租车人员行为特征,对比7天的数据处理结果,得出某城市中一天大概的租车信息。
给定一个数据集X={X1,X2,…,Xn}假没K个簇的簇类中心为P={P1,P2,……Pk},那么有概率聚类的目标函数形式如下:
F(n,p)=
其中Q(Xk)表示Pi和Xk的联合概率分布Q(Pi|Xk)代表样本数据点,Xk属于第i个聚点的条件概率,由此可得出以下图像。 2.2.2租车人群轨迹数据分析
由GPS巾包含的信息中可以根据经纬度和时间得出车辆的位置信息和运动轨迹,分析研究7天中出租车的GPS数据,得出租车人群的主要活动地点和运动轨迹,对活动路线实行聚类分析得到整体活动热点,再根据经纬度坐标上的距离和车辆运行的时间分析m租车辆的平均速度,大致地预估某城市的交通路况,从而能够更好地规划行驶路线、出行时间以及降低驾驶风险。
出租车辆驾驶节点A,B的位置坐标的经纬度分别是(Lo-nA,LatA)及(LonB,LatB),在t时刻速度为Vt,下一时刻速度为Vt+1,时间变化量为At。平均速度为V,两点间的距离为Dis-tance。
C=sin(LatA*II/180)*sin(LatB*II/180)+cos(LatA*'IT/180)*cos(LatB*'TT/180)*
cos((MLonA-MLonB)*'1T/180)
DistanCe=R*Arccos(C)*'IT/180[2]
V=DistanCe/At
2.2.3对数据进行利用
得到处理后的数据后,可以建立起租车人员的用户画像,根据用户画像,推测出租车人群的行为和需求,了解其出行规律。从而在活动范围热点在其附近设立商圈对出行人群精准营销,并对城市通行路况进行解析,经过交通预警缓解城市的交通拥堵。
3结论
最终得出的结论有一定的参考价值但不能完全表现出所有的时间所有的地点乘客出行的时间特征和空间热度区域。通过对乘客出行的时间特征和空间热度的分析可以城市更有效地安排公共的交通具的设置地点,这样即环保又能为乘客供应快捷的服务,促使和谐社会更好更快的发展。此外,通过客流量的空间热点区域的分析,可以在热点区域设置休闲娱乐场所为商人提供商机,不仅促进的经济的发展,也使人们生活变得更加惬意。此外,大数据分析研究了租车人群出行行为数据,对租车人群出行行为在不同时间、空间、距离等方面数据进行了深入剖析,提取出了租车出行行为特征,可以建立起租车人员的用户画像,根据用户畫像,推测出租车人群的行为和需求,了解其出行规律,可以对城市交通路况进行分析,通过交通预警缓解城市的交通拥堵,也可调度为出行人群提供精准服务等。
参考文献:
[1]刘惠宇,刘鹏,张婷.基于出租车GPS数据的城市人群出行模式研究[J].江苏科技信息,2019(17):49-50.
[2]郭艳君.基于GPS轨迹数据实现营运客车风险驾驶行为分析.[J】.教育教学论坛,2017(3):76-77.
[3]魏祥.基于大数据挖掘的出租车行为检测方法研究[D].西南石油大学,2015.
[4]盛勇.基于GPS轨迹数据的居民出行行为特征分析[D].江西理工大学,2018.
[5]刘敬帅.基于出租车GPS数据的居民出行分析[D].兰州理工大学,2017.
[6]何贤国,孙国道,高家全,等.出租车CPS大数据的道路行车可视分析[J].计算机辅助设计与图形学学报,2014,26(12):2164-2170.
[7]张亚茹.基于车联网大数据分析的实时路况信息系统关键技术研究[D].南京邮电大学,2017.
【通联编辑:梁书】
收稿日期:2020-04-15
基金项目:教育部产学合作协同育人项目;项目名称:面向大数据技术的创新创业教育改革;项目(基金)号:201802130075;厂东省大学生创新创业训练项目(粤教高函[2019]40号)
作者简介:刘康(1998-),男,广东河源人,本科,研究方向:软件工程;陈智勇(1996-),男,广东普宁人,本科,研究方向:软件工程;黄庆鹏(1997-),男,广东梅州人,本科,研究方向:软件工程;张逸泓(1999-),男,广东汕头人,本科,研究方向:物联网工程。
转载注明来源:https://www.xzbu.com/8/view-15299923.htm