您好, 访客   登录/注册

基于多源数据的高铁游客画像研究

来源:用户上传      作者:

   [提要] 我国高铁旅游市场发展迅速,高铁逐渐成为我国国民的主要旅游出行方式,旅游客群也日渐成为高铁客运市场的重要组成部分,了解和引导高铁游客的旅游行为,对旅游目的地的产业配置模式及旅游业发展具有重要的意义。本文借鉴用户画像概念,基于移动大数据挖掘分析和问卷调查,采集七大高铁客流站点的25项数据指标,并将其划分为7个维度,构建高铁游客群画像,力求掌握高铁游客的来源省市、人群构成、景区偏好、酒店选择、交通喜好、购物倾向等特征,为高铁旅游发展提出可行性建议。
   关键词:高铁旅游;大数据挖掘;问卷调查;游客画像
   中图分类号:F713.52 文献标识码:A
   收录日期:2020年1月13日
   近年来,我国高铁的飞速发展逐渐改变了人们的出行方式,以交通为基础要素的旅游业也正全面迎来高铁旅游新时代。高铁旅游客群成为人们研究的重点,但是传统的问卷调查、实地调研并不能全面、精准的掌握高铁客群的特征,基于数据的用户画像分析则可以有效地构建游客画像,掌握高铁旅游客群的显著特征,推动高铁旅游的发展。
   一、用户画像研究现状
   “用户画像”起源于交互设计之父艾伦库珀提出的“Persona”概念,即通过数据来分析用户目的、行为以及观点差异,以此为依据将用户分成具有不同典型特征的类型,并给每种类型取名、赋予可视化照片、一些人口统计学要素和场景描述,形成一个人物原型。大数据技术的发展与成熟为基于数据的“用户画像”提供了技术基础,广泛地运用于各个领域中,用户画像逐渐成为国内外学者的研究热点。
   国内对于用户画像的研究已经深入电子商务、教育、移动网络、企业营销、扶贫等多个领域。张长浩等人基于国网商旅信息数据,基于人们出差过程中出行方式的優化选取以及酒店住宿的偏好,构建一种用户画像框架技术,创建了基于双层XGBoost的多视角融合模型,提升分类精确率,实现快速、准确识别敏感客户群体。刘超等人采用Hadoop框架,应用DPI深度挖掘和分布式爬虫等技术,快速准确地获取用户的手机号码和终端类型,将家庭用户的行为偏好相关联,最终塑造固网宽带下的家庭画像,从整体上洞悉用户的需求,做到精准营销,改善用户体验质量。黄山将学生画像技术运用于高校学生事务管理领域,这有利于学生事务管理理念的转变、学生评价机制的完善,还能让个性化思想政治教育成为可能。刘海鸥等人基于用户画像视角,构建了融合图书馆用户基本信息标签、内容偏好标签、互动标签、会话标签、情境标签的图书馆用户画像模型,并引入情境化推荐方法为读者提供精准的个性化知识推荐服务,为提升我国图书馆的大数据知识服务水平提供了新的研究视角。陈冬玲等人通过对贫困人口的行为痕迹数据进行搜集、整理、分析,形成贫困对象大数据画像,为提升脱贫成效提供数据支撑。
   国外对于用户画像的研究相对较少,主要在其内涵、产品研发等方面。Chikhaoui、Wang和Xiong等人提出了一种基于因果关系的用户画像模型,利用序列聚类算法、概率后缀树、标准化互信息(NMI)度量抽取用户行为特征,从而实现单个用户识别和活动预测。Trusov、Ma和Jamal将用户画像视为是用户通过在线活动所表现出来的兴趣和偏好的特征集合。Lerouge、Ma和Sneha等人以中国老年慢病用户群体为例,通过焦点小组访谈法、采访法、实地观察法收集用户数据构建老年慢病用户画像,并根据这类用户的需求特征,研发面向老年慢病用户的应用程序。
   从现有研究来看,首先基于大数据的用户画像研究相对较少,多数研究是在一些理论的支持下,结合研究者的知识和经验来描绘用户的属性差异,从而抽取用户特征。现有的大数据画像研究也主要运用机器学习方法,例如决策树、逻辑回归等方法进行研究,尚未深入融合大数据技术。其次,用户画像在旅游领域内的研究相对较少,尤其是在高铁旅游方面几乎为零。与高铁旅游经济相关的成果已经有所发表,但对于高铁旅游客源群体等微观领域内的研究相对较少,特别是基于大数据的分析更是较少,且研究方法单一,已有研究中主要以传统的问卷调查和分析方法进行研究,缺乏统计分析、数理模型等的定量化的分析方法,从而难以较准确地表征高铁游客的多维度特点。本研究将基于用户画像这一概念,运用大数据分析与挖掘技术并结合问卷调查数据,聚焦高铁旅游客群这一微观主体,刻画出高铁游客群体的基本特征、行为特征及偏好等,建立高铁旅游客群多源数据的分析与应用框架,研究相关措施,促进高铁旅游的发展。
   二、研究方法
   本文主要采用移动数据分析法和问卷调查数据法,根据研究目标综合考虑数据可获得性,分析意义等,从游客实际行为特征和心理需求特征两个方面对高铁游客进行七大维度的画像分析。实际行为特征包含高铁游客客源市场特征、人口统计学特征、社会经济特征、旅游行为特征及移动应用使用特征,心理需求特征包含需求偏好特征及群体差异特征,如表1所示,其中前5个维度由移动数据分析,后2个维度由调查问卷数据分析。(表1)
   (一)移动数据分析法。移动数据分析法就是使用大数据采集与分析技术,即LBS、APP、LBS融合APP以及业务规则融合机器学习等人工智能技术,基于海量移动大数据,从多方面刻画高铁游客画像,分析高铁旅游客群的基本特征,涉及客源市场特征、人口统计学特征、社会经济特征、旅游行为特征、移动应用使用特征五个维度。对2019年1月份和8月份北京南站、哈尔滨西站、郑州东站、上海虹桥、贵阳北站、广州南站和成都东站7个高铁站点的高铁游客进行移动数据的游客画像分析,涉及性别、年龄、婚姻状况、资产、活动等方面。移动数据内容包含游客的GPS轨迹、基站定位数据、公交卡轨迹、WIFI定位数据等,还包括移动社交网络中签到轨迹、带有GPS标记的图片轨迹数等。
   1、数据采集。基于设备识别技术和地理位置分析算法,在终端用户授权情况下对7个选定的高铁站点游客进行相关数据的挖掘和分析,共计5个维度22项数据指标1,178,908个样本。这种不需要埋点的侦测最大限度保证了数据采集中对于设备产品的保护,有效地实现了数据安全的系统性要求。    2、数据处理。数据处理过程总体上均为将各种数据源数据进行清洗,在去重、去噪以及一致性处理等后,根据各种采集指标的要求,基于LBS数据、APP数据、POI数据以及第三方数据等进行综合处理。LBS数据是通过电信移动运营商的无线电通讯网络(如,GSM网、CDMA网)或外部定位方式(如,GPS)获取移动终端用户的位置信息(地理坐标或大地坐标),并在GIS(地理信息系统)平台的支持下,为用户提供相应服务的一种增值业务;APP数据指用户移动设备中下载安装的手机应用数据,以此分析游客的某些行为特征;LBS和APP融合数据处理能够综合游客的位置行为信息与APP所体现的用户行为特征信息,从而分析出游客的地点选择。对于无法直接获取的游客特征,则通过业务规则融合机器学习等人工智能技术进行分析。具体处理方式如表2所示。(表2)
   (二)问卷调查法。调查时间为2019年12月9日~15日,从需求偏好特征及差群体性异特征入手,以专业性旅游研究网络社群、城市规划网络社群、亲子旅游妈妈网络社群、旅游达人网络社群、空港工作人员网络社群、旅游自媒体网络社群、短视频网红主播社群、攻略网站旅行家社群、高校教师和学生网络社群、网络优惠信息分享社群、社区业主社群、自驾旅游信息沟通群等为主展开调研。调查内容涉及游客对高铁旅游认知、行为意愿、行为模式、旅游决策、需求偏好、国内外高铁旅游评价以及发展建议等方面。
   1、数据采集。采用线上调研方式,受访者涉及我国31个省及直辖市,既包括高铁骨干网上的北京、上海等,也包括重要区域支线上的四川、重庆和安徽等,同时也有城际高铁的天津、南京和长春等。同时,为了防止出现结构性偏差(即受访者均来自于高铁网络所在省市),还面向未形成高铁网络的地区收集了样本,线上共回收2,945份问卷。
   2、数据处理。经过对回收问卷的检查和删选,最终获得有效问卷2,207份,有效率为74.9%,并依据需求偏好特征及差群体性异特征进行分类,包含选乘高铁出游态度、出游动机、高铁票价偏、高铁乘车时长偏好、高铁乘车时间偏好、对高铁列车的服务需求、对高铁站点的服务需求、对高铁官方APP的服务需求、不同月收入群体差异、不同学历群体差异和不同婚育状况群体差异,共计11项数据指标。
   此外,本文还运用了实地调研方法。对总公司、铁路局、铁路旅游公司和高铁旅游乘客进行调研访谈,明确高铁旅游发展现状及存在的问题,建立高铁旅游经济的应用研究体系框架。研究提出高铁旅游产品设计、市场开发与经营模式等相关方案,以促进高铁旅游发展。
   三、高铁游客画像结果分析
   (一)客源市场特征方面。各城市的高铁客源省份主要以周边中近程省份及主要高铁线路沿线省份为主,哈尔滨的高铁游客主要来自京哈高铁沿线省份;广州的高铁游客则主要来自京广、贵广高铁沿线;成都的高铁游客则多来自西成高铁、成渝高铁及相应延长线的沿途省份,北京、上海、郑州三座城市,由于是高铁枢纽城市,集中着多条高铁线,其高铁游客来源省份则更为分散,且经济发达省市是高铁目的地城市的重要客源地,未来在品牌宣传及广告投放时,应重点关注这些城市的游客需求。
   (二)人口统计学特征方面。人口统计学特征主要是从性别、学历、年龄、婚姻以及有无子女方面开展调查的,调查显示高铁游客主要呈现以下特征:(1)男性居多;(2)年龄以16~35岁为主,中青年居多;(3)已婚游客占比较大且无子女人数较多;(4)学历普遍较低。对此未来高铁旅游在服务升级、产品创新等方面需要多方兼顾,尽量照顾到每一代人、不同类型人的需求。
   (三)社会经济特征方面。资产方面,由于各地区、各城市的收入水平不尽相同,所以无法以绝对收入数值界定收入档级。本处对于高、中、低收入的划分,是以多个维度并参考样本常住城市的整体收入水平综合判断。总体来看,高铁游客中低资产等级占比约四成;与此同时,中高资产人群占比则接近六成,高铁游客的购买力度相对较强,在高铁旅游产品创新和业态升级方面需注重品质及性价比。
   (四)旅游行为特征方面。涉及吃、住、行、游、娱、购,即旅游六要素方面。飲食方面:自助餐、烧烤烤肉、火锅、咖啡酒吧茶馆饮品、川湘菜等类型的占比较大,总体而言高铁游客去往各目的地时多会选择当地最有特色的餐饮类型,如东北的烤肉、广式的甜品及粤菜、川黔的火锅及川菜等。住宿方面:游客对住宿的选择更趋于个性化,民宿、公寓式酒店等成为高铁游客的新选择。此外,经济越发达的城市对星级酒店的倾向度越高,反之则低。交通方面:游客更倾向于选择高效快捷和耗时短的交通方式,铁路交通尤其是高铁成为多数人的选择。游玩方面:各城市的高铁游客都比较倾向于去其周边的主要城市,最感兴趣的旅游景点类型是主题乐园,其次是古代遗迹和历史建筑,山水风光和现代街区也是很重要的部分,且大学生团体和亲子游团体在这两个时间段呈现出较大的群体优势。购物方面:高铁游客的资产水平还是处于较优的水平,其旅游消费能力相对较强,城市氛围、品牌形象、产品品质等对高铁游客购物有一定影响。娱乐方面则偏好短时、高频、近程的周末游玩。因此,在设计高铁旅游产品时要尽量参照游客食、住、行、游、购、娱方面的偏好特征,因人制宜。
   (五)移动应用使用行为方面。游客经常使用的APP,一是可以反映其上网偏好;二是可以根据热门APP来制定广告投放计划。从各城市高铁游客的APP使用偏好来看,社交软件(微信、微博等)的使用频率最高,其次是综合商城(淘宝、京东等)和短视频(抖音、快手等)类APP。此外,在线视频(爱奇艺、腾讯视频等)、拍摄美化(美图、美颜相机等)等APP也有较高的使用频率景区与相关铁路部门可以依据游客APP的使用偏好特征进行信息的推送及服务平台的拓展。
   (六)需求偏好特征方面。近八成的受访者对于选择高铁作为外出游玩的主要交通方式这一问题持积极正面的态度。探亲访友或回乡、休闲度假和观光游览是高铁出行的三大主要动机。有关游客对高铁旅游服务需求的主要是涉及高铁站点、高铁列车和官方APP。高铁站点方面,游客最希望的是优化换乘,实现无缝接驳;高铁列车方面,游客最希望的是加强高铁与目的地联动,实现凭高铁票享景区优惠门票;高铁官方APP方面,游客最希望的是增加高铁行程展示地图,实现个性化的高铁行程可视化。    (七)群体性差异方面。总体而言,不同月收入、不同学历和不同婚育状况的群体在高铁旅游偏好和需求方面具有明显的差异。
   四、结论及建议
   (一)结论。通过大数据分析和问卷调查数据,从7个维度刻画了高铁游客群的行为特征和需求偏好的画像,得出以下结论:(1)经济发达地区是高铁游客的主要客源地,这些游客倾向于便捷、快速、衔接良好的交通体系。(2)高铁游客偏好具有当地特色的旅游产品,希望获得一站式的个性化服务并获取相关优惠。(3)高铁游客偏好网络APP获取相关资讯,分享、便利自己的生活。
   (二)建议
   1、选定目标客群,开发产品。不同地区、性别、年龄、学历等的高铁游客有着不同的行为特征以及需求,每个高铁旅游目的地首先需要明确重点的客源市场,了解、掌握目标客群的需求才能进行精准营销。如,应对大学生团、亲子游兴盛的现象可以开发研学旅游、夏令营等高铁旅游产品,针对老年团则设计夕阳红高铁旅游产品。
   2、创新“高铁+”旅游新业态。充分利用好“高铁+旅游”的优势,加强高铁与目的地的联动,推出多种高铁旅游产品新业态。如,针对高铁游客关注的凭高铁票享景区优惠门票的问题,开发打造“高铁+景区”的新模式,与目的地景区合作,为游客提供门票等优惠。
   3、完善高铁旅游接驳服务设施。加快高铁与其他交通工具的组合方案,推动“高铁+飞机”、“高铁+租车”、“高铁+地铁”、“高铁+公交”等交通运输组合,构建特色交通旅游产品组合,对内衔接以高铁为核心,实现高铁站场到旅游目的地的换乘无缝对接。比如,设置从高铁站到市中心及主要旅游景点的旅游交通大巴专线,在高铁站或网上购票。
   4、利用网络APP进行营销推广。随着互联网技术的发展,越来越多的游客选择在网络平台上获取相关资讯,高铁旅游目的地可开发官方APP,实时向游客提供最新资讯,包括实时景观视频、优惠策略等,并增加高铁行程展示地图,实现个性化的高铁行程可视化。此外,与时下流行的网络平台如微博等合作投放广告,推广高铁旅游。
  主要参考文献:
  [1]张长浩,余志勇,周振,石瑞杰,王新勇.基于国网商旅大数据融合背景的用户画像构建[J].电信科学,2019(12).
  [2]刘超,刘馨璐,王攀,张丽娜.基于DPI和大数据分析的宽带家庭画像[J].计算机技术与发展,2018.28(12).
  [3]黄山.学生画像技术在高校学生事务精准管理的运用[J].科学咨询/教育科研,2019(13).37.
  [4]刘海鸥,姚苏梅,黄文娜,张亚明.基于用户画像的图书馆大数据知识服务情境化推荐[J].图书馆学研究,2018.443(24).
  [5]程冬玲,聂燕敏,韩素芬.基于大数据画像的精准扶贫服务研究[J].无线互联科技,2019(22).
  [6]Chikhaoui B,Wang S,Xiong T,et al.Pattern-based causal relationships discovery from event sequences for modeling be havioral user profile in ubiquitous environments[J].Information Sciences,2014.285(11).
  [7]Trusov M,Ma L,Jamal Z.Crumbs of the Cookie:User Profiling in Customer-Base Analysis and Behavioral Targeting[J].Marketing Science,2016.35(3).
  [8]Lerouge C,Ma J,Sneha S,et al.User profiles and personas in the design and development of consumer health technologies[J].International Journal of Medical Informatics,2013.82(11).
  [9]馮英杰.高铁时代背景下的城市居民出游行为研究[D].南京:南京大学,2012.
  [10]方敦礼.高铁背景下长三角地区发展慢旅游的思考——基于旅游者行为模式的视角[J].经济研究导刊,2013(16).
  [11]Lederman.Track-monitoring from the dynamic response of an operational train,Mechanical Systems And Signal Processing,2017.15(2).
转载注明来源:https://www.xzbu.com/2/view-15129129.htm