基于众源数据的旅游信息可视化平台建设研究
来源:用户上传
作者:
[摘 要]传统旅游平台展现旅游信息的形式往往较为单一且交互性弱,针对目前的问题与需求,本平台结合众源旅游数据采集、信息可视化等技术,以重庆市作为案例,在广泛搜集现有网络旅游平台中用户自发上传的点评、路线等旅游信息数据的基础上,为普通游客用户、旅游规划人员、研究人员提供一个直观的旅游信息可视化平台,包括POI地图可视化、热门旅游路线地图可视化、点评热度可视化、时序变化特征统计图等,改变了传统旅游信息单一的展示方式,提升了用户体验,能够满足用户的实际应用需求。
[关键词]旅游信息平台;信息可视化;众源旅游数据
doi:10.3969/j.issn.1673 - 0194.2019.02.075
[中图分类号]TP311 [文献标识码]A [文章编号]1673-0194(2019)02-0-04
0 引 言
目前,旅游业已成为国民经济的战略性支柱产业,2017年国内游客数量达到50亿人,国内旅游收入达45 661亿元。2018年,国家旅游局与文化部合并,组建文化和旅游部,这标志着文化、旅游统筹管理,资源配置更合理。在智慧旅游不断发展的背景下,旅游业已进入大众化、全域化时代。互联网技术和自媒体平台的迅速发展一方面为旅游者分享旅游经历、提供出行建议带来了巨大的便利;另一方面为计划出行者进行游玩规划提供了极具代表性和可靠性的重要参考依据。目前,在线旅游信息平台主要有地方政府宣传网站以及专业旅游服务网站。由政府职能部门主办的以政务资讯、地区介绍为主的地方政府宣传网站,主要发布旅游新闻、政策条例、旅游数据等信息。以旅游资讯为内容的专业旅游服务网站,如携程、去哪儿网等,它们主要关注旅游产品及相关服务的交易,在此类旅游网站中用户自主上传的攻略、心得、评价和照片等众源数据往往是极具参考价值的信息,能够填补当前旅游数据采集过程中的空白。然而,现有的旅游地理信息平台没有充分体现地理信息技术在数据处理和信息集成方面的強大潜能,导致当前地理信息技术与旅游信息化的结合面临诸多困惑。主要问题有:第一,许多旅游宣传网站的内容仅仅展示的是地区发展动态、文件政策等信息,对于旅游数据的展示较为单调且不够直观,容易让以游客为主的用户难以寻找到其感兴趣的旅游资讯,导致访客的范围和数量都较为有限;第二,宣传网站在平台设计上缺乏互动性,仅在信息宣传方面发挥了作用,不能利用现有的数据库和网络技术进行用户交互,导致用户体验较差。
为解决以上问题,本平台在采集众源旅游数据的基础上,开发了一个集景点信息检索、分析、展示等功能于一体的旅游信息可视化平台。结合网络爬虫技术采集众源数据,通过对数据进行一系列的处理和分析,使数据的展现形式更加直观详细。通过信息可视化的方式,解决了信息展示单调的问题,能够帮助游客更好、更快地了解景点,通过用户交互的体验方式构建可视化平台,弥补了现有旅游宣传网站用户交互性弱的不足,能够提升用户体验,对于游客了解当地文化和旅游具有重要的意义。
1 数据采集与处理
本平台应用于CODA重庆开放数据创新应用大赛的参赛产品“优游出行”中,以重庆市作为开发案例,利用网络爬虫的方式采集了去哪儿网、携程网、马蜂窝网3家在线旅游平台的重庆旅游景点信息,包括POI信息、点评信息、旅游路线信息,通过数据清洗、集成、变换、归约对众源数据进行一系列的预处理,以此构建众源旅游景点数据库并应用于平台中。
1.1 数据采集
网页数据采集最常用的方法是网络爬虫,它可以按照一定的程序或者规则自动地从互联网上抓取相关的资源与信息。本平台应用Python语言设计一个具有模块化的网络爬虫程序,采集流程如图1所示。
针对旅游景点POI、点评数据、旅游路线数据所需采集的内容不同,设计了不同的采集模块。旅游景点POI需要采集景点名称、地址、经纬度坐标、景点简介、景点评分、点评数量、景点类型、开放时间、建议游玩时间、联系方式、官网以及该景点对应的网页链接,其中景点名称、地址、经纬度和网页链接在采集的过程中不能为空值,网页链接必须为唯一值。采集每个景点中所包含的每一条点评数据,包括点评内容、评分、点评时间以及点评用户。采集的旅游路线数据包括出游天数、出游日期、途径的旅游POI以及发表该路线的用户。
1.2 数据处理
数据处理是构建可视化平台过程中不可或缺的步骤,由于数据采集的来源不同且数据质量参差不齐,导致采集到的众源数据存在许多噪声,为了节省时间和空间,需要对数据进行预处理操作。数据处理操作的流程图如图2所示。
在数据清洗的操作中对数据的缺失值、噪声以及不一致的数据进行处理,例如对于景点POI中点评数量字段的缺失值使用零值填充,对于表示时间日期的字段统一采用八位数字编写,将多个平台采集到的数据合并并存放至统一的可视化平台数据库中,因此需要对多个数据库进行集成。
由于旅游路线数据是纯文字的数据,在该平台中则需要先对其进行地理空间化,通过旅游景点POI将路线转化为带有空间地理位置信息的数据,便可以实现路线的地图展示功能。运用空间匹配和空间地统计的手段对空间数据进行计算,综合考虑数据量及运行效率,选择开源的MySQL作为平台数据库,将集成及计算后的数据统一存入库中。
2 构建可视化平台
平台采用B/S模式开发,通过引入Web服务器完成终端与数据服务器的无缝衔接,网页端采用C#、ASP.NET、AJAX的终端开发技术,后台数据库管理采用稳定高效的MySQL实现。
2.1 平台架构设计
可视化平台的整体架构使用传统的MVC框架进行设计。MVC即模型(Model)—视图(View)—控制器(Controller),是一种业务层、数据层以及控制层三层分离的开发架构。平台技术架构图如图3所示。 数据层为整个平台提供数据处理以及数据存储服务,起到了数据支撑的作用。数据层使用SQL语句完成业务逻辑的数据读写任务,利用MySQL数据库实现对业务数据的存储与管理。
控制层是整个平台的核心组件,是业务层与数据层之间的桥梁。它接收来自客户层的数据请求,并根据具体的业务类别对该请求做出正确业务逻辑处理。同时,应用层又是数据库的对外窗口,用于对数据库进行数据处理操作。
业务层主要实现用户与平台之间的交互操作、可视化展现以及业务层与控制层的数据请求。详细的技术路线包括以下几个方面。
(1)前端可视化交互界面。业务层利用HTML结合CSS的网页前端编程技术开发平台的前端可视化交互界面,提供用户与平台进行交互操作的窗口。
(2)旅游数据可视化展现。业务层以高德地图JavaScript API作为本平台的WebGIS组件。高德地图JavaScript API可构建功能丰富、交互性强的地图应用程序,除了基本地图功能外,还可实现地点搜索、路线规划、定位、地址解析、行政区查询等数据服务。本平台利用高德地图JavaScript API中的地图显示、地图放大缩小、鹰眼等GIS服务,实现地图应用功能。结合Echarts的数据可视化框架,实现统计信息的可视化。
(3)业务层与控制层之间的数据请求。业务层利用基于AJAX的数据异步交互技术向控制层发送数据请求并接收来自数据层返回的JSON格式的返回数据,通过解析该JSON格式的返回数据来获取请求的数据,这个过程是一次完整的前端数据获取过程。
2.2 平台数据库设计
平台数据库主要设计了4张表:ScenicSpot表、Route表、Comment表以及CalComment表。ScenicSpot表为旅游景点表,存储平台中包含的重庆市旅游景点及其信息属性;Route表为旅游路线表,存储平台中所采集到的重庆市众源旅游路线数据;Comment表为点评表,存储平台采集的有关景点的所有点评数据;CalComment表为点评统计表,是用来存储由Comment表中的点评数据经过计算和处理后得到的各项信息,使得在调用数据库的过程中能简化操作和计算量,节约平台的运行时间和空间。
2.3 平台功能设计与实现
旅游信息可视化平台主要分为景点可视化和路线可视化两大模块,其中景点可视化又包含了其中的点评可视化。在景点可视化中,利用高德地图API实现了景点分布的地图展示,用户可在地图页面查看重庆市分布的各个旅游景点,检索自己感兴趣的景点。通过点击某一景点,能够在弹窗中查看该景点的详细信息。
综合计算景点的点评、评分,利用Echarts条形图生成景点综合关注度排名统计图,用户可通过访问此统计图了解当下热门景点的排名情况。针对单个景点,平台还提供了景点评价倾向占比图,使用户能够了解该景点正面评价、中性评价、负面评价各自在所有评价中所占的比例是多少,从另一个角度了解这个景点。对点评词条进行关键词提取并展示,用户可了解到该景点具有哪些属性,大众对于该景点的普遍评价是什么,以便在游览景点的过程中可以更有侧重点。对于最正面的评价和最负面的评价,平台也对其进行了信息提取和可视化以展示在用户面前。点评可视化功能如图4所示。
用户选择路线查看功能可访问到所有路线信息,路线可视化模块亦提供了景点选项,选择感兴趣的景点即可查看包含该景点的旅游路線,为行程规划提供参考。路线可视化模块如图5所示。
3 结 语
本平台充分利用网络技术在信息可视化方面的优势,研究基于众源数据的旅游信息可视化平台的需求与架构。通过信息可视化的方式,实现地图展示与统计相结合,使用户可以直观地了解历史游客对目的地(重庆)的评价以及POI的关注热度,解决了平台表现形式单一的问题,将信息以一种更加直观、更加容易被理解的形式展现在用户面前。通过用户交互的体验方式构建可视化平台,弥补了现有旅游宣传网站用户交互性弱的不足,提升了用户体验。引入众源旅游数据库,将由真实用户产生的数据应用到平台中,丰富数据来源,能够使信息更为全面。普通游客用户通过访问平台,可以进一步了解城市文化,为出游提供参考建议;旅游规划人员以及相关研究人员可通过该平台实时了解目的地旅游现状,与原有的规划研究进行对比分析。基于众源旅游数据的可视化平台不仅能够促进地理信息技术与文化旅游产业信息化深度结合,也使地理空间位置信息在旅游个性化服务中发挥重要作用。下一步的工作是继续完善计算模型,添加辅助决策等应用,拓宽平台功能。
主要参考文献
[1]李俊楼,马卫.我国旅游业电子商务发展现状及策略分析[J].电子商务,2013(9).
[2]王守成,郭风华,傅学庆,等.基于自发地理信息的旅游地景观关注度研究——以九寨沟为例[J].旅游学刊,2014(2).
[3]林妙亭.新疆刀郎非物质文化遗产旅游网络平台开发设计[D].上海:东华大学,2014.
[4]边馥苓.时空大数据的技术与方法[M].北京:测绘出版社,2016.
[5]柳永坡,刘雪梅,赵长海.JSP应用开发技术[M].北京:人民邮电出版社,2005.
[6]张宜生,张乐福,梁书云.计算机网络与数据库技术及其工业应用[M].北京:机械工业出版社,2001.
[7]刘子轩,艾廷华.自适应显示环境可视化表达的线要素图形化简[J].测绘地理信息,2017(1).
[8]杨波,王继周,毛曦,等.基于K-means算法的突发事件地理信息空间化研究[J].测绘通报,2018(7).
[9]谷众源,宋喆.水平定向非开挖地下管线三维探测成像技术的应用[J].上海电力,2010(2).
[10]肖展春.基于地理信息系统的湖北省主要旅游景区可视化信息发布研究[J].科技创业月刊,2009(11).
[12]李成,赵军.基于Web of Science的旅游管理研究信息可视化分析[J].旅游学刊,2014(4).
[13]冯娟,张雅丽,梁栋栋.基于Echarts的居民出游时空可视化研究——以芜湖市为例[J].电脑知识与技术,2017(31).
[14]柳向东,陈锦岚.旅游电商对产品区域异质性的提升策略研究——基于大数据与数据可视化方法[J].统计与信息论坛,2017(8).
[15]鲁天学.基于知识图谱的我国体育旅游研究领域可视化研究[J].南京体育学院学报:自然科学版,2017(2).
[16]包诗亮,周伟强,祝若鑫,等.基于OpenLayers和WebSocket的旅游资源配置实时可视化设计与实现[J].测绘与空间地理信息, 2017(12).
转载注明来源:https://www.xzbu.com/3/view-15168017.htm