基于大数据、云计算与用户行为分析
来源:用户上传
作者:
摘 要:随着社会全面的进入大数据时代和云计算时代,大数据已经逐步的融入到我们的生活中,人们都能够感受到大数据对我们生活的改变。同时,很多用户的行为,会被计算机自动化机器所保留记录下来,通过大数据和云计算的方式,对这些用户的行为进行分析,可以更好的掌握经济发展的规律。本文探讨了大数据,分析了大数据和云计算下对用户行为,研究了大数据对企业与用户关系的影响,以及大数据背景下对用户行为分析带来的挑战。
关键词:大数据;云计算;用户行为分析
中图分类号:TN919.2 文献标识码:A 文章编号:1671-2064(2019)15-0027-02
0 引言
随着人类社会的发展,目前已经全面的进入到了信息化、智能化的时代中,很多用户的行为都被记录下来,并且能够对其做出分析和预测,对于掌握我国的经济发展和社会的真实规律有很大的帮助,能够为人们制定智能化、个性化的服务,对提升城市的管理、提高交通质量、提升人们的生活质量,有很大的帮助作用,同时,减少不必要的浪费。
1 大数据概述
1.1 大数据分析
大数据的记录数据的方式,从本质上发生的改变,用户在浏览网站中的数据信息,会通过设备记录下来,通过用户的行为来挖掘数据,由于数据规模比较庞大,因此,需要多个云平台来扩展数据的节点体系,需要拓展性更强的大数据架构,云计算能够为用户提供多种数据支持。
1.2 云计算的发展趋势
云计算能够让用户集中到“云端”,是计算机网的一种运用模式[1]。在外国的一些国家,云计算逐渐成为国家核心竞争力的主要手段,如美国的云计算服务中,在农业、司法部门和军事中得到的应用,并通过构建云计算的生态系统,能够推动产业链的发展,在澳大利亚,政府在公共行业和服务行业中,将大数据分析融入其中,制定出了公共政策。我国的云技术已经有了很大的突破,主要应用在了北京电力和我国的教育云系统中,形成了H3C的云计算系统。
2 大数据和云计算下对用户行为分析
2.1 对信息进行分类
信息资源整合分为两大类型,一是同类数据的合并,二是不同类数据之间的关联[2]。在同事数据的合并中,可以将用户发的信息汇集起来,进行归类研究,关注用户群体的特点,在同一类性的数据中,存在数据格式的不同、数据规模的差异,所以需要对资源进行整合,使得数据资源具有统一的结构,形成具有代表性的数据规模;另外一类是不同数据之间的关联,是利用科技的搜索形式,通过关键词、摘要、文献、用户日志对信息进行整合[3]。大数据信息组织,目前具有很强的扩展性、容错性。在信息组织过程中,具有较好的精确性和普遍通用性。目前的大数据建模中,还没有完全参考数关系数据库的模板,因此,存在着信息冗繁不一致的现象。可以通过用户行为的分析,进行宏观、微观和中观的多层次的观察,建立一个具有一定弹性和层次的数据信息。
2.2 对信息资源的收集
目前,在网络上可以通过大数据,收集信息,但是却没有分析数据对用户行为带来的影响,为用户行为的分析带来了难度。通过对原本的数据进行标注,可以获取大量的信息内涵,可以为用户的行为作出很好的指引,为用户寻找数据提供便利的条件。目前,主要使用的映射方法有GAV和LAV两种方法,虽然前者查询的效率比较高,但是没有很强映射扩展性。而LAV方法具有很强的扩展性,是采集发数据集的主要应用方法。
2.3 对信息的处理和挖掘
在对用户的数据进行分析和挖掘的过程中,主要表现在的几个方面:(1)将数据可以分成多个小规模的模块,再对数据进行处理和挖掘,降低数据的传输和系统计算的费用。(2)针对不同的数据的结构的不同,安全性的不同以及相关法律限制的不同,可以将数据信息进行集中化的分析,对于不符合实际的数据信息,进行处理。通过云计算分布式的用户日志框架进行分析,对日志进行处理、用户模式进行深入的挖掘、分析和研究,这种方式非常方便、便捷,在云端就可以完成。(3)对于不同结构的数据的分布式的数据挖掘,可以从相互学习和元学习进行。元学习是从已经得到的知识中再进行学习,最终得到数据模型。而相互学习是从多个数据的挖掘节点,对通过一个学习任务进行互相分析学习成果的方式。对于异构的数据分布挖掘数据的形式,可以先使用正交化的基函数分成分量模式,最后行成全局的模式。(4)云计算能够以租代买的形式,可以有效的提升计算系统的使用率,对于商业领域来说,可以在云数据平台中以较低的成本进行使用信息。(5)云数据储存的模式。GFS硬件系统,是一个规模比较大的中低端计算机集群,有一個主节点和许多的数据节点。在程序访问数据的过程中,会首先访问主节点,在获取主节点的信息,通过数据的节点就会影响到整个系统数据的使用情况。(6)云分布式计算架构。这种与GFS相类似,是面向队规模的计算机集团进行设计的,主节点控制和分配个子节点的计算机资源。任何一个子节点,就可以从集群中移除,不会影响执行当前的任务。在MAPPEDUCE的构架下,可以由系统自行完成,用户不需要有此方面的转化,也可以有效的进行分布式的计算。在谷歌提出的这两种思想的基础上,研发了一个Hadoop计算框架,能够处理大量的分布式的处理软件框架,在实践中取得了很大的成效。(7)对知识呈现的方式进行研究。在知识的呈现上,需要通过数据的可视化形式来表达出来,再进行分析,如媒体软件脸书上的情感数据分析可知,科学家将人类的情绪分为12种不同的类型,如高兴、悲伤、生气、暴怒等,其中的每种情绪,都会触发人们的心理情绪的变化、面部表情的变化,对人们的外在行为产生刺激和影响。通过分析,将可视化的方式展现的大众面前。如:美国波士顿的爆炸案会引起人们情绪的低落,通过可视化的技术手段,可以让用户直观的看到大数据解释的规律和未来的发展趋势。
3 大数据对企业与用户关系的影响 (1)在互联网的环境中,用户对企业的管理不断的增强,大数据、云计算改变的传统商业运作模式,通过大数据可以对用户进行分析,这也是未来企业的主要研发和发展的方向之一。这使得用户和企业之间的关系发生了很大的变化,互联网的环境能够给企业提供更多的创新基础,这样可以给用户带来更多的价值。(2)互联网能够让企业和用户之间无障碍的沟通,通过社区可以进行有效的沟通,这重创新的模式,可以增强企业研发能力,用户也能随时看到企业更新的动态。其次,大数据能够有效的对用户的信息进行分析,提升了用户的议价能力,通过两者有效的互动,可以推动企业创新与改良产品,更加满足用户的需求。
4 大数据背景下对用户行为分析带来的挑战
4.1 信息范围
大数据的数据来源主要是计算机生成的数据和社交网上的缓存数据,不论是哪种类型的数据,其中有原始数据和结构化的数据,但是数据的结构和内涵上,出现了真假不清的情况,因此会干扰对用户的分析,影响了分析的结果。
4.2 数据的存储
大数据的数据质量和数据的质量上都有一定的变化,与传统数据存在很大的区别。对分析传统的用户行为主要以数据仓库上的数据为主,但是大户数据对用户的分析,首先需要处理超大的数据库进行分析,传统的数据库不能够驾驭超大的数据库,所以,必须要首先解决处理超大数据库的处理和分析的能力。
4.3 信息安全的问题
大数据、云计算的发展中,很多用户的隐私可能会被盗用或者暴露,如在进行个人的信息检索的过程中,如果不注意就会暴露到自己的信息。因此,在大数据和云计算的时代发展中,需要对用户的信息进行规范,要做好法律限定,避免个人信息的曝光,在大数据处理信息的过程中,一般都是在开放的环境下进行的,所以很难保证数据信息的安全,使得信息系统更加的不安全。这就给非法盗用信息的人员提供了可乘之机,对用户的安全造成了不利的影响。
4.4 不断的整理知识内容 形成体系
在大數据、云计算的时代发展中,分析用户行为是一个长期而复杂的过程,需要不断的摸索积累经验,因为互联网平台的数据,需要进行充分的处理和挖掘,云服务平台中,需要大数据的知识进行整合,提高大数据的扩展性,这样才能更好的各个行业中得到应用和发展。
5 结语
综上所述,在大数据、云计算的时代背景下,如果信息想要得到更好的使用,就需要对用户的行为进行分析,是未来面临的巨大的挑战和发展的机遇。在对用户的行为进行分析,可以将数据进行重新的构建、对数据进行分析,再生成有益的信息,通过大数据的分析,能够形成广阔的视野,加强对大数据信息资源整合的分析,同时加强对用户的行为理论的分析,才能推进社会经济的发展。
参考文献
[1] 王兵.基于云计算技术的大数据用户行为引擎设计[J].电脑知识与技术,2016(05):1-2.
[2] 陈硕,李晓戈.大数据、云计算与用户行为经验分析[J].信息记录材料,2018(7):118-120.
[3] 张梅.云计算技术下的大数据用户行为引擎设计研究[J].西安文理学院学报(自然科学版),2016(3):48-52.
转载注明来源:https://www.xzbu.com/8/view-14988524.htm