您好, 访客   登录/注册

浅谈基于大数据背景下的统计学的应用

来源:用户上传      作者:

  【摘要】    随着计算机、电子通信等现代化信息技术的迅速发展和技术的逐渐成熟,当下人类社会已经进入到了深化发展时期的信息时代,与之相应的就是基于信息时代下多种现代化信息设备及技术而产生的种类丰富多样、传播便捷迅速、价值密度高且总信息量庞大的数据,即意味着人类社会进程迈入大数据时代,而基于大数据时代背景下数据的高效率收集、安全存储、正确分类处理、具有逻辑性的分析成为了当下发展的热点以及未来市场潜力挖掘的有效途径,本文就通过对相关文献的阅读,阐述大数据挖掘的有效途径——统计学分析技术在多领域中的应用,以实现对统计学的进一步认识,为更好的挖掘其价值发挥作用。
  【关键词】    大数据    统计学    应用
  引言:
  随着信息时代进程的不断推进,每个人所扮演的角色不再仅仅是信息的接收者,同时也在扮演着信息的发出者,因此各行各业会在日积月累中形成极为庞大的数据量,这些数据可能会存在着一些规律和对某种未来发展方向的预测价值,统计学作为一种重要的信息分类方式和价值挖掘手段,在各个领域的数据分析处理中发挥了重要的作用,成为极为重要的科研方法之一,本文就从统计學分析方法在金融、医疗、科研、教育等领域中的应用进行阐述,以实现对统计学分析应用的深层了解,与实际生活应用接轨,从而在掌握统计学方法的同时能挖掘出庞大数据中的潜在价值,以实现各个领域的创新和再发展。
  一、统计学在金融领域中的应用
  1.1统计学在金融投资风险管理中的应用
  金融投资和股票基金的投资管理都存在着一定的风险。而统计学方法在金融领域中的应用就可以在极大程度上使得股民和基金购买者在金融投资中规避风险,同时获得一定的收益。
  例如,通过对金融领域中的指标选取,建立市场走势风向标,利用诸如统计学中的马柯威茨组合理论等分析投资理财中的损失概率分布、可能获得收益和与其收益的偏离程度等具有指导价值的信息,从而得出以何种分散化的投资方法来规避金融投资风险的风险管理理论[1]。
  笔者也尝试着以股票市场中的上市一周年市盈率、历史PEG、区间涨跌、换手率、Wind全A指数区间收益率等作为样本,进行统计学的因子分析理论处理,以获得股票投资的红利价值指标、股票的影响价值指标和投资价值指标,如表1所示,获得了较为满意的预测结果。
  1.2统计学在金融定向服务中的应用
  统计学除了可以分析指导金融投资和进行风险规避之外,对金融行业的业务开展也具有重要的意义,例如通过对参与金融业务的客户的工作、收入、家庭等数据信息的获取,建立相应的信息库,并对这些数据进行分类、关联、聚类、序列模式等分析,以实现对用户信用等级体系的建立以及对客户履约和投资能力进行一定的预估,评定用户金融守约能力的同时,也能挖掘潜在的具有更高价值的客户,从而实现对金融交易对象的个性化、特色化的定向服务,服务具有针对性,交易的成功率也得以保障。
  二、统计学在医学领域中的应用
  2.1统计学在医学流行病学中的应用
  医学中很多疾病的发生呈现出一定的倾向性,倾向性可表现为时间、地域、性别等,因而对这些疾病的发生数据进行收集,运用统计学的离散、中位、均数等方法分析,从而确认这些疾病发生的季节性、性别趋势、年龄段、地域特点等,从而使得疾病的治疗和预防以及筛查工作得以顺利的开展,例如普外科的腹疝,儿童好发斜疝、中老年男性好发直疝,而中年妇女好发股疝,这就为腹疝的诊断提供了一定的流行学诊断依据;胃癌多发于中年男性,因此中年男性成为胃癌筛查的重点人群;子宫内膜癌多表现为女性停经后的不规则流血[2],这为患者疾病的早发现提供警示作用;冬春季高发流感,这就为流感的预防提供了依据。
  2.2统计学在医学预防中的应用
  统计学在医学预防中的应用,主要是针对某种疾病发生的高危因素的挖掘,从而实现对这些致病高危因素行为的规避,以及对具有高危因素群体的疾病筛查、诊断具有提示作用。例如,研究心脏病的危险因素,选择指标有年龄、性别、体重、最大摄氧量,自变量为患病与否,可先进行这些单因素与因变量之间的t检验或者卡方检验,从而筛掉一些无意义的指标,再将这些纳入的指标进行二分类Logistic回归分析[3],最终回归方程中纳入的具有统计学意义的指标即为与疾病发生相关的指标,连续变量的OR值意味着自变量每增加一个单位,疾病发生风险的增加值,分类变量的OR值则意味着赋值高的指标是赋值低的多少倍[4]。如图1所示,即年龄每上升一岁,疾病发生的风险就会增加1.089倍;若女性赋值为0,男性赋值为1,则男性发病率是女性的7.026倍。
  2.3统计学在其它多领域中的应用
  除了上述在医疗、金融领域的深入应用外,统计学在其他诸多领域中的应用也十分广泛和成熟,例如在工程领域中,不同的建筑对混凝土的强度需求不同,为了达到设计的标准,将混凝土强度进行数学期望模型的建模,并通过强度的正态分布以确定可达标的混凝土强度,此外,工程领域中的工程管理和张拉力与油表读数也涉及到了统计学方法的应用[5];统计学在产品的个性化服务中也发挥了重要的作用,例如我们用的音乐播放器会根据听歌习惯进行数据收集,然后有针对性地推荐用户可能会喜欢的歌手或者歌曲,浏览器会根据浏览记录进行相关新闻推送,购物网站根据浏览记录推送配套商品等等;统计学也在社会学、管理学等诸多领域中发挥作用,并朝着多学科融合的方向发展,在更多领域中发挥着更重要的作用。
  三、结论
  综上所述,在信息时代下,数据潜在价值的挖掘为各个领域的创新、健康、稳步的发展创造良好的条件,也提供了有效的途径,随着其在多个领域中应用的深入,大数据分析也具有更为广阔的发展前景和空间,诸如统计分析等研究方法也将不断地与时俱进,以实现对未来更庞大、更繁杂、更深层价值挖掘需求的满足,从而推动人类社会进程翻开新的篇章。
  参  考  文  献
  [1].冯莹.浅谈统计学在金融及证券领域的应用[J].商情,2012(49):1-1.
  [2].杨曦,马珂,吴成.子宫内膜癌的流行病学及高危因素[J].实用妇产科杂志,2015, 31(7):485-488.
  [3].张聪聪.先天性心脏病危险因素分析[D].复旦大学,2011.
  [4].冯磊,年士艳,赵阳,等.不同分析策略下应用二分类Logistic回归进行疾病风险评估的结果差异性分析[J].中华检验医学杂志,2018,41(3):232-236.
  [5].张毅,余成起.浅谈统计学在工程中的应用[J].四川水泥, 2015(8):91-91.
转载注明来源:https://www.xzbu.com/1/view-15135711.htm