大数据时代下的统计学
来源:用户上传
作者:
说起统计学,没接触过统计学的人总会觉得“高大上”,认为那是和他们没有关系的一个科目。实际上,统计学与每一个人,与我们的日常生活息息相关。我们关心的日常生活,其中很多就包含了统计知识。例如,在投资股票时,需要了解股票市场价格的信息;在外出旅游时,需要关心一段时间内的详细天气预报;在观察NBA篮球赛时,了解各支队伍的技术统计;甚至,打麻将如何能取胜,其中都蕴含了统计学的知识。因此,理解并掌握一些统计学的知识对普通大众是很有必要的。
在日常生活中,我们会听到许多的数据以及与之对应的结论。例如,吸烟是有害健康的;身材高的父親,他的子女身材也会较高;人每天至少要喝六杯水等等。这些结论是正确的吗?我们可以相信这些结论吗?这些结论是如何从数据中提炼归纳而来的?想要正确理解这些数据,这就需要我们具备一些统计学的知识。
要了解统计学,首先要知道什么是统计学。综合的说,统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。统计学是关于数据的一套科学方法,研究的是来自各领域的数据。因此,统计学的应用领域很广,只要有数据处理的地方,就有统计学。例如,市场研究、财务分析、人力资源管理、气象学、军事科学等等,都与统计学息息相关。
统计学提供的是研究数据的方法,而作为统计学研究的根本——数据,一定要真实、准确且具有代表性,不然后果不堪设想。举一个著名的事例,《文学文摘》预测罗斯福竞选失败。在美国1936年的总统选举中,有两位竞争者,他们分别是来自民主党的罗斯福和来自共和党的兰登。一般民意测验认为罗斯福将获胜,但是美国著名杂志《文学文摘》(Literary Digest)宣布,根据他们对240万人的调查,兰登将获得57%的选票。但最后的投票结果却让这本著名的杂志“啪啪打脸”,罗斯福赢得2770万张选票,以绝对的优势胜出。让人陷入深思的是,为什么《文学文摘》的样本量如此之大,结果却是错误的。
他们预测失败的根本原因在于调查方案存在严重失误,违背了统计学规律。他们使用电话访谈式调查,但当时能拥有电话的基本都是富人,而富人圈基本都是支持兰登。这说明,当我们数据出现差错时,通过统计学的分析结果也会和事实大相径庭。因此,我们在收集数据的时候,要保证数据的来源准确,数据真实可靠,那么之后所做的分析工作才是有意义的。
现在进入了大数据时代,似乎一切都可以转化为数据,而围绕在我们身边的也是无数“隐形”的数据。数据量足够大了之后,我们会发现所有的社会现象到最后都有统计规律,它并不像物理学那样可以准确的说出因果关系,但它从本质上来说就是一个统计的规律。因此,大数据时代给统计学带来新的生命力,也给统计学者带来了更多学习和挑战的空间,同时也让民众更多的关注到统计学这个新兴学科。
转载注明来源:https://www.xzbu.com/1/view-14703468.htm