大数据管理与应用专业建设路径思考
来源:用户上传
作者:李树青 曹杰 刘凌波
摘 要:随着大数据应用的快速普及,大数据人才培养正在广泛受到国内外高校的重视,不同的学科和定位也促使大数据相关专业建设呈现出多样化的特点。文章从大数据管理与应用专业发展现状出发,从完善培养方案
优化课程体系、加强专业师资建设等方面提出了大数据管理与应用专业的建设路径
关键词:大数据管理与应用;数据科学;信息管理与信息系统
中图分类号:G642.3 文献标识码:A 文章编号:1002-4107(2020)01-0025-05
2008年《Nature》出版了“Big Data”专刊[1]和2011年《Science》出版了“Dealing with data”[2]专刊,两篇论文分别探讨了大数据对互联网、网络经济学、生物医学等领域的影响和大数据给社会各行业带来的机遇与挑战。自此以后,大数据相关研究和技术开始广泛受到人们的关注,其中较早的标志性事件如2012年1月达沃斯世界经济论坛将大数据作为主题之一,探讨了如何更好地利用数据产生社会效益[3],2012年3月美国政府投资2亿启动了“大数据研究和发展计划”[4],等等。同时,大数据相关技术也被广泛地应用于各种商业领域,对当前社会经济发展产生了重要影响,数据科学也被认为是继实验观察、理论推导、计算机模拟后的第四科学研究范式。让相关专业人才因此也呈现出相对匮乏的局面。一份2016年对全球53个国家数据科学人员的薪酬调研表明,具有数据科学相关硕士或者博士学位的雇员要比同期的其他学生具有更高的薪资水平[5]。
一、大数据管理与应用专业发展现状
为了及时满足相关人才的社会需求,国内外高校纷纷开始增设大数据相关课程。数据科学相关课程内容在国外最初于2010年后以专业课程的形式出现在大学计算机科学学院,如加州大学伯克利分校于2011年开设“数据科学导论”课程等[6]。同时,大数据专业建设也被提到了议事日程。在国外,大数据专业最初诞生形式主要为数据科学(Data Science)专业,该专业是从数据分析学(Data Analytics)专业发展而来,最早可追溯至2007年美国北卡罗来纳州立大学设立的数据分析硕士学位(Master of Science in Analytics),2013年美国纽约大学正式开设数据科学硕士专业。截至2017年11月,国外数据科学专业的本科、硕士、博士学位项目分别已达到5601、4179和301项[7]。
国内的表现有两种情况:一是传统专业增加大数据方向,截至2016年9月,此类专业主要有信息与计算科学、统计学、应用统计学、计算机科学与技术、软件工程、信息管理与信息系统等;二是开始增设专门的大数据新专业,如数据科学与大数据技术专业,该专业在2016年有3所高校首次获批开设,包括北京大学、对外经济贸易大学和中南大学。与此同时,2015年由我国管理科学与工程类专业教学指导委员会设立的“新专业建设研究”调研课题组经过近两年的详细调查,研究了国际教育动态和国内商务数据分析人才需求情况,在教指委2015年会和2016年会上进行报告和讨论,建议增设商务数据科学专业,后经教育部核准更名为大数据管理与应用专业,并于2018年首次批准5所高校开设此专业,包括东北财经大学和南京财经大学等。在研究生教育方面,西南财经大学等多所高校也设置了与大数据相关的二级学科和交叉学科,2013年北京航空航天大学开设了国内首个“大数据技术与应用”软件工程硕士项目,2014年中国人民大学等5所大学还宣布联合培养大数据分析硕士等。
作为管理学科归属下的大数据专业,大数据管理与应用专业具有很多自身的定位考虑和人才培养特色,它既受到原有相关专业人才培养方式的影响,也和其他新兴大数据专业形成较大的区别。下面本文重点介绍两个与该专业最为相关的专业,并进行比较说明。
(一)信息管理与信息系统
信息管理与信息系统(以下简称为信管)是目前国内管理学科下与大数据管理与应用最为相关的专业之一,设立于1998年,很多院校的信管专业也是最早提出并增设大数据管理与应用专业。按照教育部规定,我国信管专业的培养目标是培养具备现代管理学理论基础、计算机科学技术知识及应用能力,掌握系统思想和信息系统分析与设计方法以及信息管理等方面的知识与能力,能在国家各级管理部门、工商企业、金融机构、科研单位等部门从事信息管理以及信息系统分析、设计、实施管理和评价等方面的高级专门人才。
这个专业的名称明显地反映了当时信息管理人才需求的特点,即信息系统是信息管理的重要载体,信息系统知识是信息管理知识体系中重要组成部分。因此按照这个思路,中国信息系统学科课程体系CIS 2011中明确了信管专业的主要课程包括信息管理、数据库系统原理、计算机网络及应用、数据结构、系统分析與设计、管理统计学、运筹学、管理信息系统等[8]。在实际开设中,各个院校还广泛开设经济管理类课程以加强学生对信息技术的综合应用能力培养。
该专业有两个明显的特点:一是在专业培养内容设置上,侧重信息技术和经济管理应用的结合,重点培养学生利用信息技术来解决经管应用中的实际问题,传统常见的应用领域有企业信息化(包括MIS等)、信息咨询(ERP实施等)、互联网信息服务(包括信息检索、信息组织等)等;二是由于较为宽泛的专业设定特点,目前国内相关高校对于此专业的开设往往都会根据自己的特点,进行有针对性和有特色的适应化改造。有的院校侧重于信息技术培养,侧重理工科特色,如清华大学、西安交通大学等,甚至很多相关院校都把该专业放置于信息工程类学院下和计算机科学与技术等专业一起开设。还有的院校侧重于解决经管应用中各种信息分析能力的培养,如武汉大学、南京大学等。在国外院校也是如此,计算机学院、信息学院、商学院甚至教育学院都是信管专业常见的所在学院。 经过近二十年的发展,信管专业人才培养取得了明显的成就。截至2017年年底,我国共有612所高校开设了此专业。与此同时,信管专业自身发展中的一些问题也逐渐受到越来越多学者的关注,而在很大程度上,这些问题也正是因为信管专业具有上述两个特点才得以产生。
第一,在专业内容设置上,从宏观层面来看,提出设置信管新专业的二十世纪末正是我国企业实施信息化建设的高峰时期,社会对具有一定企业运营知识又懂信息技术的信息化人才需求量很大,致使信管专业毕业生供不应求,该专业也一度受到热捧[9]。但随着企业信息化普及程度的不断提高,今天企业信息化所面对的已不是二十年前上不上、如何上之类的传统问题,基础性的信息化系统和信息化管理等相关技术与理论已经不再表现为社会人才需求的热点,相反,如何深度融合互联网并利用互联网来改造重构传统企业信息化流程则是更为现实的挑战。此时,结合产业上下游、协作主体交互的大数据共享和分析将突破单一企业应用内部的局限,在更大的行业层面和社会层面上形成更有价值的应用领域[10]。
从微观层面来看,专业知识内容也随着大数据处理自身的发展特点而发生着较大的变化。如站在传统信息科学的角度来看,数据科学专业是由信息科学专业人才培养逐渐细化为数据分析方向后而逐渐形成,比如目前很多数据科学学科设置也多为传统信息科学教育项目下的专门培养方向,因此数据分析类专业内容在数据科学教育中占有较大的地位。但是传统的信息分析方法侧重于统计方法和传统数据挖掘方法的应用,在面对海量数据资源的大数据时代,亟须创新与变革。如维克托·迈尔·舍恩伯格在《大数据时代:生活、工作与思维的大变革》中将大数据理念的革命精髓归结为三点:一是更关注相关性而不是因果性;二是更关注数据的纷繁复杂,而不是数据的精准;三是全部数据,而不是抽样数据[11]。显然,这些大数据处理特性对传统信息分析方法提出了新的要求。
在专业应用方面,对于那些与经管类结合密切的课程内容,发展变化的需求更为旺盛,比如近年来快速发展的互联网金融、移动电子商务、“互联网+”都需要相关信息技术人才的专业能力及时跟进,也只有这样才能胜任当前社会用人单位的需求。
第二,在专业定位的统一性上,过于分散和各自发展的专业特色也在一定程度上造成了专业总体认识上的不清晰,导致信管专业定位一直都成为相关学者关注的焦点,也长期以来没有得到很好的解决[12]。要想形成一种清晰的专业定位布局,必须在专业培养目标上形成一个较为明确的聚焦点,现在的大数据管理与应用提供了一个很好的发展契机,现实中广泛存在的社会需求也会加强用人单位对相关人才和专业的深入认识,这对于专业未来的发展大有裨益。
事实上,信管专业开始转向大数据相关专业的趋势已经在国外iSchool联盟院校成员中逐渐体现出来,如在2018年77所正式院校成员中,含有数据科学(Data Science)的成员已达14所,占比18.2%,其中在第一等级的27所院校成员中,有7所已经开设,占比更高达26%。在这14所院校当中,4所学校在本科阶段开设数据科学教育项目,10所学校在硕士阶段开设相关学位教育,其中印第安纳大学—普渡大学印第安纳波利斯联合分校在博士阶段也增设了数据科学专业教育[13]。这充分说明国际领先的信管专业教育机构已经开始广泛重视数据科学教育,该方向也正在成为新的学科增长点。另外值得关注的是,当代国外数据科学教育并非完全是由传统信管学科所主导,数据科学教育的发展更依赖计算机、数学、统计等学科,这也在一定程度上反映了大数据专业自身的学科交叉性特点。
(二)数据科学与大数据技术
数据科学与大数据技术是我国第一批与大数据相关的新设专业,虽然时间很短,但是截至2018年,已有285所国内高校获批数据科学与大数据专业,其中师范类、财经类、综合类和新升本科地方院校也为数众多,由此可以看出该专业的广受关注。从学科定位上来看,该专业呈现明显的工科特点,大都是由计算机科学类专业所在学院增设,专业培养内容侧重于大数据技术能力的培养,往往对学生有较高的编程和开发能力要求。该专业也具有较强的复合型特点,如中国人民大学数据科学专业开设在统计学院,由统计学院、信息学院、统计与大数据研究院、数学科学研究院联合培养。
从定位来看,该专业在强调数据科学多学科交叉特点基础之上,可以将社会科学、计算机科学、统计学、管理学和法学等多学科知识融入现有课程体系中,但更侧重培养学生的研究设计和项目开发能力,要求学生能综合运用计算机科学和应用数学的知识来分析与处理大规模数据集的能力,具体包括数据清洗、存储与检索、挖掘与探索、数据可视化、道德与隐私、数据分析、沟通与呈现等内容。具体课程包括基础理论类课程、领域应用类课程、数据呈现和沟通类课程、数据计算类课程、数据管理类课程、数据分析类课程、数据产品开发类课程等[14]。
虽然数据科学与大数据技术专业也涉及数据管理内容,但是这部分数据管理内容主要是指数据模型、查询语言、数据库调优和优化、数据仓库以及并行处理等,而大数据管理与应用专业所着力解决的企业行业具体经营管理实践目标迥然不同。由此可以看出,它和目前的大数据管理与应用专业定位差异较大,更多强调工科的特点,目前也主要是计算机科学与技术专业相关学院增设此专业。因此,我们可以这样对数据科学与大数据技术专业和大数据管理与应用专业做个对比分析,前者主要关注“大数据本身的管理”,而后者更侧重于“基于大数据的管理”。
二、大数据管理与应用
(一)完善培养方案
大数据管理与应用为新设专业,国内目前新增院校还不多,因此相关培养方案的设定缺乏足够的参考,也无现成的经验可以利用。按照前文所述的专业定位思考,我们可以将该专业的人才培养定位为“具备良好科学精神和工程素养,具有良好的数据科学基础,掌握面向互联网大数据环境的数据处理和分析方法、面向某行业数据管理方向的管理科学专业知识,具有较强的大数据管理能力和技术应用能力,熟悉现代某行业领域的大数据管理工作,能够承担各级各类组织机构特别是现代互联网企业和政府管理部门数据管理应用工作的复合型、应用型高級专门人才”。 其中“某行业”可以具体结合所在高校的自身特点,有针对性地做出选择,如电子商务、金融服务等。这种院校培养方向的自我定位往往成为特色建设的主要形式,如美国雪城大学的数据科学项目由信息学院和惠特曼管理学院联合培养,目标指向企业经营中数据科学人才的培养,英国斯克莱德大学数据科学项目是由计算机信息科学学院和政府公共政策学院联合培养,定位是为政治领域培养相关数据科学人才。
和数据科学与大数据技术专业相比,大数据管理与应用专业具体的就业岗位主要适应大数据获取与处理及大数据分析等不同领域需求,具体包括数据科学工程师、大数据分析工程师、大数据挖掘工程师、大数据可视化工程师等,而对于大数据应用开发工程师、大数据运维工程师、大数据技术研发工程师之类的岗位更适合数据科学与大数据技术专业。
(二)优化课程体系
从教学目的来看,目前国外数据科学相关专业主要集中在研究生阶段,以课程实践为依托,注重专业教育,而本科阶段的教育则重在培养学生兴趣与素质,更强调数据科学趣味性与专业性。在现有的数据科学相关课程体系设计上,有学者提出了三层结构的数据科学教育框架(Data Science Education Framework,DSEF),即采用用户、工具、应用程序为主的三焦点法来实施教学项目[15]。丹麦的阿姆斯特丹大学于2015年9月实施的EDISON项目也充分采取了该教育框架,具体课程体系包括数据科学能力框架(CF-DS)、数据科学知识体系(DS-BOK)、数据科学专业概况和职业分类(DSP)、数据科学分类学和科学学科分类等内容[16]。国外iSchool院校成员的数据科学专业也可以提供一个基本的参考,它们的具体课程教学目标主要围绕以下几个方面,如培养数据科学领袖和数据灵感、灵活应对不同场景下的数据需求、注重数据科学在企业中的应用、强调数据处理(包括采集、存储、分析、可视化等)应用能力、利用数据科学思想去解决政治社会问题等[17]。在国内,有学者认为数据科学与信息科学在理论逻辑和技术方法上一脉相承,因此建议使用“数据—信息—知识”、“计算技术—数学方法—专业知识”、“人—技术—数据”3个三位一体的教学模式来统一数据科学和信息科学[18]。还有学者提出大数据管理类人才知识体系主要包括信息技术、大数据管理与信息系统、大数据分析处理和大数据技术应用等四个方面[19]。对于具体教学课程的设定,有学者在对iSchool中10所重点院校数据科学专业的141门课程进行收集整理后,可以发现主要分为基础理论课、相关学科基础理论课、统计学、机器学习、数据可视化、数据分析、大数据编程、数据挖掘和综合性内容等方面[20]。
从已有的相关类似专业建设情况来看,该专业主要以计算机、数学和统计等学科为基础,将传统数据处理方法放在大数据环境下,培养学生进行现代企业和政府等组织的管理变革和改进工作的能力,通过以行业应用结合为基础的实践锻炼,加强学生综合利用相关理论知识和技术应用。因为和很多学科存在着较大的交叉关系,数据科学课程设置一直都存在着广度和深度的设置平衡问题,这种问题往往是具有跨学科性质的专业都普遍面临的问题[21]。
但是时至今日,在包括大数据管理与应用等数据科学相关专业教学体系上,依然缺乏较为明确的统一提法,虽然相关学科已有多年教学和科研积累,但是无论是教育层面的研究还是学科层面的研究,数据科学学科的边界和归属问题有待进一步论证,这也在很大程度上可以解释目前教学体系设计的困难原因所在。
我们提出一种按照大数据处理流程为思路的课程设计体系,综合考虑学习进度和课程内容进度的深度融合。该方案具体内容如表1所示。
这里需要补充说明几点。
1.表1从上到下代表着一个不断递进的大数据管
理过程和层次,每一阶段都对应相应的主要教学内容、具体课程、实验和可能的应用结合方向,教学内容从左上角到右下角呈现出基础内容向高层管理决策不斷递进发展的设计过程。
2.不同院校由于在人才培养定位和方向上具有很
大差异,因此在授课内容选择上,既可以向表左上方倾斜,侧重于技术理论教学和相关实验教学,也可以向表右下方倾斜,侧重于管理应用的案例分析。
3.“Hadoop集群环境安装部署”为基础性内容,是后续其他大数据处理类课程实验的前置要求课程。后续具体课程和实验的次序并不明显,可以根据实际情况灵活做出选择和调整。
(三)加强专业师资建设
专业师资队伍的建设绝非一蹴而成,更何况目前国内大数据相关专业主要表现在本科阶段人才培养方面的改革,在研究生阶段,相关学科建设上仍然广泛留存于现有学科的自我完善和研究方向的自我调整。因此,对于大数据管理与应用专业的师资队伍建设,短期内依然还需要现有师资队伍的支撑。这给相关新设该专业的高校提出了较为紧迫的师资队伍专业能力培养和进修要求。从另外一个方面来看,大数据管理应用方面的企业技术人才较为普遍,因此合理地加大与企业联合培养、引进行业应用案例、搭建产学研合作平台是大数据管理与应用专业师资队伍建设的必然之选。即使对于理论课程,这种来自于行业的师资力量也能发挥较大的作用,如Airbnb数据科学家Dave Holtz等来自产业界专家在Udacity上开设了“数据科学导论”,同时他们还能带来更多真实的产业数据资源以供学生实验学习[22]。
(四)突出实验实践
按照2017年教育部在复旦大学召开的高等工程教育发展战略研讨会所提出的“新工科”概念,强调深化产教融合、校企合作、协同育人,增强学生的就业创业能力[23]。
大数据科学相关实验对硬件设备和软件都有着非常高的要求,因此不论在硬件处理能力上还是数据规模上,目前现有的高校实验室往往都不能提供有效的实验条件。而这部分实验条件恰恰被大数据应用相关行业单位所具有,因此大数据管理与应用专业实验必须要考虑行业应用的结合,通过大力引进行业实训平台或者到培训基地参与仿真环境实践,可以更为经济有效地实现实验教学目标,具体形式有课程实验、综合实验、学期实训、专业见习、专业实习、企业实习、企业项目化实训、毕业设计与课外素质等形式。 在学分学时设计上,考虑到实验实践环节的重要性,可以将整体实践环节学分为增设到总学分三分之一以上,为保障课程实验效果,每门课程实验课时占总课时可达四分之一以上,实践性强的课程可以超过一半,如机器学习与高级数据库等课程[24]。综合性实验可以某一个学期进行,时长要有连续性,如一周,在此期间内最好不安排任何其他课程教学,以便于学生全身心投入综合实验训练中。对于综合实训可以放在每学期最后两周集中进行,主要训练本学期基本知识与综合应用,以及培养学生初步的综合应用能力。对于专业见习一般安排在大四期间,为期两周以上,主要让学生了解实际岗位工作环境以及所需的知识能力,为进一步的企业实习和就业做准备。同时为了保证实验实践教学的效果,必须要制定严格的考核标准,包括所有课程实验均有相应的学分,以及明确具体的实训内容、实训计划、指导教师、人员分组、考核办法等系列操作细节。
另外,实践教学体系不是由独立的单一成分组成,它需要考虑到与所在院校专业能力培养的契合、与大数据管理应用的关系、实践教学体系构建对企业自身价值的吸引等多方面内容。
参考文献:
[1]Frankel F,Reid R.Big data:distilling meaning from data[J]. Nature,2008,(455).
[2]Science S.Challenges and Opportunities[J].Science,2011,(5).
[3]刘蕾,鄢章华,白世贞.大数据——多维度给管理决策带来的改变[J].科技管理研究,2016,(14).
[4]孙强,张雪峰.大数据决策学论纲:大数据时代的决策变革[J].华北电力大学学报:社会科学版,2014,(4).
[5]King,J.,Magoulas,R.:2014 Data Science Salary Survey[M].San Diego:O’Reilly Press,2015:5-7.
[6]苏日娜,杨沁.LIS学科中数据科学课程体系设置研究——以iSchools高校课程调研为中心[J].图书馆论坛,2019,(4).
[7][14]朝乐门,邢春晓,王雨晴.数据科学与大数据技术专业特色课程研究[J].计算机科学,2018,(3).
[8]教育部高等学校管理科学与工程类学科专业教学指导委员会,国际信息系统协会中国分会(CNAIS)课题组.中国信息系统学科课程体系2011[M].北京:清华大学 出版社,2011:10-14.
[9]尹燕芳,杨卫平,王卓鹏.信息管理与信息系统专业国际化人才培养研究[J].计算机教育,2015,(5).
[10]李春灿.信息管理与信息系统专业毕业生就业现状分析及就业能力提升措施研究——以郑州航空工业管理学院为例[J].中国管理信息化,2017,(21).
[11][英]维克托·迈尔—舍恩伯格,肯尼思·库克耶.盛杨燕,周涛,译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.
[12]刘星宝,杨蓓.“互联网+”背景下地方院校信管专业的路径选择[J].中国管理信息化,2018,(7).
[13][18][20]闫慧,张钰浩,张鑫灿,等.iSchools联盟数據科学教育项目现状调查[J].情报资料工作,2018,(4).
[15]Il-Yeol,Song,Yongjun.Big Data and Data Science:Opportunities and Challenges of iSchools[J].Journal of Data and Information Science,2017,(3).
[16]Y Demchenko.LEARN Toolkit of Best Practice for Research Data Management[M].London:Leaders ActivatingResearch Networks(LEARN),2017:105-115.
[17]叶鹰,马费成.数据科学兴起及其与信息科学的关联[J].情报学报,2015,(6).
[19]胡洋,石云辉,王观玉.大数据背景下的信息管理与信息系统专业建设改革探究[J].中国教育信息化,2018,(3).
[21]Ramamurthy B.A Practical and Sustainable Model for Learning and Teaching Data Science[C]//Technical Symposium on Computing Science Education,ACM, 2016:169—174.
[22]朝乐门,杨灿军,王盛杰,等.全球数据科学课程建设现状的实证分析[J].数据分析与知识发现,2017,(6).
[23]陶皖,张伟,杨丹.新工科背景下信管专业大数据技术与应用方向改造实践[J].渭南师范学院学报,2018,(10).
[24]欧卫华,夏道勋,张仁津.“数据科学与大数据技术”专业实践教学体系构建研究[J].软件导刊,2018,(5).
转载注明来源:https://www.xzbu.com/1/view-15173975.htm