大数据技术在高校档案管理中的应用
来源:用户上传
作者:
【摘要】随着大数据时代的来临,档案信息化进程不断加快,档案部门通过档案信息系统管理的数字档案资源数量与种类越来越多。本文分析了大数据技术给档案管理工作带来的挑战和机遇,并讨论大数据技术在高校档案信息化和信息安全防护机制建设等方面的应用。
【关键词】档案管理;大数据;高校
大数据技术的逐步发展给档案管理工作带来了巨大的变化。伴随着一系列机遇的到来,新形势对档案管理工作提出了挑战。随着大数据技术的不断完善,国内高校的档案管理信息化程度已相当高,一定程度上提高了档案管理工作的实际效率,同时档案管理信息化也逐渐发展起来。另外,高校档案馆资源朝着多趋势发展,且数据量越来越大,具备了大数据的特征。种类繁多、结构各异的海量数据和互联网具有不确定性。
一、大数据时代背景
大数据技术的发展给档案管理提供了良好的发展契机,有效提升了档案管理工作的整体效率。在大数据时代,传统载体档案将面临全面的数据化而不仅仅是数字化。数字化可能是僵死的信息存储,而数据化则是可检索和可以进行关联分析的活数据。大数据技术作为一种从大量网络结构性、非结构性、异构类数据提取有价值信息的能力,所需处理的数据规模巨大。人们使用网络产生的数据资源有多种类型,包括音视频资料、文本数据、地理位置信息、上网记录等,符合用户个人预期的个性化数据占主导地位。利用大数据技术对数据资源进行分析,运算效率较高,遵循“1秒定律”,可以从各种结构的网络数据中快速找到有价值的信息供用户使用。
总之,“大数据”是海量信息资源的总称,计算对象是大规模的网络数据,但真正有价值的信息可能是整体数据的一小部分。所以,大数据技术应用的主要目的是从海量的信息数据中提取有价值的信息。
二、大数据背景下档案管理面临的挑战
(一)抽取和挖掘有用的信息和知识。知识管理是档案管理发展的趋势和方向,现在的档案用户早已不再局限于对数据和文件的利用,更加希望能够获得隐藏在数据背后的信息和知识。所以,档案利用服務也不能仅仅限于提供数据,而应该将信息转化为知识。但是,知识不是自身产生的,同样也不是简单的信息综合,需要不断抽取和挖掘才能发掘出来。
(二)查询到所需要的档案信息。与以往信息缺乏的时代相比,如今的信息时代,各种电子文件被广泛利用。但是,各种信息文件太多,造成了信息泛滥,为筛选有用信息带来了困难。由于档案信息化建设工作不断加强和数据涵盖量快速增长,我们在查询时,有用的信息往往被埋没在大量无用信息中。不仅如此,检索性能直线下降,甚至没有响应。因此,档案服务要解决的最重要问题就是如何在大量的档案中快速而准确地找到有用的信息。
(三)对大数据进行充分的开发利用。对档案进行管理的目的是便于日后对档案的利用,需要二次开发档案信息资源,做成各种形式的编研产品,同时主动提供给查找档案者。在大数据时代背景下,各种档案数量急剧增加、各种档案类型以及编研开发非结构化的档案信息,给二次开发档案信息资源工作带来了困难。首先是在海量数据中寻找有价值信息之间的联系,其次是编研开发非结构化的档案信息,最后是降低档案开发工作人员的工作量。虽然目前先进的互联网信息技术已应用至社会各阶层和各领域,但工作人员手工修订和整理各类档案与文件的传统方式依然在实际工作中沿用。
(四)缺乏相应的软件支撑。高校档案管理工作的落实部署、检查、审查、监督等重要环节,都需要相应的软件进行支撑。软件在档案管理之中的作用应该依托校园网,使得各部门的档案数据能够依据要求进行传输以及公开。
三、大数据背景下的高校档案管理
随着大数据技术的日益完善,将大数据技术应用于档案管理具有非常重要的意义,不仅可以解决传统档案管理模式效率低、成本高的问题,还可以满足不同类型的档案管理需求。
(一)软硬件设施的建设。高校档案管理工作的信息化离不开软硬件设施的支持,对于硬件设施主要是提供用于档案管理工作所需要的计算机以及存储设备,工作主要内容是做好计算机以及电子文件存储设备的安全维护与数据备份管理。对于软件设施,则主要是选择操作容易、维护简便以及具有查询功能的管理软件。通过高端的软硬件设施,确保高校档案管理信息化顺利开展。
(二)高校档案信息资料。高校档案信息资料的收集整理主要是按照规范、标准以及统一的数据格式对各种电子文件资源进行整理,可以在档案管理信息部门设置中心系统,作为收发、存储以及整理电子文件的中转站,提高信息的收集以及保管工作的效率。
(三)档案管理系统的安全保密。由于部分高校档案信息资料具有一定密级,因此对于这些资料,既要确保档案资料的真实、可靠、完整,同时也要确保电子档案数据库处于安全可靠的状态,对这些电子档案进行访问使用,必须经过相应的授权方可操作。
四、大数据技术在高校档案管理中的应用
(一)档案数据资源趋势分析机制。在高校档案管理中,档案管理员为了满足用户的个性化需求,从海量的数据资源中提取有价值的信息,提供给师生或是学校行政部门,有必要建立数据资源趋势分析机制,基于用户行为及个体意愿从大量结构化、异构化的数据资源中提取有价值的信息数据提供给使用者。所谓数据资源趋势分析机制,是指档案管理机制的构建者利用大数据技术、分布式数据库、算法工具构建面向网络资源、馆藏资源进行分析、处理、获取、管理的逻辑系统。一方面,高校档案管理部门要以师生用户的隐性信息需求为核心,分析用户的需求变化和分布状态提供专业的数据平台供用户使用;另一方面,档案管理部门利用算法工具分析馆藏资源、网络资源的使用情况及资源中所包含的价值性信息,针对使用者使用需求进行匹配。值得注意的是,用户的资源需求是多元的,所应用的算法工具及分析模型要在不同的时间节点内调整,能随着档案信息资源更新、用户需求变化做出改变,实现用户需求管理与知识挖掘同步进行。 (二)关联性数据标注系统。数据标注系统是高校档案管理部门针对用户需求管理、信息资源挖掘和价值性信息使用所形成的知识标注机制,主要是针对用户的需求变化、档案信息资源使用情况、价值性信息挖掘,对用户使用过、未使用的数据资源进行数据性关联性标注。高校档案管理部门针对海量的数据信息、档案信息资源进行知识挖掘,最重要的原则是根据资源的价值进行数据标注,使之具有标签管理特征。用户根据档案资源的标注,借助标签管理系统能够根据档案信息资源的数据逻辑特征快速找到关联性数据,准确查询。
(三)实现档案资源可视化处理。在档案信息资源挖掘和标注过程中利用计算机可视化技术,对结构化的档案数据进行分析对比,能根据算法工具就资源的类型、时间、作者、价值等信息进行统计,依托计算机网络生成分析报告,以可视化的数据模型呈现出来。同时,利用计算机可视化技术能对有关资源主题深入分析,基于关联性数据资源生成可视化图表,用户充分了解档案信息发展建设情况,选择有价值的信息资源。值得注意的是,利用计算机可视化技术能够帮助档案管理部门以更加直观的方式查看基于数据挖掘机制产生的价值信息,为后期开展用户的个性化档案管理服务进行经验积累。
(四)设置智能辅助工具。传统的档案信息检索使用模式主要是通过输入相应的关键词,得到检索结果,从中发现有价值的信息资源。基于大数据技术产生的智能辅助工具是在信息资源合理利用、合理使用的基础上加上智能算法形成的。通过主动推送信息,在用户输入关键词时,系统根据用户的搜索行为自动向用户提供信息数据。例如,在检索某一时间节点信息时,系统会根据用户的输入法使用变化,自动筛选数据资源,及时向用户提供与之对应的档案信息,方便用户快速作出决策。
【参考文献】
[1]朱琦.大数据技术在档案管理中的应用研究[J].科技资讯,2018,16(02):8-9.
[2]陈明九.大数据时代高校档案管理系统建设研究——以山东建筑大学为例[J].山东建筑大学学报,2015,30(05):506-510.
[3]谢怡.基于大数据的高校档案管理模式变革[J].山东理工大学学报(社会科学版),2015,31(06):103-107.
[4]朱乔芙.档案管理系统的设计与实现研究[J].信息记录材料,2018,19(04):181-182.
[5]林丛.福建省高校档案管理系统的应用现状与对策[J].办公室业务,2017(19):113.
[6]毕大鹏.高校档案管理信息系统的设计与实现[J].电子技术与软件工程,2016(05):69.
[7]许琪玮.论高校档案管理与大数据技术的应用[J].办公室业务,2018(14):157.
[8]王津琳.云計算、大数据在水利档案管理系统建设中应用的构想[J].海河水利,2017(06):55-56.
[9]康广文,刘月香.计算机在档案管理中的应用与发展[J].黑龙江科技信息,1998(03):18.
[10]刘莎.档案管理信息系统建设应注意的几个问题[J].档案管理,2018(06):96.
[11]王玮.云计算环境下的高校档案管理系统研究[J].电子测试,2016(21):111+105.
[12]王春英.大数据技术在档案管理中的应用研究[J].黑龙江档案,2016(02):48.
转载注明来源:https://www.xzbu.com/3/view-15216711.htm