您好, 访客   登录/注册

基于大数据分析技术的档案信息管理成本预测

来源:用户上传      作者:

  摘  要: 为了克服档案信息管理成本预测过程存在的问题,以提高档案信息管理成本预测精度为目标,设计基于大数据分析技术的档案信息管理成本预测模型。首先分析档案信息管理成本预测的研究现状,找到引起档案信息管理成本预测误差大的原因;然后采集档案信息管理成本的历史数据,并引入大数据分析技术,即极限学习机对档案信息管理成本进行建模预测;最后进行档案信息管理成本预测仿真对比实验。测试结果表明,大数据分析技术可以准确刻画档案信息管理成本的变化规律,获得了高精度的档案信息管理成本预测结果,并且档案信息管理成本预测偏差要小于当前其他档案信息管理成本预测模型,具有更高的实际应用价值。
  关键词: 档案信息管理; 成本预测; 大数据分析; 建模预测; 仿真实验; 系统测试
  中图分类号: TN911?34; TP391                  文献标识码: A                       文章編号: 1004?373X(2020)14?0094?03
  Archival information management cost prediction based on big data analysis technology
  FENG Lu
  (MOE Key Laboratory of Engineering Bionics, Jilin University, Changchun 130000, China)
  Abstract: A model of archival information management cost prediction based on large data analysis technology is designed to overcome the problems existing in the process of cost prediction of archival information management and improve the accuracy of the cost prediction of archival information management. The research status of the cost prediction of the archival information management is analyzed to find out the reasons why the error of the cost prediction of archival information management is great. The historical data of the cost of archival information management is collected and the big data analysis technology (extreme learning machine) is introduced to perform the modeling forecasting for the cost of archival information management. The simulation comparative experiment of the cost prediction of archival information management was carried out. The testing results show that the big data analysis technology can accurately describe the changes rule of the cost of archival information management, the proposed cost prediction model can obtain high?precision cost prediction results of archival information management, and the deviation of the archival information management cost prediction of the model is smaller than that of the other current archival information management models. It has higher practical application value.
  Keywords: archival information management; cost prediction; large data analysis; modeling forecasting; simulation experiment; system testing
  档案信息对一个单位或者个人来说,至关重要,近年来,人们对档案信息管理要求日益提高[1?3]。传统的档案信息管理方式为手工方式,工作量大,容易出错,无法适应档案信息向大规模方向发展要求[4]。随着信息技术、计算机技术、自动化技术的不断发展和融合,出现了许多档案信息自动管理系统[5?6]。
  针对当前档案信息管理成本预测模型存在一些弊端,为了减少档案信息管理成本,获得高精度的档案信息管理成本预测结果,提出基于大数据分析技术的档案信息管理成本预测模型,并通过具体的应用实例分析本文提出的档案信息管理成本预测模型的有效性和优越性。   1  档案信息管理成本预测的研究现状
  档案信息管理成本预测研究可以划分为两个阶段:第一个阶段为线性建模阶段;第二阶段为非线性建模阶段[7?9]。线性建模阶段的主要方法为:一元线性回归方法、多元线性回归方法。它们根据档案信息管理成本特点,分析影响因素与档案信息管理成本之间的关系,对于简单档案信息管理成本预测问题,预测精度高、时间短,最为严重的缺陷是没有考虑档案信息管理成本的随机性变化特点,预测结果可靠性低[10?11]。非线性建模阶段主要方法包括:贝叶斯网络、人工神经网络,尤其是人工神经网络对档案信息管理成本的随机性变化特点拟合效果好,成为当前档案信息管理成本预测的主要建模工具。在实际应用中,人工神经网络存在收敛速度慢、计算机空间复杂度高等不足,使得档案信息管理成本拟合精度高,但是预测错误率却很高,即预测结果的“过拟合”现象[12]。近年来,随着大数据分析技术的涌现,为档案信息管理成本预测提供了各种可能,其中极限学习机就是一种经典的大数据分析技术。为此,本文将其引入到档案信息管理成本预测建模过程中,对极限学习机存在的问题进行解决[13?15]。
  2  模型设计
  2.1 极限学习机算法
  人工神經网络是一种模拟人大脑传递信息的机器学习理论,通常为3层结构,能够对问题的数据之间关联进行挖掘。在实际应用中,其存在许多缺陷,如:运算速度较慢、容易陷入局部最优、难以获得最佳的预测结果。在前人研究成果的基础上,有学者提出极限学习机算法。极限学习机通过随机设置各层之间的连接权值和阈值,在训练过程中不需要对连接权值和阈值进行修改,仅只需要设置隐含层节点数,就可以对问题进行求解,克服了传统人工神经网络存在的局限性。与传统人工神经网络相比,极限学习机的优点如表1所示。
  3  大数据分析技术的档案信息管理成本预测实例分析
  3.1  样本数据及预处理
  为了分析大数据分析技术的档案信息管理成本预测效果,选择多个档案信息管理成本作为研究,将它们组合成一个样本集合,具体如图2所示。选择BP神经网络、多元线性回归的档案信息管理成本预测模型进行对比实验。
  3.2 档案信息管理成本预测精度比较
  采用3种模型对图3前100个档案信息管理成本的样本数据进行建模,后面100个数据进行测试,均进行5次仿真实验,统计每一次档案信息管理成本预测精度,结果如图3所示。对图3的档案信息管理成本预测精度进行比较可以发现,本文模型的档案信息管理成本预测精度要明显高于BP神经网络、多元线性回归,减少了档案信息管理成本预测误差。这主要是因为引入了大数据分析技术(极限学习机)得到更优的档案信息管理成本预测模型,可以反映档案信息管理成本变化特点。
  3.3 档案信息管理成本的建模效率比较
  统计3种模型的档案信息管理预测的建模时间,包括训练时间和测试时间,结果如表2所示。从表2可以发现,3种模型的档案信息管理测试时间相差不大,训练时间相差大。其中多元线性回归的训练时间最少,其次为本文模型,最多的为BP神经网络;而多元线性回归预测误差完全不能满足实际应用要求。因此,本文模型的档案信息管理成本预测综合性能更优。
  4  结  语
  为了提高档案信息管理成本预测精度,本文设计基于大数据分析技术的档案信息管理成本预测模型,测试结果表明,所设计模型获得了高精度的档案信息管理成本预测结果,且档案信息管理成本预测效果要优于其他模型,是一种速度快、精度高的档案信息管理成本预测模型。
  参考文献
  [1] 张倩.区块链技术对高校档案信息管理方式创新的可行性探究[J].档案与建设,2017,40(12):21?24.
  [2] 刘利.论档案信息管理平台在著作权集体管理组织中的应用[J].浙江档案,2013,24(8):26?29.
  [3] 丁任妹.关于构建高校档案信息管理系统的思考[J].西南民族大学学报(人文社科版),2003,22(8):360?361.
  [4] 喻念念.高校人事档案信息管理系统模块的设计与实现[J].山西档案,2015,9(6):64?66.
  [5] 崔海莉,张惠达.云计算环境下档案信息管理系统风险分析[J].档案学研究,2013,15(1):56?60.
  [6] 周胜利.美国陆军档案信息管理系统建设的原则与特点[J].档案与建设,2012(10):22?25.
  [7] 李殷青,王志星.基于WEB的高校学生档案信息管理系统的设计开发[J].兰台世界,2008,22(10):15?16.
  [8] 许慧,张立铭.基于Web的图书馆档案管理系统设计与实现[J].现代电子技术,2016,39(16):48?51.
  [9] 张丽娜,夏庆利.高校人力资源管理的现实困境与对策:基于大数据思维下高校人事档案信息化建设的探讨[J].学术论坛,2016,39(4):157?161.
  [10] 杨加,李笑难,张扬,等.基于大数据分析的校园电子邮件异常行为检测技术研究[J].通信学报,2018,39(1):116?123.
  [11] 王万良,张兆娟,高楠,等.基于人工智能技术的大数据分析方法研究进展[J].计算机集成制造系统,2019,25(3):529?547.
  [12] 陈贵平,王子牛.基于大数据分析的用户信息多重加密存储技术[J].计算机科学,2018,45(7):150?153.
  [13] 余英,朱正国,黄超,等.基于大数据分析的配电网络故障趋势判断[J].电源技术,2018,42(1):132?134.
  [14] 郭平,王可,罗阿理,等.大数据分析中的计算智能研究现状与展望[J].软件学报,2015,26(11):3010?3025.
  [15] 张林林,胡熊伟,李鹏,等.基于极限学习机的电力系统暂态稳定评估方法[J].上海交通大学学报,2019,53(6):749?756.
转载注明来源:https://www.xzbu.com/8/view-15283733.htm