您好, 访客   登录/注册

浅析大数据背景下的档案信息安全保障

来源:用户上传      作者:诸悦

  摘要:大数据时代的档案工作有不同于以往的工作内容,档案信息安全更是不容忽视。该文梳理了大数据背景下关于档案信息安全的研究成果,提出了档案数据本身存在安全问题以及存储环境、数据挖掘、数据分析过程中的安全问题,并提出了利用数据存储技术保障档案信息存储中的安全、在运用数据挖掘技术的过程中保障档案信息安全、在运用数据分析技术的过程中保障档案信息安全的策略。
  关键词:档案;大数据;信息安全
  中图分类号:G271
  文献标识码:A
  文章编号:1009-3044(2020)05-0024-03
  开放科学(资源服务)标识码(OSID):
  大数据自产生以来就迅速发展,目前大数据观念已经深入影响到了世界各国的国家政策制定、学科研究等领域。大数据与各个学科都产生了联系,关注新技术、新方法一直是各学科研究的方向,所以档案学与大数据相结合也推动了许多新研究的出现。档案信息化建设在档案领域产生了巨大影响力,是当前的研究热点之一,档案信息安全风险也随之出现。所以,在大数据背景下,新时期的档案建设要注重档案信息安全,发现档案信息存在的安全风险,并积极完善档案信息安全,使档案能够实现更长时间的保存与利用。
  1 研究现状
  1.1国内研究现状
  国内学者对于大数据背景下档案信息安全的研究主要包括以下几个方面:
  1.1.1大数据背景下档案信息安全保障框模型研究
  肖秋会、李珍认为大数据环境下档案信息安全保障体系的构建应遵循法规标准导向原则、数据驱动原则、安全管理原则、技术保障原则,从宏观治理层、中观管理层、微观技术层三个层面来进行;陶水龙用四个层面来区分档案大数据的管理,提出利用副本来保障信息安全。
  1.1.2大数据背景下保障档案信息安全的措施研究
  陈慧提出在大数据时代,从宏观层面上看应完善法律法规、加强制度保护,从技术层面上看应采用大数据技术保障档案信息安全;郝志琼提出了做好电子档案与纸质档案并存工作、建立健全档案信息化安全管理制度等措施以保障大数据时代的档案信息安全。
  1.1.3大数据背景下对国外档案信息安全保障案例研究
  肖秋会、伍黎丹研究了“数字连续性计划”,该计划由澳大利亚国家档案馆实施,有利于保障档案数据不被篡改,进而维护档案数据在长期保存中的安全;冯慧玲以美国国家档案局为例,分析了其近年来在档案信息安全保障方面的措施,如提高国家控制力、完善法制环境等措施值得我国借鉴。
  1.2 国外研究现状
  国外关于大数据背景下档案信息安全的研究主要包括以下几个方面:
  1.2.1 大数据背景下档案信息管理的研究
  Brain Kellv等阐述了大数据背景下档案信息管理的范围应扩大,在线社交媒体信息也应归档,并研究了推特归档在可持续性等方面的挑战;KofiKorantengAdu等人指出大数据背景下档案信息资源的管理力度应增大,政府部门在档案信息管理方面应承担责任。
  1.2.2 大数据背景下档案信息安全风险研究
  Juan Voutssas等以拉丁美洲国家的发展为例,从文化意识、技术、法律、方法论、经济以及社会因素这六个角度探讨了档案数据的保存及风险。;Mike Kastellec阐述了限制档案信息保存的因素,并将其分为技术性因素和非技术性因素,包括访问维度、保存范围、法律以及财政预算;Edward M.Corrrado从人力资源的角度出发,将大数据环境下数字档案保存所涉及的风险分为三类:技术系统、元数据收集和元数据编目,并指出还需要足够的政府行政支持。
  1.3研究述评及启示
  国内外关于大数据时代的档案信息安全研究有一些共同点,共同关注点都集中在档案信息资源的保存与利用过程中的问题与解决策略等方面。此外也各有优势与不足。
  国外的研究比较倾向于档案信息管理的问责,强调政府的主导性。国内关于档案信息安全研究在内容和层次上看都有不断拓展、不断深入的趋势。但目前研究尚存在一些不足,比如对大数据时代档案信息安全保障的研究仍然没有摆脱传统形态档案安全的逻辑框架,有些研究是在纸质档案安全保障体系的基础上将对象换成了数字档案;此外对于研究成果在实际工作中是如何贯彻执行的,取得了怎样的反馈,对此的关注比较少。
  2 大数据背景下我国档案信息安全管理的基本情况
  2. 1法律法规逐渐完善
  近年来,我国在法律法规建设的过程逐步考虑到档案信息化的因素,逐渐完善了此类法律。随后顺应大数据的发展又逐渐制定和发布了一些涉及档案大数据、電子文件等的法律、规章或标准。从法律方面来看,除了《中华人民共和国档案法》以外,《电子签名法》《保守国家秘密法》等法律中的一些条款与档案信息安全均有一定的联系。从行政法规方面来看,目前我国的档案行政法规中的《电信条例》《计算机信息系统安全保护条例》等都是与大数据背景下的档案信息安全相关的。从规章方面来看,《电子档案移交与接收办法》《文书类电子文件元数据方案》等与档案数据的采集有一定的联系。总体而言,我国近年来关于档案大数据方面的法律法规有一些进展,但整体上大部分法律法规仍然是针对传统的纸质档案,仍需完善。
  2.2 信息基础设施建设逐渐推进
  国家信息基础设施是指用来保障国家重要领域所建立的信息网络,如电信、金融等领域的信息网络,信息基础设施建设是大数据背景下保障档案信息安全的重要前提,推进信息基础建设是国内外公认的世界数据安全工作的核心部分。在此背景下,我国也重视信息基础设施的规划与安排,政府逐步出台了一些相关的政策和指导规划,严格控制网络病毒、网络攻击、网络窃密、计算机病毒等网络犯罪问题,用法律来保障信息基础设施,提高档案信息的安全性。   3 大数据背景下我国档案信息安全存在的问题
  3.1 档案大数据本身的安全问题
  档案的本质属性就是原始记录性。但是在大数据环境下,档案信息的原始性、真实性成为一个问题。在大数据环境下,电子档案、电子文件的收集、归档、鉴定、保管、提供利用直至最终销毁都离不开计算机等软硬件,也离不开网络与大数据,所以档案管理的各个环节都不可避免地受到一定的风险影响。首先,在档案数字化的过程中,纸质档案的载体、存储空间和表现形式都受到了改变,并且其载体有被更替的风险、存储空间有被压缩或扩大的风险、表现形式有被更改的风险,在这些过程中都会对档案的原始性和真实性产生影响。此外,在存储数字化档案的过程,档案信息对系统有一定的依赖型,当档案信息需要被转移的时候,要经过不同系统的多次读取与录入,在此过程中可能会有较多的新的元数据加入,从这个层面来看很难保证档案的原始性。所以,在大数据环境下档案数据本身存在很大的安全问题。
  3.2 档案大数据的存储环境的安全问题
  档案大数据的存储过程中也会产生安全问题。首先,计算机的硬件或系统产生的故障会给档案数据带来安全问题。比如发生水灾、地震、火灾等灾害时,会造成硬件安全问题,从而导致档案数据的丢失或损坏。其次,档案管理软件或档案数据库也存在一些内部安全问题。另外,网络环境也会造成存储环境不安全,如计算机病毒、网络黑客等情况可能造成数据被恶意使用。在目前的共享开发的大数据背景下,想要完全保证存储环境安全难度较大,还需进一步努力。
  3.3 数据挖掘和数据分析过程中的安全问题
  在对档案大数据进行数据挖掘和数据分析的过程存在一定的安全风险。首先在数据挖掘和数据分析之前,传统的纸质档案要进行数字化,转化成数字化的档案。对纸质档案进行数字化的过程中会有一些安全影响因素,比如数字化后的档案数据是否有效、可用,是否和档案原件一致,这一环节一旦出现错误或疏漏,随后的数据挖掘和分析也会产生数据安全问题。此外,在对档案数据进行挖掘过程中,如何从海量数据中提取信息,并保持结果的真实准确,也是大数据背景下档案信息安全的一个难题。在档案数据分析的过程中,数据有泄露风险,且数据保密与开放之间的平衡关系难以维持。
  4 大数据背景下档案信息安全保障策略
  4. 1利用数据存储技术保障档案信息存储中的安全
  随着大数据技术的发展,档案的数据在原本的结构化的档案目录的基础上,还增加了许多非结构化的档案全文数据。在这种情况下,应建设档案大数据存储系统以存放和保存档案数据,使数字化的档案能保存下来并提供利用。而档案数据存储的关键是平台建设。数据存储技术首先涉及档案大数据平台建设中的信息安全。建設档案大数据平台之前应先对现有的档案资源进行整合,建立一个分布处理、集中管理的存储体系,该体系应以档案数据为中心。档案大数据存储平台应实现统一集中存储、具备高容量和高稳定性、应支持空间的灵活分配和配置。在此基础上,为了保障档案大数据的信息安全,就还要求大数据存储平台能有完善的权限控制规则和高度的安全性,具有可靠性和安全性。具体体现在以下几个方面:应提供全面的可视化服务,管理员可随时监管、分析基础设施中发生的所有事项;解决各种数据库之间的兼容问题,确保海量的档案数据可以存储;存储平台中应有快速识别威胁来源或突发事件的设施,并有相关的紧急预案,如远程或本地有备份或恢复解决方案。所以总的来说,为了确保档案信息安全,在原本的档案大数据存储平台的基础上还应特别完善权限控制、数据兼容、风险规避等环节。
  4.2 在运用数据挖掘技术的过程中保障档案信息安全
  除了数据存储技术以外,数据挖掘技术也是大数据技术的一个重要组成部分。数据挖掘指的是运用技术从数据集里识别出有用的、有效的信息,并最终将其转化成可理解的知识,该过程较复杂且也存在着档案信息安全的风险。在运用数据挖掘技术的过程中首先要保证档案信息不失真、保持档案信息的完整性。档案的本质属性是原始记录性,即使在大数据背景下,数字化的档案也应和传统档案一样具有原始记录性。在运用数据挖掘的过程中要保证数字档案是真实客观反映相关社会活动,记录不能被非法篡改,要保证档案信息的真实性。此外,在数据挖掘的过程中还要保证档案信息的完整性。只有保证档案信息的完整性才能使其客观真实地反应一定的社会活动,才能给利用者提供合理、客观的信息支持。所以在运用数据挖掘的过程中应把需要的部分信息放入整体档案中来对其进行分析,不能断章取义、避免太过局限。
  另外还要保证一般意义上的档案信息安全,也即避免档案信息数据的泄露,尤其是关于个人隐私的信息。运用挖掘分析技术讲所有数据录入资源库中后,最佳目的是为了有效利用这些信息,而不是流失或泄露。所以这是档案信息安全风险中的一个比较大的问题。比如用户在网上查档是留下的个人信息,对其进行数据挖掘后可以产生用于分析用户行为的新信息,但与此同时用户并不知道自己的个人信息已经被记录和挖掘。比如,当用户在浏览、查询或下载档案信息时所留下的痕迹,对其进行数据挖掘之后可以向用户推荐其可能感兴趣的信息。但在满足用户需求的同时,用户并不知道自己的数字活动正在被记录,因此这种动机良好的数据挖掘在某种程度上却也成了“监视”用户浏览习惯的手段,一旦出现用户信息泄露,后果和危害都会很大。对此可以用模糊处理的技术对用户数据进行处理,同时在利用用户数据的过程中也必须用数字化节制技术,不断更新和提升减灾能力,降低信息二次利用所造成的风险。其中数字化节制也就是面对信息数据丰富甚至过剩的时候,应有“信息驾驭力”,也就是“辨别、筛选、剔除”无效信息数据的能力。在进行数据挖掘的过程中,必须高度重视完善和创新档案数字化节制措施,必要时删除部分数据,以妥善处理“记忆”与“删除”这一档案数据的核心矛盾。
  4.3 在运用数据分析技术的过程中保障档案信息安全   数据分析技术也是比较重要的大数据技术。档案大数据分析就是指利用可视化技术,对档案相关的数据进行可视化分析,较为直观地展现出数据之间的关系,主要以分布式数据分析、非结构化数据处理为主。在运用数据分析技术的过程中一方面要对外包业务进行严格规范,考虑到大部分档案馆理部门的大数据技术都来自商业厂商,有不同的公司为档案大数据提供技术支援,所以业务外包是不可避免的。而对档案大数据的数据分析又涉及重要的档案信息,所以要避免外包商对数据的泄露或流失。应严格将业务外包法制化和标准化,确保合作机构的可信度;另一方面也要考虑保密与开放的平衡。数据分析技术必然会涉及大量档案数据的公开,因此不得不考虑档案数据是否涉及保密、是否适宜公开,应平衡保密与开放利用之间的关系。要对开放的在线档案数据进行定期审核,避免疏漏。此外还要在法律上明确档案开放的范围,严格按照法律标准开放利用档案数据。
  5 结束语
  在当前的大数据时代下,大数据对档案信息安全的影响与日俱增。保障档案信息安全是工作也并非是一朝一夕就能达成的,需要档案工作者不断坚持、不断优化管理方法,是一个逐步发现问题、解决问题的过程。本文的研究尚不够深入和全面,随着科学技术地进步和相关技术的发展,相关的研究成果也会不断修正,以更好地为档案工作服务。
  参考文献:
  [1]肖秋会,李珍.大数据环境下档案信息安全保障体系研究[J].中国档案,2018(04):76-79.
  [2]陶水龙.基于流程管理的电子档案安全策略的探讨[Jl-北京档案,2012(1):9-11.
  [3]陈慧.大数据时代档案信息安全价值实现策略研究[J].档案学研究,2018(06):35-37.
  [4]郝志琼.浅析档案管理信息化安全体系建设[J].档案与建设,2018(07):47-48.
  [5]肖秋会,伍黎丹.澳大利亚国家档案馆的数字连续性计划研究[J].信息资源管理学报,2015(4):19-23.
  [6]冯惠玲,加小双,数字转型背景下美国电子文件管理战略布局与行动探析[J].档案学通讯,2015(6):44-51.
  [7] Brain Kelly, Martin Hawksey,John 0'Brien.Twitter ArchivingUsing Twapper:Technical And Policy Challenges[Jl.7th Intema-tional Conference on Perservation of Digitial Objects,2010.
  [8] KofKorantengAdu, Luyande Dube, Emmanuel Adjei. Digitalpreservation: The conduitthrough which open data, electronicgovemment and the right to information are implemented[Jl.Li-brary Hi Tech,2016(34):733-737.
  [9] Juan Voutssas.Long-term digital information preservation:chal-lenges in Latin America[J].Aslib Proceedings,2012(64):83-96.
  [10]許敏,浅析电子时代的档案信息安全[Jl,档案天地,2019(01):41-42.
  [11]赵福荣.档案信息安全管理体系建设研究[J].浙江档案,2018(10):54-55.
  [12]王卫平.论大数据对档案工作的影响及其带来的挑战[J].档案现代化管理,2014(4):58-60.
  [13]王平,安亚翔.大数据时代的档案信息平台建设[Jl.档案与 建设,2015(10):8-13.
  [14]张文元,张倩.大数据技术与档案数据挖掘[J].档案管理,2016(02):33-35.
  [15]张倩.“大数据”技术在高校档案信息服务中的应用探索[J].档案与建设,2014(03):27-31.
  [16]张倩.档案大数据智能处理平台风险防范预案研究[J].档案与建设,2017(06):35-37.
  [17]潘建华.大数据背景下档案信息共享平台安全性研究[J].山西档案,2016(03):73-75.
  [18]黄忻,大数据背景下档案信息安全保障的SWOT分析[J].山西档案,2017(02):65-67.
  【通联编辑:朱宝贵】
  收稿日期:2019 -12 -15
  作者简介:诸悦(1996-),女,江苏镇江人,硕士在读,主要研究方向为图书情报。
转载注明来源:https://www.xzbu.com/8/view-15180511.htm