您好, 访客   登录/注册

大数据时代智慧档案信息服务平台数据安全风险及其对策

来源:用户上传      作者:卞咸杰

  摘 要:大数据时代,智慧档案信息服务平台具有完整性、保密性、可用性、不可否认性和可控性等基本属性。文章分析了智慧档案信息服务平台数据传输、数据采集、数据存储、数据应用等方面存在的安全风险,提出了平台数据传输采用HTTPS协议、平台数据采集论证采用Token机制、平台敏感数据采用加密处理、平台数据安全管理机制保障等应对举措。
  关键词:智慧档案;档案信息资源;信息服务平台;数据安全
  Abstract: In the era of big data, the intelligent archives information service platform has basic attributes such as integrity, confidentiality, availability, non-repudiation and controllability. This paper analyzes the security risks existing in the data transmission, data collection, data storage, data application and other aspects of the smart archives information service platform, and proposes some countermeasures such as HTTPS protocol for platform data transmission, Token mechanism for platform data collection and demonstration, encryption processing for sensitive data on the platform, and guarantee for platform data security management mechanism.
  Keywords: Smart archives; Archives information resources; Information service platform; Data security
  智慧n案信息服务平台的数据安全,是档案智慧化管理需要优先考虑的重要内容。在档案信息数据的利用过程中,收集、存储、共享、使用等过程面临的安全威胁始终存在,档案信息数据泄露与丢失会给档案管理者与档案信息服务平台用户带来巨大的损失。2001年,美国“9.11”事件造成世贸大厦轰然倒塌,位于其中的Bank New York在数月后因数据的丢失被迫破产清盘[1];2005年2月25日,美国银行丢失部分电脑档案,内含有数十名参议员和120万名政府雇员信用卡记录和其他个人资料[2];2019年2月,国内人脸识别公司深网视界由于其数据访问未做限制导致250万人数据、680万条记录被泄露,其中包括身份证信息、人脸识别图像及GPS位置记录等,[3]公民信息不受任何限制被所有人访问。数据安全问题一直是人们关注的重点之一,随着云计算和大数据技术落地,数据的安全问题再次被重视。
  1 智慧档案信息服务平台及数据安全的基本属性
  智慧档案信息服务平台是一种面向服务的体系框架,通过整套API接口,重构并统一了档案馆对各类档案信息资源管理的工作流程,以档案信息共享平台议代替分散的本地档案信息资源库,以saas的云服务方式进行系统部署,并通过前端系统构建简单直观的搜索界面,以方便用户快速发现所需资源。
  与传统的档案信息平台相比,智慧档案信息服务平台在诸多方面都表现出了新的特点,包括数据量级质的变化;数据来源从相对固定的入口向动态采集、实时存储转变,移动端的档案数据利用会更加常态化;档案实体资源与数字资源的集中建设与管理,档案管理高度自动化。以上变化对智慧档案信息服务平台数据的安全提出更高的要求,因为档案信息资源数据相较于其他领域的大数据,具有更强的真实性,其单位数据的价值密度更高,这必然会引起不法用户的额外关注,所以提出对智慧档案信息服务平台数据的安全性进行研究具有很大的必要性,只有确保档案信息数据的安全,平台才能实现其价值最大化[4]。
  1.1 完整性。智慧档案信息服务平台数据在生成、传输、交换、存储和处理等流程中要保持数据原样性,即保持数据的非篡改、非破坏和非丢失状态稳定,保持档案数据内、外部表示的一致性使档案数据在生命周期的每一个环节,都是真实的信息,传送过程中没有被非法用户添加、删除、替换等,能正确生成、存储、传输和使用,这是智慧档案信息服务平台数据最基本的安全特征。
  1.2 保密性。智慧档案信息服务平台数据对使用对象有更高的要求,必须经过授权才能够使用,即按给定要求授权个人、实体使用,杜绝有用数据外泄给非授权的个人或实体,保证有用数据只能被授权对象使用的特征。
  1.3 可用性。智慧档案信息服务平台数据能够被授权个人或实体正确访问,并按要求能正常使用或在非正常情况下能恢复使用的具体特征,即在系统运行时能正确存取所需数据,当系统遭受攻击或破坏时,能迅速恢复并能投入使用。可用性是衡量智慧档案信息服务平台面向用户的一种安全性能,使信息能够按照用户的要求被正常使用。保证档案数据随时为授权者提供服务,保证合法用户对档案数据的使用不会被不合理地拒绝。
  1.4 不可否认性。指通信双方在数据交互过程中,确信参与者本身,以及参与者所提供的数据的真实同一性,即所有参与各方都要为自己的信息行为负责,不可能否认或抵赖本人的真实身份,以及提供数据的原样性和完成的操作与承诺。
  1.5 可控性。指对流通在智慧档案信息服务平台中的数据传播及具体内容能够实现有效控制的特性,即智慧档案信息服务平台的任何数据要在一定传输范围和存放空间内可控。保证管理者根据社会管理的需要,能够对档案数据实施必要的控制管理,防止档案数据被非法使用。

nlc202302061948



  2 智慧档案信息服务平台面临的数据安全风险
  大数据时代的智慧档案信息服务平台对于数据安全的需求向多层次发展,将档案信息数据存储在智慧档案信息服务平台对数据安全的考验既是机遇也是挑战,[5]前期的基本需求包括档案的收、管、存、用全业务流程管理几个方面,档案信息数据利用过程中的安全处理是数据安全关注的重点,在人工智能运用到智慧档案信息服务平台之前,需要对智慧档案信息服务平台数据安全进行评估并发现潜在的威胁,数据的安全管理是一个相互依赖的过程。在档案信息资源数据利用的过程中,可能会发生数据丢失、泄露、被越权访问、被篡改问题,最严重的是涉及涉密档案被不合法利用。下面从数据传输、数据采集、数据存储、数据应用几个方面探讨具体的智慧档案信息服务平台数据安全问题及需求。
  人工智能时代的智慧档案信息服务平台在公共的互联网环境下会出现很多不确定性因素,随着智慧技术在档案平台中的参与程度越来越高,迫切需要制定数据安全管理战略。[6]一方面,档案信息资源运用人工智能技术后,档案信息的流程管理由传统的人工处理转变为智能化处理,智能化设备代替了部分人的工作,人工智能在处理档案信息的过程中通过使用机器学习处理安全大数据,攻击者也可利用相关技术生成大量错误情报以混淆判断。另一方面,S着智慧档案信息服务平台数据收集规模的不断扩大,基于云平台技术存储的档案信息资源数据量会越来越大,且平台还包括了大量的用户信息,一旦用户数据泄露,对智慧档案信息服务平台的运行平台的运行将是毁灭性的,黑客可以利用泄露的用户信息特别是超级管理员的账户信息控制平台的任何操作,数据安全影响的不仅仅是独立的档案管理部门,而是所有接入智慧档案信息服务平台的档案管理单位。
  2.1 智慧档案信息服务平台数据传输安全面临的风险。在智慧档案信息服务平台利用过程中,数据传输是必不可少的过程,数据保密需求是智慧档案信息服务平台最基本的需求,平台用户对于档案信息平台利用涉及的数据一般都需要经过加密传输以保证数据的安全。[7]实际的数据传输过程将面临传统互联网数据传输与移动互联网数据传输,在档案信息大数据传输处理环节,档案信息数据面临着非法使用以及被人为破坏的安全隐患,由于数据来源多样,即使不同平台的数据在传输之前能够做到各自脱敏处理,数据在最终处理时存在因关联分析而造成档案信息数据泄露的风险。档案信息数据在实际的传输中涉及的使用设备的安全问题,如档案信息数据传输相关的硬件设备中被病毒感染,很容易造成档案信息数据在传输过程中的泄露,一旦档案信息数据在传输流程中未被妥善处理,将会造成档案信息数据泄露的安全隐患[8]。因此,需要重视档案信息数据的在传输过程中的安全,如何处理好档案信息数据传输,在保证平台数据共享的同时保证涉密信息的保护,是平台数据安全面临的巨大挑战之一。
  2.2 智慧档案信息服务平台数据采集安全面临的风险。智慧档案信息服务平台数据来源众多,其汇集了不同档案管理部门,数据来源的途径也从传统的个人PC向移动客户端转变,系统投入应用后,档案信息数据增长速度快,档案信息数据采集安全是平台运行过程中最为关键的一步。档案信息在采集的过程中会面临数据被伪造的安全问题,如数据相关的信息,这将严重影响档案信息资源共享平台的公信力,错误的数据还会影响后继的数据分析,最终影响平台的决策判断能力。所以在实际的档案信息资源数据采集过程中,数据通过加密过程传递,以保护档案信息数据不受未经授权的用户的影响,[9]同时需要对采集到的信息进行去伪存真,提升识别虚假数据的能力,确保平台数据来源安全,是平台数据采集层面需要确保的。
  2.3 智慧档案信息服务平台数据存储安全面临的风险。智慧档案信息服务平台与传统的档案管理平台最大的区别在于其数据来源多样,这也注定了平台的数据量级会呈现爆发式增长,存储的档案信息类型也从传统的结构化数据类型转变成多种数据结构类型并存的数据形态,在此背景下,档案信息资源数据的存储安全就显得尤为重要,需要高起点设计档案信息数据安全存储防护措施,结合现代技术应用,实现共享平台集中处理业务数据的安全保护,具体到实际应用中,就是要保证档案信息数据在存储中心不被非法访问,通过档案信息资源数据整合,能够有效提高档案信息资源利用效率,[10]同时需要对涉密的档案信息进行必要的加密,以确保合法的用户访问对应权限的档案信息资源,并通过特定的解密措施才能读取对应密级的档案信息资源信息,档案信息数据存储层面的安全是确保档案平台正常运行的关键,一旦在该层面出现数据安全问题,导致的后果对于平台来说将是毁灭性的。
  2.4 智慧档案信息服务平台数据应用安全面临的风险。智慧档案信息服务平台最终投入使用后,将对普通用户开放档案信息资源服务的基本功能,同时将对档案管理部门开放平台数据管理功能,也就是平台实际上是处于不同类型的用户使用相同系统的状态中,平台用户情况复杂,这就要求平台在投入使用前要考虑好非法用户使用系统带来的数据安全隐患。平台应用层面如果安全方法过于复杂,往往需要更多的额外时间来处理档案信息资源数据,所以在智慧档案信息服务平台数据应用安全方面对平台的性能也是一大挑战。[11]平台在建设过程中,对于数据应用安全方面的建设需要满足平台用户使用过程能追踪,建立非法用户使用平台的拒绝机制,同时建立合法用户使用平台的权限分级机制并完善权限和组织管理,[12]确保平台数据被合法用户正确地利用。
  3 智慧档案信息服务平台面临的数据安全的应对举措
  平台的总体架构可以分为三层,即客户端层、应用层和数据库层。其中应用层还包括控制层、业务逻辑层和基础设施服务层;数据库层包括数据访问层和数据存储层。平台数据安全应对策略总体架构如图1所示:
  为了确保智慧档案信息服务平台的数据安全,结合人工智能应用相关流程的特点,通过相关技术手段确保平台在智能数据采集、传输、存储及实际应用中的安全,本节将通过技术手段解决平台在智慧档案信息服务数据安全问题,同时结合日常平台管理全方位阐述了平台数据安全应对策略。

nlc202302061948



  3.1 平台数据传输采用HTTPS协议。要完成闭环应用档案信息资源共享平台,档案信息的数据传输是最重要的中间环节,在实际的档案信息资源传输过程中,需要采用HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer),即超文本魇浒踩协议,传统的数据传输一般采用HTTP协议,平台利用协议以明文方式发送待传输的档案信息数据,不提供任何方式的数据加密,如果黑客截取了客户端和网站服务器之间的传输报文,就可以直接识别出传输中的档案信息,这对于具有涉密属性的档案信息数据是不能容忍的。采用HTTPS协议后,在传统的HTTP基础上加入了SSL(Secure Sockets Layer)协议,该协议可以保障档案信息数据在互联网上传输的安全,利用数据加密技术,可确保数据在网络上之传输过程中不会被截取及窃听。[13]采用HTTPS之后,平台的数据传输过程如图2所示:
  智慧档案信息服务平台在实际应用HTTPS的过程中,需要使用CA证书来完成身份的验证过程,目前可以从国内外的云服务商获取CA证书,像亚马孙AWS、微软Azure、阿里云等云服务供应商都提供了这项服务。
  3.2 平台数据采集论证采用Token机制。智慧档案信息服务平台面向的是有网络环境的用户,用户所处的环境可能是传统的PC,在该环境下用户可能使用web浏览器端登录系统,用户也可能在手机端(Android/iOS)登录系统,这就衍生出新的平台实现方式,即采用微服务的方式来实现档案信息资源数据的操作,当前平台数据存在最大的安全隐患是跨站请求伪造,不法用户通过非常规手段盗用合法用户身份,以合法用户的名义发送恶意请求。[14]跨站请求伪造之所以能够被非法用户利用,是因为平台数据操作请求所有的用户验证信息都是存在于Cookie 中,非法用户直接用的Cookie 中的信息来通过安全验证。如何保证在新的架构模式下档案信息数据操作安全,关键在于在数据操作请求中放入非法用户所不能伪造的信息,并且该信息不存在于Cookie 之中,可以在 HTTP 请求中以参数的形式加入一个随机产生的 Token,并在服务器端上面建立一个拦截器来验证这个 Token,如果请求中没有Token 或者Token 内容不正确,[15]则拒绝用户发送的数据操作请求。Token是在服务端产生的,如果前端使用用户名和密码向服务端发送请求认证,服务端认证成功,后继数据操作需要经过用户角色数据权限控制表,经过授权的操作则按照指令正常处理数据,否则直接拒绝数据操作,[16]服务端返回Token给前端。前端可以在每次请求的时候带上Token证明自己的合法地位。采用Token机制后档案信息资源数据的操作流程如图3所示。
  通过图3可见,采用Token机制后档案信息资源共享平台在数据操作安全上有了保障,所有的数据操作请求必须带上专用的Token信息,确保了每一条数据操作请求都是合法的。
  3.3 平台敏感数据采用加密处理。智慧档案信息服务平台的数据具有涉密数据,这就要求其信息存储需要采取特别的措施,用于档案信息数据保护安全的方法之一是通过使用一些加密技术将数据编码成其他人类无法理解的内容。[17]在保护涉密数据和信息方面,加密功能可以作为一道防线。传统的数据加密技术有DES(Data Encryption Standard,数据加密标准)、AES(Advanced Encryption Standard,高级加密标准)等对称加密手段,[18]该方式可以确保涉密信息的加密与解密速度,但在密钥管理上比较烦琐,对于面向用户的档案信息资源共享平台不适合。另外对于传统的RSA非对称加密手段,虽然密钥易于管理,但算法计算量太大,不适用于对不断增长的平台涉密信息进行加密与解密。平台数据加密确保数据安全的同时加重了去平台的计算开销,对平台的使用性能会产生一定的影响。在大数据时代,档案信息资源共享平台需求趋向于移动化,同时对于档案信息的检索也趋向于多样化,在此背景下,需要高效的加密与解密方案来实现高性能、低延迟的端到端和档案信息数据存储层加密与解密(非敏感数据可不加密,不影响性能),数据同态加密应运而生,该加密技术是基于数学难题的计算复杂性理论的密码学技术。对经过同态加密的档案信息数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的。[19]
  3.4 平台数据安全管理机制保障。数据安全管理需要技术与制度并重。首先是用户账户属性管理机制的完善,每个账户需要设定角色属性,对应的角色可以访问的功能页面设定好,同时平台数据操作需要设置账户操作属性,即账户需要关联到具体表数据增删改查功能权限,用户在实际的数据操作过程中完全按照预先设定的数据权限进行;其次是日志审计机制完善,在平台实际的使用过程中需要记录数据操作的用户名、IP地址、修改前数据、修改后数据等数据操作信息,以便于在实际的数据安全审计中便于日志管理和数据操作分析,及时发现平台中的数据安全隐患点,视不同严重程度采取补救措施,同时指导档案信息资源共享平台不再重复类似的数据安全问题;最后是档案信息数据冗余机制完善,在形成档案信息大数据应用后,用户特别是档案管理部门对平台依赖性会非常强,一旦因平台的软硬件问题导致整个系统崩溃将带来不可挽回的数据损失,这就要求做到冗余数据备份工作,做到提供实时的异地数据容灾功能,只有这样才能在主节点发生硬件故障或者某地发生自然灾害时,平台的数据服务不会受到影响。档案信息资源共享平台数据安全管理机制保障策略如图4所示。
  维护档案的完整与安全是档案工作的基本原则之一,保障智慧档案信息服务平台安全是档案数据安全的重要防线,应进行全过程控制。大数据时代,智慧档案信息服务平台数据安全管理贯穿于平台的立项、建设、开放和服务的全过程,是一个长期的系统工程。要消除平台数据的采集、传输、存储以及应用方面涉及的安全隐患,不仅要通过技术的手段加强防范,更要在制度上形成数据安全管理的闭环,确保智慧档案信息服务平台的安全稳定运行。

nlc202302061948



  本文系2017年国家社科基金年度项目“大数据时代智慧档案信息服务平台构建与创新研究”(项目批准号:17BTQ074)研究成果之一。
  参考文献:
  [1]数据丢失事件频发凸显灾难备份重要性[DB/OL].https://finance.eastmoney.com/a2/20130624300443972.html[2022-07-19].
  [2]美国银行遗失120万名政府雇员电脑档案数据资料[DB/OL].http://economy.enorth.com.cn/system/2005/02/28/000972443.shtml[2022-07-19].
  [3]魏薇,景慧昀,牛金行.人工智能数据安全风险及治理[J].中国信息安全,2020(03):82-85.
  [4]层次分析法在信息安全风险评估中的应用[DB/OL].http://www-wendangku-net.ssl-vpn.yctu.edu.cn:8118/doc/a17455456.html[2022-07-19].
  [5]Xuefeng Jiang;Zhengmin Wang;Huiliang Dong;Xuan Du/ Research on the Key Technology of the Cloud Platform Data Security/Proceedings of 2015 5th International Conference on Computer Sciences and Automation Engineering(ICCSAE 2015).
  [6]Jeong-Gi Lee;Sang-Hyun Lee/ Development of integration platforms for interworking of smart home devices for heterogeneous data security /nt.J.of Sensor Networks,2017.
  [7]Zhiqiang He;Nengneng Li;Xiwei Xu/ Data Security Scheme for a Trusted Third Party Platform Based on RSA One-time Key /IOP Conference Series:Earth and Environmental Science,2019.
  [8]Griffith Richard/ Electronic records,confidentiality and data security:the nurse's responsibility. /British journal of nursing(Mark Allen Publishing),2019.
  [9]Munwar Ali Zardari;Low Tang Jung/Data security rules/regulations based classification of file data using TsF-kNN algorithm/Cluster Computing,2016.
  [10]Yuqing Mo/A Data Security Storage Method for IoT Under Hadoop Cloud Computing Platform/International Journal of Wireless Information Networks,2019,Vol.26(03):,pp.152-157.
  [11]Claudio Copello;Ning Weng/Adaptive scheduling to enhance data securityand energy efficiency on energy harvesting platform/Microprocessors and Microsystems,2018.
  [12]KUN LIUPENG SUNKAIQI ZHAO/Design and Implementation of Mobile Data Security Service Platform Oriented to Specific Domains/Proceedings of the 2nd International Conference on Artificial Intelligence and Engineering Applications(AIEA 2017).
  [13]洛L.新奇的网络遗嘱[J].检察风云,2010(23):57-59.
  [14]郑新新.CSRF攻击与防御技术研究[D].北京:北京邮电大学,2016.
  [15]庞博.Web应用安全网关部分功能的设计与实现[D].北京:北京交通大学,2013.
  [16]Bo Yang/Analysis and Research on the Big Data Security Based on Cloud Platform/Proceedings of 2015 4th International Conference on Mechatronics,Materials,Chemistry and Computer Engineering(ICMMCCE 2015).
  [17]Dian Rachmawati;Amalia Amalia;Elviwani/Combination of Rivest-Shamir-Adleman Algorithm and End of File Method for Data Security/Journal of PHysics:Conference Series,2018.
  [18]焦铬.基于多混沌映射的图像数据安全与可靠性研究[D].衡阳:南华大学,2019.
  [19]李鉴,邵云峰,卢D,吴骏.联邦学习及其在电信行业的应用[J].信息通信技术与政策,2020(09):35-41.
  (作者单位:盐城师范学院 来稿日期:2022-08-20)

nlc202302061948




转载注明来源:https://www.xzbu.com/4/view-15444763.htm

相关文章