您好, 访客   登录/注册

电子文档防扩散模型研究

来源:用户上传      作者:

  摘 要:随着计算机应用的不断发展,越来越多的公司和个人采用计算机来存储数据资料。一些秘密的文档中包含的秘密信息一旦外泄,将会给企业和个人带来巨大的损失。因此,保护数据信息,防止秘密信息外泄便成为了人们研究的一个课题。目前人们主要采用加密技术来实现对文件信息的保护,但是该方法是在设备的物理安全的前提下进行的。如果设备的存在物理安全漏洞,那么非法用户可以绕过一些秘密认证的过程直接从硬盘中获取数据,从而窃取秘密数据。本问探讨了一种新的文件安全存储模型,该方法在物理设备不安全的情况下,保护文件中的信息不被外泄。
  关键词:分割存储 防扩散 文件保护
  中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2011)04(b)-0018-01
  
  计算机中的数据经常都面临着外泄的危险,计算机或者存储介质在维修和报废的过程中也很容易泄露数据。2007年9月,《泰晤士报》报道,英国EDS公司丢失了一块硬盘,硬盘上有监狱工作人员的资料,造成了数百万英镑的损失,同时监狱工作人员被迫调换工作地点,全家搬迁[1];2008年香港汇丰银行电脑被盗给银行带来了巨大的损失;2007年低电脑在返修时数据外泄导致了艳照门事件。
  数据安全主要分为软安全和硬安全两个层面,软安全指针对软件的安全保护,硬安全也称为物理安全指针对硬件的安全。对于个人用户来说,基本都是软安全的层面上来保护个人文件的安全而很少考虑硬安全,如果个人计算机被非法使用,那么计算机中的所有秘密数据都可能被窃取;对于公司来讲,虽然核心的服务器考虑了软安全和硬安全,但是员工的办公电脑基本却很少考虑物理安全,为了工作的需要,员工的办公电脑可能存放有公司的一些秘密文件,如果电脑被盗,或者员工离职那么这些秘密文件就有可能被泄露出去,从而对公司造成损失。分割存储算法可以在电脑物理不安全的环境中,保护文件中的信息不被窃取和外泄。
  
  1 分割存储防扩散思想
  在分割存储模型中,秘密文件被分割成大小不同的两块。一块数据存放在本地硬盘中;另一块数据存储在安全储设备中,该安全存储设备应处于安全的物理环境中,不易被他人非法窃取。浏览文件时,安全进程从不同的设备读取文件分块,组合后显示。如果个人计算机因为物理安全被盗,非法用户无法得到文件的全部数据。对于个人用户,可以选择移动存储设备作为安全存储设备,当用户离开电脑时,只要带走移动存储设备,保证该设备的物理安全,信息就不会泄露;对于公司,可以选择服务器作为安全存储设备,安全数据块存放到公司的内部服务器中。如果员工使用的电脑被盗或者员工离职,计算机因为无法连接到安全服务器,读取不到另一块数据,其硬盘中的秘密文件便无法完整的显示。这样可以有效的防止企业秘密外泄和扩散,可以将文件的有效范围限制在安全服务器可达的范围内。该算法的关键技术是选择和是的分割算法,使得分割后的数据块尽量的离散,分割后的数据分块都足够的杂乱,不能从中获取原文件中包含的信息。
  
  2 算法描述
  任何的文件都可以表示成一组有序的数据序列:
  D={a1,a2,a3,a4......am}
  分割算法就是按照一定的粒度,将D分割成若干个小的序列:
  {s(1),s(2),s(3)...s(x)}=D。
  将分割后的分块,分割成两组,此处采用奇偶割法,下标是偶数的划分成一组,将下标为奇数的划分成另外一组。
  G1 + G2 = D (1)
  G1={s(1),s(3),s(5)....s(2n +1)} (2)
  G2={s(2),s(4),s(6)....s(2n)} (3)
  其中:
  n=(1,2,3,4....x/2);G1是数据分块;G2是安全分块;
  x是有序集合D以m/x为单位划分的数据块的数目;
  s是以某种粒度划分后的数据分块的集合。
  保存文件时,将数据块分别保存到不同的物理介质中,数据块G1保存在计算机的磁盘中,数据块G2存放到安全存储设备中。
  
  3 算法优化
  由于在分割存储算法需要进行大量的分割/组合的操作。划分的粒度越小,分割/组合次数便会越多,这样会大大增加系统的负担。另外传统的分割方法是一种等量的分割方法,数据分块和安全分块大小基本相同,这就要求安全存储设备有足够大的存储空间,对安全存储设备有较高的要求,也不便于使用小空间对大量文件进行监控。采用Huffman截取算法就可以弥补以上的不足,Huffman截取算法只需要进行一次截取操作即可完成分割操作。该算法不但可以实现非对称分割,而且还能够对数据块进行加密,可以更好的保护信息的安全。其工作的原理可以描述为:
  Huf f man(D(x)) → G{key, data}
  式中:
  D(x)是文档的原始数据;
  key是经Huf f man编码后的码表;
  data是使用key码表处理后得到的数据。
  数据经过Huffman函数处理后,得到了部分数据,一部分是码表key,另一部分是编码后的数据data。保存时可以将key保存到安全存储设备中,data存放到本地硬盘。这样就可以实现对与文件的非对称分割,同时硬盘中的数据又被加密,可以更好的实现监控。笔者对多篇中文文档进行测试,发现码表的大小一般约为编码原文件的20%。也意味着可以使用20%的数据对元文件进行监控,也可以使用高频的码字来作为安全数据块,这样可以进一步减少安全数据块的体积。
  
  4 结语
  分割存储算法将数据存储在不同的物理介质中,提高了信息的安全性,即使在部分设备不安全的情况下,也可以有效的保护数据中的信息不被被非法窃取和扩散。尤其适合对对个人秘密文件进行保护。也可以在公司或者企业中使用,采用内部网络服务器作为安全存储设备,用来保护公司或者企业的秘密信息,可以有效的将公司或者企业的秘密信息严格的控制在服务器可达的范围内,阻止其扩散和非法传播。
  
  参考文献
  [1] 陈尚义.磁盘数据泄密威胁分析和销毁方法[J].信息安全与通信保密,2010.
  [2] 刘茂长.电子商务技术扩散系统和扩散过程模型研究[J].中国科技论坛,2010.
  [3] 张效强.基于加密算法的数据安全传输研究与应用[J].计算机与数学工程,2008.

转载注明来源:https://www.xzbu.com/8/view-9082804.htm