您好, 访客   登录/注册

数字档案馆数据备份策略小议

来源:用户上传      作者: 段毅华

  为适应信息化建设需要,解决档案管理业务建设中存在的普遍问题,中原油田档案馆于2009年设计开发了中原油田数字档案馆系统。项目完成后,油田及所属二级单位将在同一平台上进行全部档案资料的接收、管理、保存和提供利用,并对档案信息资源的采集、存储和利用等全过程实施管理,是数字油田信息资源的重要组成部分,最终,将建成一个集档案、情报、信息等数据资源于一体的知识管理系统。
  1 数据备份方式
  从数据备份方式来说,主要有映像备份与逐文件备份两种方式。
  通过进入文件系统,阅读文件结构,以及从一个介质到另一个介质复制文件,从而生成新文件结构。它可针对单独文件生成备份。逐文件备份比映像备份安全,因为整个文件结构都复制了。因而允许信息迁移入不同的格式或设备类型。逐文件备份还允许用户恢复个别文件或执行部分备份。在存在变化而信息无法恢复至同类介质的情况下,逐文件备份更安全。
  当需要恢复单独文件和针对大型文件,如数据库文件时,建议使用逐文件备份。
  2 数据备份策略
  完全备份就是拷贝给定计算机或文件系统上的所有文件,而不管它是否被改变。增量备份就是只备份在上一次备份后增加、改动的部分数据。增量备份可分为多级,每一次增量都源自上一次备份后的改动部分。差异备份就是只备份在上一次完全备份后有变化的部分数据。如果只存在两次备份,则增量备份和差异备份内容一样。一般在使用过程中,这三种策略常结合使用,常用方法有:完全备份、完全备份加增量备份、完全备份加差异备份、完全备份加累加备份。
  完全备份产生大量数据移动,选择每天完全备份的客户经常直接把磁带介质连接到每台计算机上(避免通过网络传输数据)。因人为干预(放置磁带或填充自动装载设备),磁带驱动器很少成为自动系统的一部分。结果是较差的经济效益和较高的人力花费。
  完全备份加增量备份源自完全备份,不过减少了数据移动,其思想是较少使用完全备份。比如,在周六晚上进行完全备份(此时对网络和系统的使用最小)。在其他 6 天(周日到周五)则进行增量备份。增量备份会问这样的问题:自昨天以来,哪些文件发生了变化?这些发生变化的文件将存储在当天的增量备份磁带上。使用周日到周五的增量备份能保证只移动那些在最近24小时内改变了的文件,而不是所有文件。由于只有较少的数据移动和存储,增量备份减少了对磁带介质的需求。对客户来讲,则可在一个自动系统中应用更加集中的磁带库,以便允许多个客户机共享昂贵的资源。但当恢复数据时,困难产生了。
  在“完全 + 增量”方法下,完整的恢复过程首先需要恢复上周六晚的完全备份。然后,再覆盖自完全备份以来每天的增量备份。该过程最坏的情况是要设置 7 个磁带集(每天一个)。如果文件每天都改的话,需要恢复 7 次才能得到最新状态。由于“完全 + 增量”方法中恢复很困难,后来有了“完全 + 差异”方法。差异成为备份过程考虑的问题。增量备份考虑:自昨天以来哪些文件改变了?而差异方法考虑:自完全备份以来哪些文件发生了变化?对于完全备份后立即的备份过程(本例中周六),因为完全备份就在昨天,所以,这两个问题的答案是相同的。但到了周一,答案不一样了。增量方法会问:昨天以来哪些文件改变了?并备份 24 小时内改变了的文件。差异方法问:完全备份以来,哪些文件改变了?然后,备份 48 小时内改变了的文件。到了周二,差异备份方法备份 72 小时内改变了的文件。
  尽管,差异备份比增量备份移动和存储更多的数据,但恢复操作简单多了。在“完全 + 差异”方法下,完整的恢复操作首先恢复上周六晚的完全备份。然后,差异方法不是覆盖每个增量备份磁带,而是直接跳向最近的磁带,覆盖积累的改变。
  我们可以根据系统管理方式在“完全备份”、“完全 + 增量备份”和“完全 + 差异备份”间权衡。可以根据系统数据量的变化,在管理时混合和匹配这三种方法,达到期望的可重获性水平。
  (作者单位:中原油田档案馆 来稿日期:2012-02-14)
转载注明来源:https://www.xzbu.com/4/view-3408036.htm