您好, 访客   登录/注册

电子文件迁移问题探析

来源:用户上传      作者:

  摘要:伴随着时代的飞速发展,不断有新科学技术在档案工作中被广泛采用,传统的档案管理模式也逐渐改变,更加开放、数字化、网络化的档案馆是未来的一个发展方向。与此同时,技术的持续发展与频繁更新使得数字档案信息呈现出多样化和复杂化的趋势,如何保障这些信息的安全存储和有效利用已成为各级档案馆必须面临和巫待解决的重要问题。在这种形势下,电子文件迁移成为了保障数字档案信息安全必不可少的重要手段。就如何确定迁移的时机,在何种前提下进行迁移,以及采取什么样的工作流程实施迁移展开分析,从而在保持电子文件的真实性、完整性和有效性的基础上引导档案管理者顺利的开展迁移工作。
  关键词:电子文件 有效利用 迁移
  大规模的电子文件信息存贮和存取的新技术在不断翻新,而电子文件长期保存的技术和方法却远远落后,因此为防止因技术过时和载体老化导致信息资源的被动消失,实现电子文件长期有效可用,迁移是最好的方法。迁移是把数据从一个信息系统或存储介质移到另一个信息系统或介质的过程。它是一种随着技术变化而定期改变数字档案信息格式的处理过程。但是,每迁移一次就意味着源文件会丢失部分信息,在保真原则的前提下应尽量减少迁移的次数,非必要则不迁移。
  一、电子文件迁移的必要前提
  电子文件的迁移不是盲目进行的,只有在以下四种情况下才有必要实施:
  (一)电子文件的源技术环境出现问题或即将灭失
  源技术环境出现问题包含两个方面:一是源技术不开放或有限开放。电子文件的非人工识读性决定了其保存始终与某种技术环境相对应,当电子文件处于技术不开放或有限开放的软、硬平台环境下时,应迁移到没有专利和许可限制,技术开放环境下的软、硬平台之上。二是技术过时。采用过时技术形成的电子文件,应及时迁移到先进稳定的主流技术平台上。一旦文件的源技术环境或再生技术环境为新的技术所替代,管理部门就必须测试新技术环境对该电子文件的兼容性,检查在新环境下识读文件有无明显的内容、功能上的失真或缺失。一旦出现问题,就应立即启动迁移论证程序。
  (二)现有文件格式或载体形式不符合归档要求
  归档电子文件应采用通用的文件格式,专有格式的文件在归档时应尽可能转换为通用、标准格式,并存储于符合规范的载体。这是由于专有格式对软件依赖性强,一旦脱离原有技术环境就无法识读,这与文件被破坏所造成的影响并无差异。
  (三)载体稳定性或技术状态缺陷影响到其有效识读
  电子文件载体的物理寿命和技术寿命相对较短,如移动硬盘的物理寿命为5年,光盘为10年,磁带为25年。保存过程中常常因频繁使用及外界环境的作用而磨损、老化,或因记录技术的落伍而导致信息丢失、读出错误或数据导出困难。在出现这类情况之前,应及时将电子文件数据迁移到新的数字载体。
  (四)现有文件在其导入环境中无法有效发挥功能
  不同应用系统采用的数据模型、生成电子文件的格式、编码压缩方法、设置的技术参数不尽相同,电子文件在流转和利用过程中可能需要导入不同的应用系统,如果新系统对导入的电子文件不相兼容,导致无法有效识读,就需要对源文件进行迁移,使其适用于新环境。
  二、电子文件迁移的时机确定
  何时进行信息迁移是迁移工作的难点和核心问题。上面我们已经给出了触发信息迁移的必要条件,只有达到以上4个条件之一我们才需实施迁移。由于技术的更新不以任何人的意志为转移,不受任何条条框框的限制,没有时间规定,不会给人们任何心理准备。迁移过晚难度会很大,信息损失的风险增大,有时会无法读出。迁移过早又会加快信息迁移的频率,人为地加大了工作量。所以信息迁移的方案或规定不能一成不变,管理者必须随时了解电子信息技术的发展水平,定期对技术环境更新情况、载体的有效性进行检查和评估,以期跟上技术的发展。
  (一)及时掌握技术环境变化
  管理者应每年对各类电子文件的应用软件、系统平台、处理设备等技术环境的更新情况进行核实、分析。当对应的技术环境出现升级或明显变化时,必须对电子文件在新技术环境中的有效性进行检测,以评估电子文件对新技术环境的兼容性,确定格式迁移的必要性。电子文件在新技术环境中的有效性检测,需要将电子文件在新系统中打开,如果文件在新环境中出现无法识读、内容缺失、信息失真或部分功能丢失等现象,且出现这种现象的文件占抽样检测文件的5%以上,则认定这类电子文件对新技术环境不相兼容,必须在原技术环境即将灭失前适时进行格式迁移。有效性测试采取抽样检验方式,并应满足以下要求:(1)环境发生变化的各类电子文件均应列入抽样检验范围;(2)抽样检测的内容包括电子文件在新技术环境中的阅读、处理、检索等所有功能点;(3)各类电子文件抽样检测的比率不低于3%。
  (二)定期检验载体的有效性
  除了对新技术环境的兼容性进行有效性检查外,还需适时对电子文件载体进行检测,评估电子文件载体迁移的必要性。硬磁盘根据使用情况和应用环境来确定检测频率,一般每季度检测一次。检查内容包括各种编码的写入、读出与校核,寻道正确性等,检测标准参照GB/T12628-2008。磁盘阵列不需要人为检测,当系统自动报警时,应及时迁移。磁带每2年进行机读检验,发现问题或保存满4年,即行迁移。光盘每满4年进行一次可读性检验。如果上述载体的可读性检验出现无法识读、信息失真等问题,则认定为这类电子文件载体已经失效,必须立即进行载体迁移,并通过原载体文件的备份文件,或通过对原载体数据的抢救性恢复复原失效载体上的文件信息,将其安全迁移到新的载体上。
  三、电子文件迁移工作的基本流程
  电子文件的迁移大致可以分为六个步骤:制定迁移策略,开展风险测评,迁移准备,迁移实施,迁移校验,源文件处理。
  (一)制订迁移策略
  迁移策略是指根据条件,确定迁移目标,选择迁移方法,设计迁移程序,并根据测试结果,制定切实可行的迁移方案与流程。目前常见的迁移策略有一次迁移,分次迁移和定期迁移。   1.一次迁移
  一次迁移是通过电子文件迁移工具或迁移程序,将需要的历史电子文件一次性全部迁移到新系统中。一次迁移的优点是迁移实施的过程短,相对分次迁移,迁移时涉及的问题少,风险相对比较低。其缺点是工作强度比较大,由于实施迁移的人员需要一直监控迁移的过程,如果迁移所需的时间比较长,工作人员会很疲劳。一次迁移的前提是新旧系统电子文件库差异不大,在允许的时间内可以完成所有电子文件量的迁移。被动迁移必须采用一次迁移。
  2.二次迁移
  分次迁移是通过电子文件迁移工具或迁移程序,将需要的历史电子文件分几次迁移到新系统中。分次迁移优点在于可以将任务分解,这样有效地解决了电子文件量大的问题。但是分次切换导致电子文件多次合并,增加了出错的概率,同时为了保持整体电子文件的一致性,分次迁移时需要对先切换的电子文件进行同步,增加了迁移的复杂度。分次迁移的顺序按照电子档案的利用频率由低到高,一般在系统切换前先迁移静态电子文件和变化不频繁的电子文件,例如代码、用户信息等,然后在系统切换时迁移动态电子文件,例如交易信息。对于静态电子文件迁移之后发生的电子文件变更,可以每天同步到新系统中,也可以在系统切换时通过增量的方式一次同步到新系统中。
  3.定期迁移
  定期迁移是通过相关制度要求,有规律地、持续地将需要的历史电子文件定期迁移到新系统中。定期迁移能够有效规避系统升级和技术过时所带来的风险,并且无需忧虑载体的老旧和无法读取。但是在技术环境仍然符合人们日常工作要求,载体存储容量也远远能满足目前存储要求的情况下,定期迁移就毫无意义。定期迁移比较适用于档案馆对电子档案或纸质档案数字化的接收。
  (二)开展风险测评
  无论是主动迁移,还是被动迁移,从实现过程或技术角度来看,都存在着一定的风险。对电子文件迁移可能出现的风险,要根据具体情况进行后果预测,并把预测结果直接用于迁移方案的制定。对复杂的电子文件应慎重对待,只有在技术条件允许的情况下,才可进行迁移。出现风险的可能因素有:迁移时间点选择不当;迁移的存储环境、应用技术和格式的选择不当;对于新旧系统的熟悉和掌握程度不够;选择或自行开发的迁移工具存在问题或不适用;选择或自行开发的迁移检测程序存在问题或不适用;迁移方案不当;迁移流程不合理;管理不严格等。
  (三)迁移准备
  由于电子文件迁移的特点,大量的工作都需要在准备阶段完成,充分而周到的准备工作是完成电子文件迁移的主要基础。具体而言包括以下几点,(1)要进行源系统电子文件的清理,包括需迁移电子文件的种类、数量、形成时间的跨度、质量等。(2)建立新旧系统电子文件库的电子文件字典,对旧系统的历史电子文件进行质量分析、结构差异分析和代码差异分析。(3)建立新老系统电子文件库表的映射关系,对无法映射的字段制定处理方法,开发工具,编写电子文件转换的测试计划和校验程序,对于数据量大、种类繁多或技术复杂的电子文件,应进行少量电子文件的迁移测试,统计、分析出现的问题,及时调整迁移方案。(4)制定电子文件转换的应急措施,确保一旦迁移失败,被迁移数据可以迅速恢复。
  (四)迁移实施
  电子文件迁移的实施是实现电子文件迁移的最重要的环节。它要求迁移程序必须经检测才可投入使用,对即将开始迁移的电子文件,必须结束共享、利用等业务流程。在迁移执行过程中,电子文件从源地址迁移到目标地址,无论在何种情况下,都应可以随时停止,并能够实现完全恢复。迁移完成后,应立即着手对迁移后电子文件进行备份,并要形成迁移记录,以备查考。
  (五)迁移校验
  电子文件迁移后的校验是对迁移工作的检查,电子文件校验的结果是判断新系统能否正式启用的重要依据。可以采取编写程序自动校验和手工校验相结合的方法。迁移后的电子文件必须在新系统平台上运行,检验其对各项操作特别是检索、统计、报表等功能有效性。对迁移前后电子文件的检查主要包括:(1)迁移前后电子文件数量;(2)迁移前后电子文件所占载体空间;(3)迁移前后电子文件可视内容的一致性;(4)迁移前后电子文件元数据的对照。
  其中最重要的校验内容是:完整性检查和一致性检查。保证电子文件在迁移过程中信息没有丢失,尽量减小信息质量的损失是迁移方案的基础。
  (六)源文件的处理
  迁移完成之后,迁移前的电子文件或源系统仍需保存,直到迁移后的电子档案在目的系统正常运行一年后,迁移前的电子文件和源系统才可进行销毁。销毁原文件载体时应进行审核,由专门人员进行并同时登记造册,以备查考。
  当电子文件的源技术环境或载体出现问题或不符合归档要求时,管理者就必须对电子文件进行迁移。迁移决不能盲目为之,必须准确把握迁移时机,按照一定的原则、方法与步骤,选择合适的工具来实施,才能保质、高效的完成迁移任务,实现电子文件的长期保存。电子文件的迁移是档案管理的必经阶段。技术总有过时的一天,电子载体的寿命也远低于纸张材料,管理者必须时刻注意技术环境的变化和载体的可读性,在技术环境即将灭失或载体出现问题之前适需、适时的进行格式迁移或载体迁移。
  参考文献:
  [1]张作宁,缪冬青.论档案管理中数据迁移技术[J].城建档案,2008(6):60.
  [2]亢明宇.数字声像档案迁移风险的研究[J].消费导刊,2010(10):131-132.
  [3]张美芳.电子文件迁移措施的研究[J].档案学通讯,2009(1):68-71.
  [4]更新与迁移中的风险管理策略[J].北京档案,2007(10):38.
  [5]刘家真.PDF格式文献的迁移[J].档案管理,2010(3):44.
  [6]李永良.数据迁移:在新旧系统中切换[J].中国计算机用户,2011(9):45-46.
  [7]王婧韫.数据迁移的一般原则[J].电脑开发与应用,2008(4):31-33.
  [8]黄玉明.电子文件格式困局破解之道[J].中国档案,2010(7):56-58.
  [9]黄玉明.电子文件存档格式需求分析与战略研究[J].档案学通讯,2010(2):63-66.
  [10]杨冬松.Word中批量转换文档格式[J].聪明用电脑.2011(1):51.
转载注明来源:https://www.xzbu.com/2/view-11787848.htm