您好, 访客   登录/注册

数字档案信息系统检索效率研究

来源:用户上传      作者:

  摘 要:本文从提升数字档案信息系统的服务能力,体现其建设与应用价值的角度,提出对数字档案信息系统检索效率的基本要求与评价指标,探讨分析目前存在的问题以及影响因素,探究提高数字档案信息系统检索效率的有效途径。
  关键词:数字档案信息系统 检索效率 检索工具 检索功能
  在当前信息化建设大环境下,越来越多的企业、部门建立了数字档案信息系统,成为当前最主要的档案信息服务方式,如数字档案馆、数字档案资源管理平台等。如何更好的体现建设与应用价值是这种新型的档案管理模式所面临的重要问题。要把工作重心从前期的“建馆”向后期的“利用”转移,重点放在盘活档案库藏资源,实现资源共享与网络化服务上,即强化系统核心功能――数字档案信息检索的建设。数字档案信息系统检索效率是指系统实施识别和查找过程的效率,它是评价整个数字档案信息系统建设与服务应用水平的重要指标,有必要对其进行研究与探讨。
  一、数字档案信息系统检索效率基本要求
  开发建设数字档案信息系统是要将档案以数字化的形式进行保存、传承与开发利用,对系统检索效率的基本要求就是要以用户需求为中心,最大限度满足用户对档案的查询,从而大大提高档案信息资源共享和开发利用效率。
  二、数字档案信息系统检索效率的评价指标
  对数字档案信息系统检索效率的评价指标应从检索速度与检索深度两个方面体现:
  1.衡量数字档案信息系统检索速度的评价指标
  检索耗时:是指检索出的档案相关信息量所花费的时间。
  检索速度:是指检索出的档案相关信息量除以检索耗时。
  2.衡量数字档案信息系统检索深度的评价指标
  检索深度体现的是检索精度的特性,要求检索结果全面准确、实用有效,是检索质量的保证。其评价指标如下:
  查全率:是指检索出的档案相关信息量与系统中的相关信息总量的百分比。
  漏检率与查全率互补:漏检率=1-查全率
  查准率:是指检索出的档案相关信息量与检索出的信息总量的百分比。
  误检率与查准率互补:误检率=1-查准率
  三、数字档案信息系统检索存在的问题
  由于档案文件之间存在的有机联系和档案组织方式的层级特征,档案信息检索的实现更为复杂,当前部分数字档案信息系统检索效率不高,直接影响了用户应用系统查阅档案的积极性,客观表现出以下问题:
  1.档案信息检索不方便
  检索过程不直观、快捷,用户不能及时得到所需信息。
  2.档案信息检索不全面
  需要的信息缺失,重要的信息没有。
  3.档案信息检索不准确
  检索出的信息偏差大,关键信息少,没用信息多。
  四、影响数字档案信息系统检索效率的主要因素
  针对实际存在的问题,应从软、硬件两方面剖析影响因素,在档案信息资源管理与计算机软件工程等方面进行分析,寻找解决对策。
  1.从数字档案信息资源建设角度分析
  1.1数字档案信息资源建设较分散。档案信息的检索首先是档案信息的序化、组织与存储,如果档案著录、编目不充分、不深入,就会使海量的档案信息无法进行有效的利用。
  1.2数字档案信息资源范围受限。限于一馆、一局域网的档案信息检索利用需求降低,数字档案信息化建设应用价值降低。
  1.3数字档案信息资源形式欠完备。数字档案信息资源应建立健全包含文本、图像、音频与视频档案等多种多样的资源形式,不断建设丰富、完备、优质的档案数据库,档案信息检索才会越全面、越准确。
  2.从数字档案信息系统检索功能角度分析
  2.1检索工具不健全。检索工具没有详细描述档案文件的内容特征与外部特征,大多适应于手检。如只采用目录检索工具,没有建立健全以全部文本信息作为检索对象的全文检索工具。
  2.2检索服务方式不灵活。如通过互联网的网络档案信息检索空缺。
  2.3检索功能有待改进。当前仅基于文本档案的检索技术已无法满足用户的需求,基于内容的信息检索技术得到了迅速的发展和应用,如语义分析基础上的智能检索。
  五、提高数字档案信息系统检索效率的途径
  做好信息网络技术与档案管理工作的不断融合,从数字档案信息系统资源、技术、应用、管理等要素方面多管齐下,才是提高检索效率的长效机制。
  1.做好档案资源基础整理工作
  重新对档案资源进行标准化与规范化整理必不可少。开展档案著录基础工作,注重自身行业特点与数字档案信息系统的要求,重新制定出适合本馆、本行业的著录细则,指导具体操作。
  2.建设丰富的数字档案资源数据库
  丰富的馆藏资源数据库是利用的根基。加快电子文件归档规范化建设,提高档案双轨制管理效率。
  3.建立健全数字档案信息系统检索工具
  目前,数字档案信息系统主要建立以下四种检索工具:
  3.1目录检索工具。指以一个档案馆或档案室为基本著录单位,将一批相关档案的著录条目,按照一定次序编排而成的检索工具。如卷内文件目录、案卷目录、全宗目录、全引目录、分类目录、主题目录、专题目录等。
  3.2题录检索工具。是将档案中的各种名称按一定的排检方式编排而成的检索工具,是保证检索查准率的关键工具之一。要统一规范档号、存放位置等题录内容,补全题名、责任者、日期等要素,对责任者、机构简称等名称记录一致,避免识别不清的情况,增加误检率。
  3.3文摘检索工具。能更为详细的揭示档案文件内容的检索工具,对重要档案、超文本档案建立文摘检索工具,将更方便查阅。如针对科研档案进行的“成果简介”,体现重要科研成果,能有效提高检索效率。
  4.加大投入不断完备数字档案信息系统检索功能
  4.1应用先进复杂的组合检索技术。信息检索技术决定了查询效率,对于数字档案信息资源系统检索功能,不仅要支持一般的全文检索,而且支持组配检索、ANT检索、布尔逻辑检索、二次检索等多种复杂检索方式,以及突出对非结构化数据内容的检索,从而提高检索效率。如北京市数字档案馆使用的iBASE数据库智能全文检索引擎,“支持如基于自然语言的全文检索、字段限定检索、布尔检索、前方一致检索、相邻检索、基于内容的全文检索以及后控词表检索等”,“对数以百万份档案的检索速度仅在1秒钟范围内” ,很好地满足了用户对海量数据检索效率的要求。
  4.2提供网络档案信息检索功能。档案网站是数字档案信息系统服务用户的重要窗口,建设多层次、多类型的档案信息服务网络,形成网站群,提供搜索引擎或针对多级用户的普通检索与高级检索功能。
  4.3提供基于知识服务的信息检索。目前,随着知识处理技术的发展,信息检索由基于关键词的检索逐步转向针对内容的基于知识的信息检索,即从语义和概念出发,自动分析信息资源,查找和发现相关知识单元,使信息检索更贴近用户需求。如提供公文、合同、学术等档案主题进行检索,能提高检索速度,减少检索耗时。
  4.4提供增值检索服务。世界最大、最著名联机情报检索系统DIALOG联机检索系统提供了各类型信息检索、定题服务、原文订购、知识索引、跨文档检索等强大的检索功能。作为企业、部门,可转变档案管理思路,建设共享的档案信息联机检索系统,提供增值检索服务,根据用户的要求,进行有针对性的开放档案与行政规范性文件服务,帮助提供档案信息,协助用户提高检索效率。
  总之,数字档案信息系统不仅是采用数字形式存储档案,而是要实现档案资源共享,才是系统建设的最终目标。档案的价值最终体现在“用”上,向用户提供档案资源,方便查询,保证系统检索效率,是数字档案信息系统建设不懈努力的方向。
  参考文献:
  [1]王芳,数字档案馆学
  [2]王兰成,曾琼,基于本体的知识检索模型及呈现技术研究,图书情报工作
转载注明来源:https://www.xzbu.com/2/view-12719286.htm