您好, 访客   登录/注册

数字人文时代图书馆古籍文献资源的数字化长期保存机制探讨

来源:用户上传      作者:

  摘要:数字人文改变了现代科研面貌,为古籍文献的深层次开发提供了新思路。文章从古籍文献保存的客观要求、深层次开发古籍文献的需求及传承中华优秀传统文化的需求等方面,介绍了数字人文时代古籍文献数字化建设的意义;分析了图书馆常用的文本挖掘、地理信息系统及知识发现等古籍文献资源数字化建设的常用技术;研究了图书馆古籍文献专题数据库的构建技术及规范;着重从建立统一的古籍长期保存标准、人才培养机制、数字化共享等方面,提出建立图书馆古籍文献长期保存机制的策略。
  关键词:数字人文;古籍文献;数字化;保存;图书馆
  DOI: 10.3969/j.issn.2095-5707.2019.03.002
  中图分类号:G255.1;G258.2    文献标识码:A    文章编号:2095-5707(2019)03-0006-04
  Abstract: Digital humanities has changed the face of modern scientific research and provided new ideas for the deep development of ancient literature. This article introduced the significance of digitalization construction of ancient literature under the digital humanities era from the aspects of objective requirements for preservation of ancient literature, the need for deep development of ancient literature, and the need for inheriting excellent traditional Chinese culture. It also analyzed the common digitalization construction technology of ancient literature resources, such as text mining, geographic information system and knowledge discovery, which are commonly used in libraries, studied the ancient literature in libraries, and finally, put forward the establishment of the long-term preservation mechanism of ancient literature in libraries from the perspectives of long-term preservation standards, personnel training mechanism and digital sharing.
  Key words: digital humanities; ancient literature; digitalization; preservation; libraries
  古籍记录着我国各民族的文化历史与发展状况,具有科学研究价值与文化传承价值,是档案文献遗产的重要部分。古籍文献多为纸质资料,易受到自然与人为因素的影响,增加了存储利用的难度。作为文献存储与流通机构,无论何种类型的图书馆,均有不同规模的古籍收藏。古籍存储对环境、技术等要求较高,很多图书馆由于修复技术落后、设施不完善等问题,难以保障古籍文献管理的有效性[1]。如今数字化技术的高速发展,深刻影响着现代社会的科研面貌,给传统人文科研带来新的理论与方法。这种改变冲击着传统人文的研究维度,促进了人文科学与数字化技术的融合,也标志着数字人文时代的来临。数字人文强调依托先进信息技术,开展数字化资源整合与可视化服务,实现知识挖掘,提升数据资源的利用价值。将数字人文理念引入古籍保护领域,加快古籍文献数字化建设,可以为古籍文献的深度开发创造条件,也有助于图书馆古籍文献的长期保存与利用。
  1  数字人文时代加强古籍文献资源数字化建设的意义
  古籍文献资源是宝贵的文化遗产,强化图书馆古籍数字化建设,是顺应数字人文时代趋势的要求,也是深入挖掘古籍科研价值、促进优秀文化传承的需求。
  1.1  古籍文献保存的客观要求
  古籍文献多为纸质资料,易出现虫蛀、潮湿、纸张老化等,对物理保存条件要求高。如何对这些资源进行长期保存,是图书馆等文献存储机构需要解决的问题。一些图书馆为了保护好珍贵文献,采用了多种文献修复与管理方式,如通过文本影印的方式复制古籍善本,避免纸质原件丢失;或通过制作微缩光盘减少存储空间,延长古籍存储周期。然而,由于古籍文獻种类繁多,来源复杂,需要投入大量资金与人力,采用上述方法并不能缓解古籍保护的压力,也难以满足用户对古籍利用的需求。而数字化技术的引入,为古籍文献数字化创造了条件,有助于提高古籍文献存储、检索和利用效率[2]。
  1.2  深层次开发古籍文献的需求
  目前很多图书馆在古籍文献保存方面,由于受设施设备落后、人员不足等限制,或者由于重视度不够,导致馆藏古籍流通率不高,变成鲜有人问津的“古董”。从收录范围来看,部分图书馆收藏的古籍文献不够系统完整;从服务内容来看,多以提供借阅服务为主,缺乏对古籍资源的深层次开发,难以真正体现古籍的作用。图书馆必须改变“重藏轻用”的局面,将古籍文献更好地利用起来,保障古籍文献的可持续性,为科研、教学等提供多元化的服务。尤其是借助数字化技术,改变图书馆古籍文献的存储状态,不仅可以方便用户借阅与传播,也可以促进隐性知识显性化,进一步提升古籍的社会利用价值。   1.3  传承中华优秀传统文化的需求
  古籍属于不可再生资源,是我国悠久历史文化的传播载体,蕴藏着前人智慧的结晶。古籍文献有极高的存储价值,一旦毁损或消失,也意味着宝贵文化遗产的消亡。图书馆对典藏的古籍文献进行数字化处理,是一种替代性的再开发方式,既能够代替纸质文本,也可以让孤本不孤,让更多的人接触到经典。尤其是在我国大力倡导弘扬传统文化的背景下,图书馆结合用户阅读需求,依托数字化技术促进古籍文献传播,本身就是传承优秀文化的必要方式,也是图书馆在社会教育方面必须承担的使命。因此,图书馆要保障古籍文献保护的专业性,以先进信息技术让古籍文献源远流长,让其变为经典阅读的重要源泉。
  2  数字人文时代图书馆古籍文献数字化建设的常用技术
  数字人文时代各种前沿技术的应用,颠覆了传统的信息资源整合传播方式,也改变了人们对信息的利用习惯。将这些前沿技术应用于图书馆古籍保护工作中,将促进古籍文献从采集、检索到利用等多个环节质的飞跃,全面提高古籍文献管理的智能化水平。
  2.1  文本挖掘技术的应用
  文本挖掘是从语料库或文本集合中信息抽取,从中发现潜在的、有价值的知识。文本挖掘技术是数据挖掘的分支,可以满足古籍文献的深层次挖掘需求[3]。图书馆在对古籍文献进行数字化处理过程中,借助该技术分析古籍文献的人物关系、篇章结构等,或者对大规模文献进行整体分析,可以把握某一时期、流派或作者的风格特点,摆脱依赖权威的传统人文研究方法,在对比分析上厘清不同文本之间复杂的关系,从中提炼可供传播的知识与经验。针对历史档案资料,研究者也可以借助文本挖掘技术,对同类作品进行校勘对比,深入挖掘同一时期人们对社会、人文等方面认知的差异,进而更为准确地还原历史真相。
  2.2  地理信息系统的应用
  地理信息系统(Geographic Information System , GIS)是在对大量空间数据进行采集、组织与分析基础上,将事物的属性数据与空间数据相结合,帮助用户提高信息查询效率的应用软件。GIS技术在图书馆古籍文献数字化中的应用,可以在计算机中迅速整合空间数据,呈现独特的地图分析、视觉化与信息分层方式,获得包含时间与空间两重维度的检索结果,提高检索的准确与直观性[4]。如针对特定作者,可以借助该技术自动采集分析其综合信息,生成作者生平的行踪路线图[5]。GIS为用户提供了全新的检索入口,方便图书馆在古籍文献数字化基础上,促进古籍文献图表化、可视化,生成动态古籍数字化地图,以清晰的知识图谱体系,提高古籍文献的易读性,扩大古籍文献的传播范围。
  2.3  知识发现技术的应用
  图书馆古籍文献类型复杂,为避免重复建设和资源浪费,可以利用知识发现技术建立文献管理系统,实现古籍文献的高效整合与科学管理[6]。該系统分为古籍导入、分类管理、知识发现检索等模块,可以通过馆藏文献调取、网络资源采集和自动扫描识别等方式,将既有的古籍文献资源导入原始数据库中,并对原始数据进行分类处理,根据分类结果设计检索页面,依托知识发现获得有价值的知识,满足用户的全文检索需求。系统运行过程中,知识发现技术的作用在于从大量文献中自动提取特征信息,然后借助神经网络与决策树等,对不同的特征项进行分类,赋予对应项目唯一的标识[7]。此后对这些文献资源进行相关性分析,发现不同数据之间的隐含关系,从中挖掘有价值的知识。
  3  数字人文时代图书馆古籍文献专题数据库的构建
  数字人文时代数字化资源的应用日益普遍,图书馆有必要应用数字化技术,建立古籍文献资源专题数据库,不断补充与完善数据信息,更好地满足古籍文献的长期保存需求。
  3.1  数字化工具的选择
  移动信息技术的广泛应用,推动了图书馆数字化建设的进程,很多新的数字化处理工具被开发出来,也为古籍文献的数字化保存提供了可行方案。例如方正集团研发的古籍资源数字化加工系统,可以实现对古籍文献的全文数字化,加工准确度高,为用户对古籍资源的全文检索、阅读与分析提供了便利。图书馆在古籍文献数据库建设的准备阶段,要根据馆藏规模与需求,选择优质数字化供应商合作,切实保障数字化处理工具的性能[8]。在数据库设计方面,尽量选择高吞吐量、兼容性好的内部数据存储器,满足对大规模数据的实时统计、存储与调用需求,避免由于频繁读取导致的系统卡顿与延迟。
  3.2  数据库建设步骤与方法
  图书馆古籍文献数据库的构建耗资巨大,涉及范围广,建设周期长。为了降低建库成本,提高建库效率,图书馆可以通过以下步骤保障建库的有效性。首先,做好古籍文献采访工作。目前很多商业信息机构存储有数字化古籍文献资源,图书馆为拓展古籍来源,可以与这些商业机构合作,直接购买他们的数字化产品[9]。其次,对网络资源进行链接与整合,可以利用网页检索工具,实现对这些资源的迅速采集,并直接填充至专题数据库中。此外,做好古籍文献资源的分类整理工作,借助数字化工具进行深入挖掘,形成可视化的古籍资源地图,满足用户的多元化检索需求。如国家图书馆建立的“全文影像数据库”,涵盖敦煌遗珍、数字方志等内容,可以满足用户的关联检索、高级检索等个性化需求。
  3.3  数据库工作流程与规范
  图书馆做好古籍文献数字化处理后,还需要设置合理的数据库运作规范,保障数据库的合理使用(见图1)。对古籍文献的采集整理,要求设计统一的采访、编目与阅览标准,避免重复建设和资源浪费。在古籍文献数字化制作阶段,需要做好图文对照、特征匹配和专业校对等工作,然后对这些资源进行排序整理,保障入库信息的完整、准确、有序性。对古籍文献的数字化存储,可以设置包括分类扫描、信息识别、图像处理等在内的操作流程,针对每个环节设计合理的操作标准,要求馆员严格执行。此外,保障数据库检索界面的简洁友好性,设置资源导航、联机字典等辅助功能,方便用户的便捷、高效检索,并可以在古籍文本与图片预览之间自由切换。   4  数字人文时代图书馆古籍文献的长期保存机制
  由于长期以来受到管理体制的制约,不同古籍管理机构之间各自为政,对古籍文献的采集、修复、挖掘与管理力度不够,缺乏共享渠道,尚未建立可靠的古籍长期保存机制。为此,图书馆有必要发挥自身优势,积极承担起保护与挖掘古籍文献的重任,联合其他信息机构,共同建立完善古籍开发与保存机制,促进我国古籍保护事业的发展。
  4.1  建立统一的古籍长期保存标准
  数字人文时代古籍文献的研究利用价值进一步凸显,图书馆在强化古籍数字化建设的同时,也有必要联合博物馆、出版社、地方志研究所等机构,共同探讨古籍文献的数字化保存标准,建立统一规范的古籍保存标准体系。这是因为古籍文献种类复杂多样,若编目、存储标准不统一,将直接制约古籍的可持续开发[10]。地方政府在古籍保护方面,要发挥牵头和引领作用,指导图书馆等文献存储机构协同合作,成立专门的古籍文献开发标准委员会,专门负责标准制定与调整工作,建立古籍开发、评价与保存的严格技术体系。各级信息机构要严格规范,做好古籍文献数字化建设工作,并保障数据格式、编目规则、应用系统的统一性。
  4.2  建立古籍文献保护人才培养机制
  在古籍文献保护方面,目前很多机构存在规模不完整、修复技术落后、保护人才匮乏等问题,导致很多珍贵的民族文化遗产毁损或流失。我国一些学者也指出,如今精通古籍修复与研究的人员越来越少,后继人才青黄不接。由于古籍文献的保护与利用,对相关管理者的要求较高。为了保障可靠的人才储备,国家要尽快建立古籍保护人才培养方案,指导各级高校设置古籍保护专业,或开设与古籍保护相关的课程,让更多的年轻人加入到古籍保护工作中。图书馆也可以与其他机构合作,强化古籍保护人员的在职培训工作,指导他们掌握与古籍翻译、编目、修复等相关的技能,以更好地实现古籍长期保存的目标。
  4.3  促进古籍文献资源数字化共享
  图书馆开展古籍文献数字化建设的目标之一,就是促进古籍典藏共享,让更多的人认识到古籍的应用价值。随着古籍数字化保护工作的推进,很多古籍存储机构建立了古籍全文数据库或书目数据库,实现了古籍文献的全文数字化和快速在线检索。然而部分机构将古籍文献作为特色馆藏,不愿意与其他机构共享,不仅导致古籍数字化的重复建设,也势必增加资金、人力成本。只有各级信息机构联合起来,在古籍文献保护方面合理分工,充分利用数字化技术建立区域乃至全国性的数据库,形成古籍文献自由流通的在线共享平台,才能真正提升古籍的利用水平。
  5  小结
  古籍文献资源是我国珍贵的历史遗存,是中华文明演变的见证者,在弘扬民族文化和促进中外交流方面发挥着重要作用。数字人文时代各类先进技术的应用,促进了古籍文献数字化建设,更加强调知识挖掘与信息共享。图书馆作为古籍存储机构,有必要引入新理念与新技术,将数字人文思想融入古籍文献保护中,从先进的数字化实践项目中吸取经验,与信息机构开展广泛合作,全面提高古籍整合质量,实现古籍保护事業的可持续发展。
  参考文献
  [1] 陈畅.论古籍资源数字化的信息资源建设[J].山西科技,2017,33(2): 73-74,77.
  [2] 韩晶.新疆古籍文献资源数字化保护探析[J].图书馆学刊, 2015(11):59-61.
  [3] 文秀华,王莲霞.新媒体环境下高校图书馆古籍的阅读推广[J].农业图书情报学刊,2017,29(12):143-146.
  [4] 王向真.基于地理信息系统的图书馆读者借阅行为研究[J].中国中医药图书情报杂志,2014,38(5):19-22.
  [5] 钟劲松.文化传承视角下公共图书馆古籍保护问题与对策[J].图书馆学刊,2018(4):26-29.
  [6] 左瑾.公共图书馆古籍资源数字化开发与阅读推广研究[J].图书馆学刊,2017(12):67-70.
  [7] 李小平,张忆雄,沈洋,等.医药古籍文献数字化标准体系的构建[J].中华医学图书情报杂志,2017,26(1):11-14.
  [8] 曹丽.大数据环境下高校图书馆古文献资源数字化现状分析[J].图书情报导刊,2016,1(2):1-3,8.
  [9] 吴茗.提高古籍数字资源服务质量的实践与思考[J].情报探索, 2016(8):102-105.
  [10] 温丽君.论数字化时代高校图书馆纸本文献资源建设[J].中国中医药图书情报杂志,2015,39(6):27-29.
  (收稿日期:2018-12-14)
  (修回日期:2018-12-21;编辑:魏民)
转载注明来源:https://www.xzbu.com/1/view-14888251.htm