您好, 访客   登录/注册

数字图书馆中文本信息检索技术的研究与实现

来源:用户上传      作者:杨屹

  摘   要:在大数据背景下,现代化信息技术的应用范围逐步扩大,延伸到了社会各行各业的生产生活中。在电子阅读不断普及的当下,构建数字化图书馆是图书馆经营发展的新方向。本文将从视觉大数据的角度对数字图书馆文本信息检索技术进行研究,详细阐述其服务流程、模式以及基本框架,推动数字图书馆的发展完善。
  关键词:数字图书馆  文本信息检索  视觉大数据  服务框架
  中图分类号:G250.7                                文献标识码:A                       文章编号:1674-098X(2020)01(b)-0243-02
  信息技术和互联网的快速发展使得信息载体变得越来越多样化,包含多种数据形式的大数据逐渐占据主流。在这样的形势下,我国国务院印发《关于积极推进“互联网+”行动的指导意见》,明确了数据资源库以及计算机视觉、生物特征识别以及自然语言理解等关键技术的发展前景,基于这些技术构建文本信息检索模型是新时期数字图书馆不可缺少的一部分。
  1  移动视觉搜索技术及其发展
  1.1 移动视觉搜索技术
  移动视觉搜索是指利用移动智能终端获取现实世界中的图像、视频或是地图等和视觉对象作为检索对象,获取其关联信息,并在移动智能终端上进行显示的一种信息检索技术方式。它被认为是未来互联网应用不可缺少的一项基础性技术。在数字图书馆领域引入移动视觉搜索技术,不仅可以为数字图书馆信息检索框架的发展提供助力,同时还能够有效破解视觉大数据资源处理相关问题。
  移动视觉搜索脱胎于视觉搜索、移动搜索以及跨媒体检索等现有的信息检索理论。早在20世纪70年代,视觉搜索技术就已经在心理学、体育学、医学等诸多领域获得了应用。在经过几十年的发展之后,该技术被引入到计算机、移动互联网等领域。
  1.2 移动视觉搜索在数字图书馆中的发展应用
  移动视觉搜索技术在数字图书馆中的应用实现了模式、理念以及技术的全面革新,实现了数字图书馆和互联网的深度结合。在互联网环境下,数字图书馆和移动视觉搜索的融合可以实现大数据资源获取、处理、分析以及展示等一体化信息检索能力,为用户提供更加高效智能的服务。除了基本的文本之外,还可以拓展到音视频、图像、3D模型等领域。
  基于移动视觉搜索的数字图书馆具有三项功能:其一,对视觉对象的大数据资源进行获取和处理。通过数字图书馆信息检索平台的协同管理、视觉对象资源协同处理以及网络环境下的协同传输,可以突破时间和空间的限制,高效的获取文本、音视频等大数据资源,发掘其中存在的价值。其二,实现了视觉对象大数据资源的协同通信。移动视觉搜索可以弥补有线网络覆盖范围上存在的不足,以协作化的移动信息服务方式为用户提供高效便捷的数据传递或是通信服务。其三,实现移动信息服务的协同创新。在互联网环境下,数字图书馆为用户提供的各类服务都可以根据网络信息的变化进行创新和补充,和移动用户之间建立深度交互关系,使用户间接参与到数字图书馆的服务构建之中。
  结合以上内容,在互联网环境下,数字图书馆的移动视觉搜索具有以下特点:首先,移动视觉搜索服务资源的跨界融合使得服务过程能够协调创新。其次,由于视觉对象的资源结构和类型相对复杂,因此在技术实现上具有很高的难度。再次,视觉对象的来源广泛使得移动视觉搜索的服务节点始终处于动态变化的趋势下。移动视觉搜索所涉及到的网络环境是由移动互联网、传感网以及物联网共同构成的,因此对网络环境兼容性、可拓展性以及可靠性均有著极高的要求,这使得移动视觉搜索过程始终呈现出动态变化的状态。
  2  数字图书馆移动视觉搜索的基本流程和服务框架
  2.1 基本流程
  想要从海量的视觉大数据中发掘出用户感兴趣的信息,必须要对视觉对象间的相似性和相异性进行度量,同时做好信息数据资源的组织管理,如此才能基于用户的需求进行快速的资源调取和匹配,提高数字图书馆信息资源的利用率。基于视觉大数据资源特征提取的数字图书馆移动视觉搜索服务模式主要有三个环节构成。
  2.1.1 识别并获取视觉大数据资源
  互联网中的视觉大数据常常表现出分散、异构以及多模态的特点,以现有的技术手段还无法实现完全获取,最好的办法就是根据当前信息技术和基础设施条件划定一个数据资源的识别和获取范围,构建以领域或是行业为导向的移动视觉搜索模型。同时,基于移动视觉搜索的应用需求,将视觉大数据资源的探索进行融合,保障移动视觉搜索反馈的高效性和可靠性。
  2.1.2 对视觉大数据资源进行存储和分析
  当前阶段,在对视觉大数据资源进行存储时多采用云计算分布式存储技术,原因在于数据资源的规模过于庞大,且类型复杂,但考虑到视觉大数据资源的增长速度过快,就需要基于根据数字图书馆移动视觉搜索的需求,建立与此相适应的数据存储和分析方法。根据图书馆文本信息检索的需求,可以采用多模态视觉大数据分析方法,它可以从多源且异构的视觉对象中推理出关联信息聚集的分析结果。
  2.1.3 构建移动视觉搜索服务支撑平台
  根据大数据的发展趋势来看,未来视觉大数据资源的规模将不断扩大,同时结构和类型也会呈现出多样化发展的趋势。因此想要保障移动视觉搜索服务的正常运行,就必须构建可以容纳视觉大数据资源的服务支撑平台。
  2.2 数字图书馆移动视觉搜索服务框架   构建数字图书馆移动视觉搜索服务框架的目的是对服务实现过程中涉及到的视觉大数据资源进行科学的组织管理,为移动视觉搜索服务的实施奠定基础。基于此,数字图书馆的移动视觉搜索服务框架主要有三层次构成。
  2.2.1 视觉对象知识库层
  本层次包含了视觉对象知识推理本体库、视觉对象本体库、移动视觉搜索案例库等部分,在构建的过程中,需要完成视觉对象的分类,根据分类结果选择合适的大数据存储方案。数字图书馆中部分学科和专业的视觉对象知识推理以及移动视觉搜索需求知识表现出显著的通用性特征,分类的难度较低。但大多数学科和专业由于覆盖领域的狭窄,存在较大反的分类难度。
  2.2.2 移动视觉搜索逻辑推理层
  本层次主要由视觉对象语义推理引擎、移动视觉搜索逻辑推理算法库等模块构成。前者主要是通过对视觉对象知识库表示方法添加语义关联、分析和特征提取的支持,实现视觉对象语义层面的知识推理,为数字图书馆移动视觉搜索服务的资源配置提供依据,优化服务能力。后者则是为了提高移动视觉搜索过程中语义推理的精确度,引入逻辑推理算法,利用自然语言处理、人工智能等技术对用户思维进行动态模拟,最大程度的实现对用户移动视觉搜索需求的精准把握,据此反馈最接近的语义推理结果。
  2.2.3 移動视觉搜索应用接口层
  主要包括知识研发、管理以及应用等接口体系。其中知识研发接口主要包括知识服务获取、处理、分析、集成以及融合等功能模块。知识管理接口则负责所有功能模块的安全管理、维护评估等工作。知识应用接口则负责移动视觉搜索查询、用户访问、语义推理等应用和外部软硬件环境和移动应用的对接。
  3  结语
  综上所述,在互联网广泛普及的时代背景下,大众对高效、协同、交互的移动应用需求以及视觉搜索需求持续增长,移动视觉搜索已经成为新型互联网应用范式的关键技术,将其引入到数字图书馆的文本信息检索服务中,可以为用户提供更加精确和快速的服务反馈。
  参考文献
  [1] 李广丽,朱涛,刘斌,等.面向大数据的数字图书馆多媒体信息检索系统优化研究[J].情报科学,2019,37(2):115-119.
  [2] 李默.数字图书馆个性化移动视觉搜索机制研究[J].图书馆理论与实践,2019(2):107-112.
  [3] 马佳立.面向大数据的数字图书馆移动视觉搜索机制及应用[J].自动化技术与应用,2019,38(5):179-182.
转载注明来源:https://www.xzbu.com/1/view-15192220.htm