您好, 访客   登录/注册

基于Internet信息资源的开发利用

来源:用户上传      作者: 张 丽

   [摘要]本文从Internet上信息资源的重要作用出发,对其开发利用的必要性、技术、方法进行较为深入的论述,并提出相应对策。
  [关键词]Internet 信息资源 开发利用
  
  一、网上信息资源开发利用的必要性
  网上信息资源又名网络信息资源,内容和信息都十分丰富,是集文字、图像、声音、视频为一体的多媒体信息。其包括超文本信息和超媒体信息。它们按非线性文本组织模式,将信息单元储存于节点,通过含URLdizhi地址的链接体现各节点之间的概念逻辑关系,从而形成网状结构。既可按线性顺序查阅,又可跳跃式浏览,与实体文献资源相比,具有如下的特点。
  1.多样性
  网上信息资源包括馆藏目录、电子书刊、各种类型的数据库、资源导航及搜索引擎、电子公告等。并以超级链接的方式将文字、图像、语音和视频信息链接起来,形成一个丰富多彩的网络资源。
  2.无序性
  网上信息以超文本方式而构成立体网状的形式,缺乏统一的控制,呈分散无序状态,可以根据节点任意跳动,而实体文献信息资源则自成体系,呈线性方式。
  3.开放性
  网上信息是开放、相关联的,可以通过链接任意检索信息。我们知道,通过internet,任意信息都可以传播到世界各个地方,只要将计算机连接在网络上,用户就可以快速得到这些信息。
  4.动态性
  网上信息资源跨地区分布,高速度传输,更新淘汰周期短,变化快、不稳定,呈高度动态性。由于网上信息资源从本质上改变了信息的创造交流和获取的方式,完全抛弃了传统的出版概念,实现了无纸化的出版,信息呈现很强的时效性。
  5.互动性
  网上信息资源具有很强的互动功能,可以形成广泛的论坛氛围,有关专家可以就某一专题开设电子论坛,网上直接反馈用户信息,参与交流讨论。
  6.增值性
  网上信息资源开发与建设的最终目的是服务。用户在网上利用各种手段查找所需的信息内容,在这一过程中信息被反复利用,不但不会导致网上信息资源损耗,反而可使信息增值。
  由此可见,网络信息资源使实体文献信息资源在内容上和形式上有了很大的变化,这个巨大的信息资源库涵盖了不同学科、不同领域、不同地域、不同语言的信息资源,具有较大的灵活性。图书馆作为科研服务机构之一,不懂得如何有效地开发利用网络信息资源,就会失去对网络信息的“拥有”与“服务”。因此,网上信息资源的开发利用是实现信息价值转换一种典型的社会化智能活动。
  二、网上信息资源的开发技术
  1. push技术
  传统的信息获取方式是基于Client/server模式,主要采用拉取(pull)的技术挖掘采集信息。但随着网上信息资源的丰富和多元化,这种方式已不能满足用户快速准确地获取信息的要求,引入了push技术,作为internet的一种新技术,提出了新的服务模式,即核心点放在服务方,不需要用户的请求,主动将信息送到用户方,在信息发布获取应用中它表现为push服务器自动搜集用户感兴趣的信息,并将其定期地传送给用户。其表现形式为:web服务器扩展;客户代理方式;Push服务器方式。
  2.WWW信息挖掘技术
  WWW的数据信息挖掘,指从大型数据库的数据中提取出用户感兴趣的文本型知识,这些知识是隐含的、事先未知的、潜在的有用的信息。而网上文本信息挖掘是在已知的数据样本基础上,得到数据对象词的内在特性.并以此为依据在网络上进行有目的的信息提取。这种信息挖掘能自动地提取相关文献之间的有价值的关系知识,并将这些知识以可视的、动态改变的方式反馈给用户。可视方式为用户提供了以直观的易于快速理解的知识掌握途径,而动态改变的方式则满足了用户的及时性要求。它由特征提取、源信息采集、特征匹配三部分组成。特征提取负责根据一定的算法和策略,从现有的样本文档中提取出其内在的特征,即进行挖掘目标的特征提取;源信息采集负责从WWW上选择下载原始文档,这部分工作一般由多个具有一定启发策略的Robot (Robot是一个能沿着Web页面中的超链接进行自动漫游,并通过HTTP等标准协议读取漫游到页面的程序)完成;特征匹配是利用挖掘目标特征判断源信息的相似度,即进行相关信息的提取。
  3.联机分析处理技术
  首先,联机分析处理 (OLAP)与数据挖掘 (DM)是基于数据仓库 (数据库)技术而发展起来的信息分析与挖掘工具,在实际应用中各有侧重。前者是验证型的,后者是挖掘型的。OLAP建立在多维视图的基础上,重在根据已有的模式将直接源自数据仓库中的不同信息源的大量相关信息联系起来,以给分析人员一个清晰、一致的视图。DM建立在各种信息源的基础上,重在发现隐藏在大量原始数据深层中的对用户有用的模式。被抽取的即知识,具备可靠、新颖、有效、易于理解的特点。其次,OLAP与DM相结合,即OLAM,兼有OLAP多维分析的在线性、灵活性和DM对数据处理的深入性,因而可在更高层次上满足网上信息分析与挖掘需求。目前OLAM正处于研究中,其核心点是:①OLAM建立在多维数据库和OLAP的基础上,能对任何它想要的数据进行挖掘;②用户对挖掘算法具有动态选择的权利;③具有超强的挖掘算法;④能够协调执行效率与挖掘的准确性之间的关系;⑤具有灵活的可视化工具和良好的扩展性。
  三、网上信息资源的开发方法
  1.常规性开发
  由于网上信息不断更新,同时一些站点的URL也在变化,在开发网络信息时,应不断增加日常检索频率,把搜索网络信息纳入日常工作计划中,做到分学科、按课题和科研需求进行开发。此外,为了保证查全率,不要只使用某一种引擎对某一专题的信息检索,而要使用多种不同查询工具,对一种主题反复查询。
  2.专题性开发
  针对学科和学科建设,结合科研课题和研究领域等进行专题网络资源开发。在专用的网络服务器上把收集到的各种专业信息制作成网页放在网上,同时把相关专业的网络资源(如数据库、电子报刊、BBS、专题讨论等)以“友情链接”形式到网页上,以拓宽检索范围,使用户能方便快捷地从专门的网页上得到所需的信息,并结合信息咨询服务中的定题检索(SDI)、回溯检索(RS)、原文提供服务和进行科研项目查询(on.going re―search)服务开展工作,指导用户获取所需的二次及一次信息源。
  四、网上信息资源开发的利用途径
  1.熟悉网络信息资源特点及分布状况
  了解常用信息资源的特点和分布方式,如国内外著名的科研机构、信息发布机构的特点和网址,及时而准确获得这些权威机构发布的信息。如世界卫生组织及一些重要的学会协会等,通过其主页经常发布一些重要的科研信息,对这些机构、学会的了解,可以帮助用户及时掌握最新科研动态。
  2.合理配置网上信息资源
  由于我国对信息资源在时间、空间、数量三方面的配置存在不同程度的问题,即在空间的分配不均匀,时间的分配不合理,数量的分配不均衡,所以优化配置网络资源尤为重要。在空间上注重网络资源在不同地区、不同行业部门的分布,在数量上对各种各样网络信息资源采取合理比例配置,在时间上调整好网络资源在过去、现在、将来三种时态上的配置。
  3.建立学科信息导航库
  为了提高用户检索的检准率和检全率,为了使网络信息有序化,建立学科信息导航系统,利用各种搜索引擎对某一主题信息上网查询、浏览并参考有关文献,选择参考价值较高的信息资源,由专业人员经过加工、组织、归类、设置类目,形成新的知识关联,产生出更高层次上的综合信息产品,方便用户查询。

  4.利用国际联机检索系统
  为了扩大获取信息的范围,一定要利用国际联机检索系统。其中最著名的是DIALOG系统。它是世界上最大的联机检索服务机构,有600多个数据库,涉及到全文型、数据型、事实型、指导型的数据库,有近3亿条的记录。涉及的学科专业范围广,检索功能强,数据更新及时,文献数据时间跨度大。是项目查新、文献调研、课题立项、论文撰写、专利申请等重要依据。它的联入方式可通过Telnet方式联入,也可通过www方式联机的超文本界面。
  5.开展个性化服务
  随着Internet信息技术和智能化技术的发展,借鉴人工智能技术将用户信息需求组成过滤条件对信息资源进行过滤,来实现把资源中符合需求的内容提取出为用户服务,从而形成一种因人而异的信息服务形态――个性化主动服务形态,即“信息找人”,更好地为用户提供信息挖掘服务。
  6.加强网上搜集,增强针对性
  对重点学科和课题除进行定期服务、跟踪服务、信息的调研等服务外,还要有针对性地广泛搜集实用网址。如农业学科可搜集作物学、园艺学、林学、植保、畜牧兽医、食品、水产养殖、生物学等方面的URL,还可收集一些农业研究机构、农业高等院校、农业国际会议等得URL。这样做,不仅使用户从虚拟馆藏中得到现实的信息资源,而且深化了网络信息资源服务层次。
  7.成立网上信息资源开发部
  在一定区域内建立网上信息资源新产品连锁服务站,并通过与企业、商业、旅游服务业、科研、教学等单位挂钩,向社会传播有关信息产品,同时编制各种网上“指南”、“索引”或“联机帮助”,指导用户有效的利用网上信息资源。
  8.建立用户反馈意见栏目出版社
  用户对网络信息资源的利用价值最有发言权,经常征求、收集用户对专业站点及其信息资源评价信息,可以把务握网络资源的内容质量、学术水平、编辑质量等,对筛选和评价专业网络资源具有帮助,只有了解用户需求,才能情报工作提高知识服务的水平,满足用户的信息需求。
  9.举办多种形式的专题讲座和信息发布活动
  
  参考文献:
  [1]毕强.网络信息资源管理[M].长春:吉林科学技术.
  [2]王淑群.网络环境下高校图书馆的用户需求与信息服[J].图书馆论坛,2007,(4):32-34.
  [3]王建仑.网络科研信息资源的开发与利用[J].图书情报工作,2008,(2):37-39.
  [4]王咏.基于Push技术的信息获取方式及其应用[J].情报学报,2008.
  [5]杨燕.我国网络信息资源管理与开发[J].图书馆建设,2006,(6):124-126.


转载注明来源:https://www.xzbu.com/2/view-466918.htm