您好, 访客   登录/注册

基于P2P的图书馆用户信息资源共享研究

来源:用户上传      作者:

  摘 要:P2P技术开创信息资源共享的新局面,节约有限社会资源,提高信息资源的使用效益,简要介绍P2P的特点及模型结构,分析基于P2P的信息资源共享的优点。
  关键词:P2P;信息资源共享
  中图分类号:G25 文献标识码:A 文章编号:1671―7597(2010)1020107―01
  
  1用户的信息资源
  
  当前互联网上可用的海量数据信息几乎涵盖了人类活动的每一个方面,并以非常快的速度在不断地增加,在这种情况下,网络成为图书馆用户获取各种信息资源的主要途径,目前用户在使用网络资源时主要存在以下问题:信息查找困难,在互联网近乎无限的资源中很难有效地找到用户所需要的信息,这就需要用户在检索和处理信息的过程中对信息进行反复的检索、处理、组织和提炼;信息获取困难,只有用户才真正知道自己最需要的是什么,这就需要用户花费大量的时间和精力对获取的信息按照自己关心的主题进行过滤、分析、整理,最后形成满足用户需求的信息;兴趣或研究方向相近的用户之间缺乏信息交流,相关用户花费大量的时间和精力重复着上述的信息查找和信息获取的过程。
  学术群体是数字图书馆最多、最重要的用户群体,如果每类研究或兴趣相关的用户能把其他用户花费大量时间和精力查找和获取的信息资源视为自己信息资源的一种扩展,反之自己的资源也是其它用户或群体资源的扩展,就可以提高图书馆用户在科研和学习过程中的信息获取效率,实现资源利用价值的最大化。
  
  2 P2P的概念、特点及横型结构
  
  P2P是一种分散的、分布式的资源管理模型,系统中的任何一个节点(peer)之间都能通过直接交换信息来进行信息和服务的共享,它最根本的思想是网络中的节点既可以获取其它节点的资源或服务,同时又是资源或服务的提供者,即兼具客户机和服务器双重身份,用户可以直接控制和共享资源,这使得用户能以更方便快捷的方式参与到信息资源的共享中。
  P2P技术最典型的应用是信息资源的共享与存储,其有如下特点:1)对等。每个节点具有相同的地位,既是资源提供者又是资源消费者,同时扮演着C/S模式中的服务器和客户机两个角色。2)自治,节点可以独立自主地决定共享什么资源,允许谁共享以及在什么条件下进行共享,节点可以随时自主地加入或退出系统。3)动态,节点自身也可以随时加入或离开网络,因此整个P2P网络是动态的,4)无集中控制和大规模分布,传统的分布式计算系统中一般存在集中式的控制,而在P2P系统中,这样的控制不存在,5)系统自组织。自组织定义为系统组织的自发增加过程,即这种增加不受环境或其它外部系统的控制。
  由于各节点之间可以直接交互共享资源,资源利用率得到极大提高,因而在P2P平台上进行信息资源的共享是一种较理想的方案,可以有效利用P2P本身的优势高效,最大程度地实现信息共享。
  P2P系统主要采用非集中式的拓扑结构,根据结构关系可以将P2P系统细分为三种拓扑形式:1)中心化拓扑结构。该结构中存在一个或一组居于网络中心的索引服务器,负责保存和维护所有共享资源的信息,节点通过索引服务器得到所需资源的位置信息,然后与拥有资源的多个目标节点直接进行通讯。居中的索引服务器采用CS模式为Peer提供登录直接查询等服务,但P2P系统中的主题服务(如文件共享服务、视频语音传递)是在Peer简直接进行的,并不经过Server的转接,中心化拓扑最大的优点是维护简单,资源发现效率高,典型的应用如BT,eMuIe,PPlive等。2)全分布式拓扑结构。全分布式结构化拓扑的P2P网络主要是采用分布式散列表(Distributed Hash了able,简写成DH7)技术来组织网络中的结点,DHT是一个由广域范围大量结点共同维护的巨大散列表。散列表被分割成不连续的块,每个结点被分配给一个属于自己的散列块,并成为这个散列块的管理者,通过加密散列函数,一个对象的名字或关键词被映射为128位或160位的散列值。只要目的结点存在于网络中DHr总能发现它,发现的准确性得到了保证,经典的案例是Tapestry,Pastry,Chord~qCAN。3)半分布式拓扑结构,半分布式拓扑结构吸取了中心化结构和全分布式非结构化拓扑的优点,选择性能较高(处理、存储、带宽等方面性能)的结点作为超级结点,在各个超级结点上存储了系统中其他部分结点的信息,发现算法仅在超级结点之间转发,超级结点再将查询请求转发给适当的叶子结点,半分布式结构也是一种层次式结构,超级结点之间构成一个高速转发层,超级结点和所负责的普通结点构成若干层次,采用这种结构的典型的案例就是KaZaa,Skype等。
  
  3 基于P2P的信息资源共享优点
  
  基于TCP/IP的信息资源共享是传统的模式,与之相比较,基于P2P技术的共享成本更小。P2P能充分发挥高性能PC机的潜力,节约存储成本,减轻服务器的压力,充分发挥包括人力资源在内的一切社会资源。
  基于P2P的搜索引擎为网络信息搜索提供了全新的解决方法,其最大优点在于应用先进的对等搜索理念,对互联网络进行全方位的搜索,不受服务器、数字资源文档格式及宿主设备的限制,其搜索深度和广度是传统搜索引擎所难以比拟的,其搜索范围可在短时间内以几何级数迅速增长,理论上包括网络上的所有开放的信息资源,采集到的信息将有更强的实时性和有效性。
  当用户下载共享信息资源的时候,从某种程度上就可以认为上传共享信息资源的用户和下载相应共享信息资源的用户之间存在某种关联,可以对目录服务器上的日志信息进行统计分析,当用户间这种关联达到某种闽值的时候,就可以自动根据这种相关性为这些用户建立相应的兴趣组或用户社区,建立一种相互影响的学习或研究关系,最大程度地发挥用户所获取的信息的价值,使研究或兴趣相关及相近的用户之间在信息获取与交流方面得到更多的便利。
  兴趣相近的节点存放的内容和提交的检索查询也相近。可以通过挖掘节点所共享的内容所反应的节点兴趣,从而使用尸在需要时能够高效地检索到自己所需要的内容,通过用户聚类,可以根据相似用户来推荐资源,或根据当前下载情况,预测当前用户的兴趣,为当前用户提供k个最相似的邻居。
  通过对信息资源的重组,使兴趣相同的用户节点相互合作,简化信息资源的存储、查找和使用,从而提高资源利用率,此外,人类社会的聚群心理和聚群行为也反映到P2P系统中,体现为节点具有利人和利已的双重动机,一方面提供共享资源,另一方面也有自身的资源需求。
  P2P技术已经是一门很成熟的网络技术,它开创了信息资源共享的新局面,节约了有限社会资源,提高了信息资源的使用效益。随着第二代因特网的发展及网格技术的成熟,在技术上实现更优越的信息服务是一定的,目前,即使做不到全国范围内信息资源共享,但在图书馆网络环境内实现各种资源的共享还是可行的。
转载注明来源:https://www.xzbu.com/8/view-8875558.htm