2004-2009年我国图书馆\情报与档案管理学科的研究热点与重点领域
来源:用户上传
作者:
[摘要]利用EXCEL对2004-2009年CSSCI数据库中图书馆、情报与档案管理学科来源文献的关键词进行词频分析和共词分析,并使用SPSS17.0提供的因子分析和层次聚类分析方法探究各高频关键词之间的内在联系,旨在试图反映近年我国图情档学科的研究热点与重点领域,为人们探讨图情档学科核心内容与研究本质提供参考。
[关键词]文献计量词频分析
图书馆学情报学档案学
因子分析聚类分析
[分类号]G25 G35 G27
1 引言
近年来随着现代信息技术在图书馆、情报与档案管理领域的广泛应用,我国图书馆、情报与档案管理(以下简称图情档)学科建设蒸蒸日上,其研究范围也在不断地延伸与拓展。然而,这却使得图情档学科与其他学科之间的“边界”显得日益模糊,图情档学研究领域的“跨界”与“过界”问题引起人们的纷纷议论。那么,什么才是图情档学科的核心内容呢?什么才是图情档学科研究的本质呢?笔者试图从实证的角度探讨和分析此类问题,对我国图情档领域采用词频统计、共词分析、多元统计分析等方法进行研究的文献进行了调研,发现其涉及的具体领域主要有web2.0、知识管理、情报学、数字信息资源、数字图书馆、竞争情报、信息资源管理等。然而笔者却未见到针对我国图情档学整个一级学科期刊论文关键词进行统计分析的研究成果。基于此,笔者尝试依据中文社会科学引文索引(CSSCI)数据库,采用共词分析、因子分析和聚类分析等方法对我国图情档学论文的关键词进行统计分析,试图反映近年我国图情档学科的研究热点与重点领域,为人们探讨图情档学科核心内容与研究本质提供参考。
2 数据来源
CSSSCI数据库是由南京大学中国社会科学研究评价中心研制的引文数据库,著录比较规范,具有权威性和代表性。笔者于2010年9月10日以CSSCI数据库为检索工具,依据教育部学位办公室的学位分类标准,检出了2004-2009年CSSCI收录的图情档学科来源论文的数据,共有25491篇,如表1所示:
注:笔者依据教育部学位分类标准以“图书馆、情报与档案管理”对CSSCI来源文献进行检索时,没有检索到2008年的记录,为了确保统计结果的系统性、代表性和科学性,笔者以《中国图书馆分类法》分类号C25、G35、G27分别代表图书馆学、情报学和档案学进行检索,将时间限定为2008年,结果显示G25为3418篇,G35为1045篇,G27为300篇。因此,将G25、G35、G27的检索结果汇集起来共有4763条记录,作为2008年图情档学科CSSCI论文的数据。
由于一篇文献的关键词或主题词是文章核心内容的浓缩和提炼,因此,如果某一关键词或主题词在其所在领域的文献中反复出现,则可反映出该关键词或主题词所表征的研究主题是该领域的研究热点。因此关键词可以作为词频共现分析的基本单元。本文使用的关键词样本均来自于CSSCI所收录图情档学科的来源文献。笔者首先采用ExCEL中的VBA编程方法得到31141个关键词,将语义基本重叠的关键词予以合并(比如“大学图书馆”与“高校图书馆”合并),借助ExcEL进行词频统计,并按照关键词频次降序排列,截取词频不小于112次的前50个关键词作为高频关键词。这些关键词能够从较大程度上反映2004-2009年我国图情档学科关注的热点,如表2所示:
3 高频关键词的共现分析
高频关键词的选择是共现分析的基础。不同学者对关键词的把握也许会不一致,同时不同的研究热点之间也会存在或多或少的联系,需要进一步反映这些高频关键词之间的关系。所以要对选择的50个高频关键词两两配对,统计出它们在论文中共现的频次,从而形成50×50的共现矩阵(见表3),作为进行因子分析和聚类分析的基础。
注:A1图书馆;A2高校图书馆;A3数字图书馆;A4信息服务;A5公共图书馆;A6知识管理;A7图书馆学;A8信息检索;A9竞争情报;A10情报学;All图书馆管理;A12图书馆服务;A13信息资源;A14网络环境;A15资源共享;A16读者服务;A17图书馆员;A18本体;A19知识服务;A20图书馆事业;A21搜索引擎;A22元数据;A23个性化服务;A24数字资源;A25档案管理;A26数据库;A27学科馆员;A28文献学;A29数据挖掘;A30引文分析;A31服务模式;A32参考咨询;A33电子资源;A34文献计量学;A35图书馆联盟;A36信息组织;A37期刊评价;A38数字参考咨询;A39知识组织;A40信息管理;A41图书馆建设;A42信息资源共享;A43网络信息资源;A44比较研究;A45Web2,0;A46开放存取;A47地方文献;A48知识产权;A49档案学;A50数字化。
4 高频关键词的因子分析
因子分析是最常使用的数据简化方法,也就是以最少的信息丢失为代价将众多的分析变量浓缩为少数几个因子,从而发现变量间的内在关系,从中提取数据的主要信息。笔者运用SPSSl7.0对高频关键词做因子分析,碎石图(见图1)显示:那些陡峭的对应较大的特征根,作用明显;后面稍平的对应较小的特征根,影响较弱。特征根在一定程度上被视为衡量对应公因子影响力大小的指标,一般来说,特征根大于1,说明该公因子具有一定的解释力度。笔者选择使用协方差阵(covarance matrix)和方差最大正交旋转(vafimax)方法进行因子分析得出的部分结果(见表4)显示,特征根大于1的有9个公因子,9个公因子的累积贡献率为89.88%,将特征根和累计贡献率综合起来进行考虑,这9个公因子基本能够真实反映近年我国图情档学科的研究热点与重点领域。
5 高频关键词的聚类分析
为消除频次悬殊造成的影响,用Ochiia系数将共词矩阵转换成相关矩阵,即将共词矩阵中的每个数字都除以与之相关的两个词总频次开方的乘积,这样得到相关矩阵。Ochiia系数的计算公式是:
对角线上的数据表示某词自身的相关程度,按上式计算均为“1”。为方便进一步处理,用“1”与全部矩阵数据相减,成为表示两词间相异程度的相异矩阵。如表5所示:
笔者将选取的高频关键词共现的相异矩阵导入SPSSl7.O进行层次聚类分析,经过多次尝试,确定选择离差平方和法(ward’s method)和平方欧几里得距离(squared euclidean distance)方法,得到层次聚类谱系图(见图2)。层次聚类谱系图可以将聚类的全过程以直观的方式展现出来,它把类间的最大距离算作相对距离为25,其余的距离均换算成与最大距离相比的相对距离大小。
6 结论
结合因子分析的结果,从层次聚类分析谱系图可以确定聚类结果为9类,这些类别基本能够反映2004
-2009年我国图情档学科的主要研究热点和重点领域。笔者将结合相关文献的研究结果对这9类的主要内容进行分析。
6.1
图书馆学情报学理论
图书馆学情报学与时代发展和社会进步联系紧密,其理论研究是2004-2009年中国图书馆学情报学界的研究热点。我国学者从不同视角、不同层次对图书馆学情报学研究对象、研究内容、研究方法、体系结构、研究趋势、前沿问题以及图情档一体化等方面进行探讨,从而提升了图书馆学情报学理论水平。
6.2学术评价
其研究内容主要涉及同行评议、文献计量与引文分析、定量评价方法、评价标准与指标体系、评价机制、学术成果评价、学者评价、学术群体评价、学术期刊评价、学术信息网站评价、专利评价以及学术评价与学术规范的相互关系等。
6.3学科馆员服务与虚拟参考咨询服务
主要研究用户信息需求、信息服务基本模式、信息服务质量评价等方面,探索参考咨询服务业的发展模式。近年来涵盖学科信息资源服务、学科参考咨询服务等个性化信息服务的学科馆员制度已经在国内高校图书馆逐步推广并成为学界研究的热点问题,主要包括学科化信息服务、学科导航、学科馆员素质、学科参考咨询服务、个性化定制服务等内容。
6.4知识管理与知识服务
知识管理与知识服务是我国知识研究领域学者近年来关注的焦点。“知识管理”一词的出现频次高达605次,居知识研究领域关键词之首。“知识服务”的出现频次为241次,在知识研究领域位居第二。国内的知识管理与知识服务研究集中于图书馆学、情报学和计算机科学等领域,主要涉及知识管理的原理、方法、技术、模式与策略、知识库建设、知识管理系统的设计与优化、知识挖掘技术的应用、知识转换、知识管理工具的开发与应用以及宏观层面的知识服务、知识创新、知识转移、知识地图等方面。我国学者对知识管理与知识服务的研究取得了一定的成果,但理论探讨多,应用研究少,且理论研究比较空泛、缺乏深度,应用研究实用性不强。
6.5知识组织与信息检索
知识组织与信息检索是图书馆学情报学重要的前沿研究领域之一,所涵盖的范围十分广阔,主要涉及本体与传统知识组织工具改造、受控语言与自然语言融合、网络环境下知识组织研究、Web2.0与自由分类法、集成化检索系统、可视化检索系统与智能检索系统的开发与优化以及人机交互技术、知识挖掘技术、知识发现技术、本体技术、数据库系统技术、模式识别技术、图像理解技术、机器学习技术等方面。
6.6信息资源共建共享
信息资源是图书馆、情报所和档案馆提供信息服务的基础,任何机构都不可能仅凭自身资源建设来满足无限的用户信息需求,因此信息资源共建共享便成为我国图情档学研究的重要领域。信息资源共建共享主要研究国家、地区、机构各个层面信息构建活动及其规律,探寻便于广大用户使用的信息资源有序化的基本方式,分析信息资源共享的影响因素以及探索信息资源共享利用最大化的基本途径。
6.7图书馆事业和图书馆建设
图书馆事业与图书馆建设主要研究公共图书馆服务体系的构建、农村图书馆建设、社区图书馆可持续发展、流动图书馆建设、社会力量参助图书馆建设、高校图书馆建设、图书馆立法、图书馆转型等方面。
6.8数字信息资源法律政策
主要依据法学和政策学的原理与方法,研究数字图书馆建设过程中如何为数字信息资源的开发利用提供法律体系和公共政策体系的基本保障,研究如何正确处理数字信息资源开发利用与相关法律法规、公共政策之间的相互关系,探索适合我国国情的数字信息资源配置、数字信息资源开发利用、政府数字信息资源开放等方面的法律法规与公共政策问题。数字信息资源的知识产权是数字图书馆管理的核心资源,数字信息资源知识产权创造、运用、保护和管理的强化,充分体现了信息资源的数字化特征,更意味着知识资源的创新。
6.9Web2.0环境下的档案管理
近年来学者更多地关注图书馆、情报所和档案馆等信息机构的地方文献、电子资源、信息资源的数字化及其开放存取等问题。
由于CSSCI数据收录范围存在一定局限性,来源文献作者对关键词的把握可能会不一致,加上笔者在统计分析过程中难免会出现一些差错和纰漏,所以统计结果与实际状况可能会存在一定偏差。另外还需要指出的是,这次数据统计仅以CSSCI论文为样本,没有将图书等其他重要形式的研究成果纳入考虑范围,不能充分反映我国图情档学的总体研究成果,这也会导致统计结果与总体研究情况出现偏差。但笔者旨在通过高频关键词的共现分析、因子分析和聚类分析,反映近年我国图情档学科的研究热点与重点领域,为人们探讨图情档学科核心内容与研究本质提供参考。
致谢:感谢导师叶继元教授给予的悉心指导;感谢袁曦临研究员对本文修改提出的宝贵意见;感谢同学杜慧平博士提供的帮助。
转载注明来源:https://www.xzbu.com/1/view-152117.htm