基于SBM-Malmquist的技术问答社区知识交流效率测度研究
来源:用户上传
作者:丁楠 曹玮倬 相甍甍
摘要:[目的/意义]目前在技术问答社区知识交流方面的研究尚不完善,旨在采用数据包络分析法研究技术问答社区知识交流效率,从而发现其不同板块之间存在的差异和变化规律,为改进社区管理和提高知识交流效率提供参考。[方法/过程]在构建知识交流效率评价指标体系的基础上,以“开源中国”社区15个热门板块为研究样本,基于SBM模型与Malmquist指数计算其知识交流的静态和动态效率值并进行深度分析。[结果/结论] “开源中国”社区15个热门板块之间的平均知识交流效率良好,但板块间差距较大,且总体知识交流效率处于上升趋势,主要是由于技术进步变化指数呈现19.50%的上涨幅度,说明技术振兴是“开源中国”社区知识交流效率上升的主要原因,但出现一定程度管理不当现象并且资源利用率较低。
关键词:技术问答社区 SBM模型 Malmquist指数 知识交流效率 开源中国
分类号:G202
引用格式:丁楠, 曹玮倬, 相甍甍. 基于SBM-Malmquist的技术问答社区知识交流效率测度研究[J/OL]. 知识管理论坛, 2022, 7(2): 101-115[引用日期]. http://www.kmf.ac.cn/p/278/.
1 引言
随着网络技术的蓬勃发展,信息交流和传播的方式开始多样化,越来越多的人在论坛和博客上通过发文(帖)和回文(帖)来表达观点、共享信息和获取知识,人际交流突破了时空的局限。用户提出问题后,社区吸引、发动来自各个领域的其他用户解答问题或提出对策,从而围绕一个主题不断地达成共识,形成了类似于现实中社区的网络团体――虚拟社区。近年来,虚拟社区逐渐成为人们通过互联网交流和获得知识的重要媒介,这使一些搜索引擎无法直接检索到的、存储在人脑当中的知识得以展现。专业性的网络论坛作为一类特殊的虚拟社区,是知识交流的重要工具之一,用户一问一答之间,便发生了信息交换和知识交流[1],例如技术问答社区是把IT技术作为论坛的主题,为技术人员提供知识交流的虚拟社区,其鼓励相关用户都能积极参与开放性讨论并分享创作过程,逐渐成为个人或团体开展知识交流和共享的有效平台。近年来,随着IT技术的广泛应用,技术问答社区的规模也逐渐扩大[2],本文主要对技术问答社区的知识交流效率进行研究,根据实际得到的数据结果,有针对性地提出优化和管理措施,从而增强用户知识交流效果以及创新力度,助力技术问答社区的持续发展。
“开源中国”社区是目前国内最大的开源技术社区[3],自2008年创办以来,致力于为IT开发者提供发现、使用和交流IT技术的问答平台,本文选取“开源中国”社区中最热门的15个标签板块作为用户知识交流的数据来源。首先,在梳理和总结已有文献成果的基础上,为测算技术问答社区知识交流效率投入产出值构建相应的评价指标体系;其次,采用数据包络分析方法中的SBM(Slack Based Measure)模型和Malmquist指数计算知识交流静态和动态效率值;再次,根据测算结果,对影响技术问答社区知识交流效率的主要因素进行分析;最后,根据所得出的结论,提出合理化建议,以期为促进技术问答平台知识交流,提高其知识创新水平提供参考意见。
2 相P研究
2.1 问答社区
目前,国内外学者对于问答社区的研究主要关注用户信息行为、用户问答质量以及社区间的对比等方面。关于用户信息行为的研究主要集中于知识贡献方面,例如,刘雨农等以知乎网“疫苗”话题为样本,研究虚拟知识社区的社会网络结构特征及影响因素,发现其用户关系是多层次、块状分布的,存在知识生产者和需求者两个中心,其中核心用户比边缘用户更倾向于贡献知识[4]。Z. Liu等研究发现知识贡献行为是用户在问答社区中获得所需信息的前提条件,其中用户的参与、兴趣和关联性等因素对用户的回答意愿有重要的影响[5]。J. H. Jin等研究发现用户的自我呈现、其他成员的认知和社会学习机会对知识贡献行为都有正向影响[6]。关于问答质量方面的研究主要以影响因素的特征为主,例如,沈洪洲等以知乎社区为研究对象,总结了10个对回答内容质量具有潜在影响的基本特征,回答内容的标注数量越多,重点内容及结构就越清晰,回答内容质量越高,同时,用户更易认同情感倾向积极的回答[7]。王伟等以知乎社区为研究对象,着重挖掘了答案及其编写者的特征,并通过逻辑回归、支持向量机和随机森林3种方法构建特征模型,对答案质量进行全面预测[8]。关于社区间对比方面的研究主要集中在中外社区运营视角的功能建设上,例如,李丹选取Quora和知乎进行对比,着重从产品性能、运营管理和用户特征3个层面展开分析,结果发现Quora拥有十分精准的功能定位、更简洁的功能区划分,相比知乎具有更多优势和成功经验[9]。万莉通过测度小木虫和人大经济论坛8门学科的知识交流效率,发现人大经济论坛知识交流效率和规模效率低于小木虫论坛,纯技术效率高于小木虫论坛[10]。
通过现有研究成果可以发现,国内外学者关于问答社区的研究主要集中于信息行为中知识贡献的研究,少数学者对问答质量的影响因素展开了研究,而对于社区间对比的研究较为匮乏且时间较为久远,并未涉及近年来的发展状态。其中,知识贡献主要涵盖了提出问题和浏览信息[11],而提问量与浏览量即可代表问答社区的活跃度[2],因此,本研究把问答社区中研究相对成熟的知识贡献作为指标体系,把能够反映主题使用情况的热门精选板块作为决策单元,以此为基础利用数据包络分析法对技术问答社区知识交流效率的测度展开研究,以期丰富问答社区的研究。
2.2 知识交流效率
目前,国内外学者尚未就问答社区知识交流效率展开研究,由庞建刚等[12]对虚拟学术社区的定义可知,问答社区可以被视为虚拟学术社区的一个子类。当前,对虚拟社区知识交流效率的研究主要集中于效率测度与影响因素两个方面。对于效率测度方面的研究主要基于数据包络分析法,例如,宗乾进等在2014年首次提出了知识交流效率评价指标体系,以科学网博客8个学科为例,采用数据包络分析法(Data Envelopment Analysis,DEA)方法进行了静态分析[13];晋升在DEA方法的基础上进一步拓展了Malmquist指数方法对小木虫论坛12个板块的知识交流效率进行研究[14];杨瑞仙等以在线健康社区“丁香园论坛”为对象,剔除外生因素后基于三阶段DEA模型对其中5个板块进行了研究[15]。也有少数学者采用其他研究方法,例如,庞建刚等选取经管之家论坛的3个区域为对象,采用随机前沿分析法(Stochastic Frontier Analysis,SFA)及Kernel方法对知识交流效率及其动态演化进行研究[12];胡德华等以4个学术虚拟社区的16个版块为样本,运用遗传投影寻踪算法进行知识交流效率的综合评估[16]。关于影响因素的研究主要通过结合效率测度进行综合分析,例如,吴佳玲采用Super-SBM方法及Tobit模型对小木虫论坛的知识交流效率及影响因素进行了分析[17];袁永旭等以丁香园论坛为研究对象,运用SBM(Slack Based Measure)模型和Tobit模型进行知识交流效率和影响因素的研究[18]。
nlc202206071510
转载注明来源:https://www.xzbu.com/1/view-15432968.htm