您好, 访客   登录/注册

基于网络爬虫技术的元宇宙评论文本挖掘分析

来源:用户上传      作者:潘天岳

  摘要:元宇宙是连接虚拟与现实的超级数字媒介,将引领未来世界的互联网变革,也将对个体用户的网络生活产生深刻影响。利用网络爬虫技术对Bilibili视频弹幕网站上的274个元宇宙相关视频页面进行爬取并得到3 070条评论,通过对所得评论进行文本词频分析、构建词云图、共词分析、社会网络和语义网络分析以及情感分析,发现Z世代用户对元宇宙这一概念拥有基本认知;元宇宙在游戏领域的应用备受Z世代用户关注;大量用户认为元宇宙是资本套利的工具,将对个人与社会产生消极影响;部分用户对元宇宙相关技术的实现持怀疑态度。以上结论揭示了Z世代用户对元宇宙这一新技术的感受和评价,对元宇宙的引入、推广与创新具有参考价值。
  关键词:元宇宙;网络爬虫;文本挖掘;词频分析;共词分析
  中图分类号:TP391文献标志码:A文章编号:1008-1739(2022)05-63-4
  0引言
  2021年10月28日,Mark Zuckerberg宣布Facebook将正式改名为Meta,由此在全球引发元宇宙的热潮。元宇宙这一概念由美国作家Neal Stephenson在科幻小说《雪崩》中首次提出,其含义是一个与现实世界相平行的虚拟世界,所有生活在现实中的人类都有一个网络化身,从而能与虚拟人在元宇宙中共同生活。伴随技术进步,如今元宇宙被定义为集各种数字技术于一体、连接现实与虚拟世界的超级数字媒介,其本质是对未来社会形态的描L与建构[1]。
  作为年轻的“互联网原住民”,出生于1995―2009年的Z世代,将在未来成为元宇宙用户群体的重要组成部分,其社会生活也将因元宇宙而发生改变。为了解Z世代群体对于元宇宙这一新兴概念的认知与评价,本文利用网络爬虫技术对拥有庞大Z世代用户群体的视频弹幕网站(Bilibili)进行数据挖掘,并对得到的评论文本进行文本词频分析、构建词云图、共词分析、社会网络和语义网络分析以及情感分析,对今后元宇宙相关产业的发展具有一定借鉴意义。
  1数据采集
  网络爬虫是一种自动下载网络资源的程序[2]。网络爬虫能够从指定的视频网页出发,通过分析网页内的标记结构,获取指向其他页面的超级链接,然后根据既定的搜索策略选择下一个要访问的站点[3]。本文利用后羿采集器对Bilibili视频弹幕网站进行数据爬取,最终得到274个元宇宙相关视频的3 070条评论。
  2数据分析
  2.1词频分析
  使用ROST Content Mining 6软件分析所得评论文本。首先,进行分词处理。由于网络的快速发展以及新技术的大量涌现,ROST Content Mining原有的自定义词表已无法满足本文的分析要求。通过扩充自定义词表,元宇宙、虚拟现实、增强现实等新兴专有名词能够被完整保留,分词结果也因此更加精准、有效。
  经过排除单字词、排除“罢了”等停用词、输出排名前50的词语等操作后,得到元宇宙相关评论中高频词的统计结果如表1所示。剔除掉主题词元宇宙后,综合来看,在Bilibili视频网站上的元宇宙相关评论中,与元宇宙概念相关的关键词出现频次最多,如:“现实”(6.8%),“人类”(3.7%),“虚拟世界”(3.5%)等。
  2.2词云图
  词云由西北大学教授Rich Gordon于2006年首先提出并使用。词云图通过关键词云层或关键词渲染过滤大量文本信息,并对评论文本中出现频率较高的关键词进行视觉突出,使观者简单浏览词云便可明确文本主旨[4]。
  本文利用微词云生成了元宇宙相关评论词云图,如图1所示,清晰地显示了“现实”“人类”“技术”“概念”“世界”“资本”等高频词汇,并以文字粗细、深浅、大小对不同关键词的出现频次进行区分。
  2.3共词分析
  共词分析是通过统计文本中集中出现的词汇,分析某一研究主题或研究方向的专业术语共同出现在一个评论文本中的现象[5]。本文运用ROST Content Mining 6软件对评论文本完成提取高频词、过滤无意义词、提取行特征、构建网络、构建矩阵等操作,统计每2个关键词共同出现在一个评论文本中的次数,进而形成原始共词矩阵(标题行与标题列相同,为便于显示,标题行用序号1~30替代)。原始矩阵中对角线上的数字表示对应关键词出现的总频次,如关键词“元宇宙”出现了1 010次,“现实”出现了306次;非对角线上的数字表示相应的2个关键词同时出现于一个文本的频次,如“元宇宙”与“现实”出现了124次,说明有124条评论文本同时使用了“元宇宙”与“现实”,部分元宇宙相关评论共词矩阵,如表2所示。
  在计量化共词分析中,为了真正反映关键词间的相互依赖程度,进而揭示其共现关系,需要对原始矩阵进行包容化处理,构建相关矩阵[6]。利用Microsoft Visual Basic for Applications以及Ochiai系数计算公式可将元宇宙相关评论共词矩阵转换为相关矩阵,部分元宇宙相关评论相关矩阵如表3所示。

nlc202205061843



转载注明来源:https://www.xzbu.com/1/view-15430443.htm

相关文章