您好, 访客   登录/注册

论现代的维吾尔语情感分析方法进展

来源:用户上传      作者:

  摘要:情感分析就是对舆论的现状及其变化趋势进行研究的技术。其次介绍了近几年来的国内汉语,藏语和哈萨克语等部分语言的情感分析研究现状进展,最后重点介绍了维吾尔语近几年来的情感分析研究使用的方法和处理的算法。
  关键词:情感分析;算法;处理方法
  中图分类号:TP393
  文献标识码:A
  文章编号:1009-3044(2020)04-0178-02
  1 概述
  由于党和政府非常重视少数民族与语言研究的同步发展。维吾尔语情感词的获取并创建情感词典是识别文本情感倾向性和情感分析的基础,给网络舆情分析和网络内容安全提供基础性资源[1]。本文主要是对近几年国内情感分析技术的发展和现状总结的基础上,对已有的维吾尔语情感分析技术研究成果进行整理总结。
  2 国内情感分析技术进展
  2.1 汉语情感分析技术进展
  2014年,梁军等人提出了基于深度学习的微博情感分析方法使用于递归神经网络进行情感分类[2]。2015年李婷婷等人提出了基于SVM和CRF多特征组合的微博情感分析方法,通过多组实验使情感分析效果更优。2017年刘臣等人利用特征与情感词在位置上的邻近关系,提取情感词并组成特征一观点对,通过点互信息方法进行情感倾向分析。2018年张璐等人提出基于情感计算的网络社区舆情分析预警技术研究,结合文本的情感特征,应用自然语言处理技术实现文本的预处理,实验结果表明此研究为网络社区的舆情分析预警提供了有力的支持川。
  2.2 藏语情感分析技术进展
  2015年杜雪峰等分别提出了基于规则的藏文句子的情感倾向性分析方法和基于统计的藏文句子的情感倾向性分析方法,两个方法的F值分别达到了68.9%和82.8%[3]。2018年,闰晓东等提出了本文提出的基于情感词典的藏语文本句子情感分类方法在一定程度上可以对藏文句子进行情感分类。其中,中性类别的召回率达到95.76%[4]。
  2..3哈萨克语情感分析技术进展;
  2011年新疆大学的王晓莉古里拉.阿东别克等人提出一种机器识别哈萨克语句情感的模型,使用条件随机场cRF's(collditional RaJldom Fields)对哈萨克语句中的情感关键词进行机器识别,在此基础上结合语句逻辑结构分析,能初步判断出哈萨克语句的喜、怒、哀、俱情感倾向,拓宽了哈萨克语言计算机处理的范围[5]。2015年新疆财经大学的孙瑞娜等人提出了情感词汇自动获取机制。實验表明,哈萨克语情感词汇自动获取正确率达到74.2%,该方法是有效的。
  3 在中国现代维吾尔语情感分析方法进展
  3.1 现代维吾尔语情感分析方法进展
  2012年黄俊等提出基于自动标注的维吾尔语情感词分析句子情感的方法,最终得到句子的情感类型。李响等提出基于深度学习的维吾尔语文本情感分析方法,完成基于深层语义和句法信息的维吾尔语名词短语指代消解任务。2017年吾守尔·斯拉木等结合维吾尔语文本的特点,建立维吾尔文情感语料标注规范,利用Python语言构建集数据采集与标注为一体的情感标注平台,最后构建在舆情分析和舆情监控中可以应用的维吾尔文情感语料库。实验结果表明,提高情感语料库的质量,情感语料库可以用于舆情分析任务。2018年热西旦木·吐尔洪太词典与机器学习方法相结合的维吾尔语文本情感分析的方法,此方法的正确率比单独使用机器学习方法提高了9.13%比词典方法提高了1.82%。2019年帕丽且.木合塔尔等提出了维吾尔语情感语音合成采用韵律边界预测方法,实验结果证明,本文提出的方法情感分类F1值比SVM-bigram方法提升了9.32%[8]。表1所示在中国现代维吾尔语情感分析方法特征情况。
  3.2 现代维吾尔语情感分析算法进展
  年梅等提出了利用中文极性情感词典HowNet,选择并翻译为维吾尔语词汇,借助于维吾尔语同义近义词词典,最后设计了基于维吾尔语极性情感词和权值相结合的加权句子情感极性判定算法,证明了本算法进行维吾尔语句子褒贬情感性分析基本是有效地。李冬白等提出基于深度学习的维吾尔语语句隐式情感分类算法,通过softmax分类器完成维吾尔语语句分类[6]。刘若兰等提出候选情感词识别算法,实验结果表明,与扩展前的情感词库相比,使用互联网文本语料扩展后的情感词库后进行维吾尔语句子倾向性测评的准确率和召回率均有明显提高。李敏等提出采用深度学习算法进行基于深层语义的维吾尔语句子级情感分析任务,根据维吾尔语语言特性,考虑词性、情感词、转折连词,否定成分等对情感倾向性的影响,从词汇和句式两个抽象层次共提取了8项情感特征,利用栈式自编码算法无监督的学习文本的深层语义特征[7]。
  参考文献:
  [1]玛尔哈巴·艾赛提,艾孜尔古丽,玉素甫.艾白都拉.基于语法
  的维吾尔语情感词汇自动获取[J].中文信息学报,2017,31(1):126-132,139.,
  [2]梁军,柴玉梅,原慧斌,等.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161.
  [3]杜雪峰.藏文句子倾向性分析研究[D].北京:中央民族大学,2015.
  [4]闫晓东,黄涛.基于情感词典的藏语文本句子情感分类[J].中文信息学报,2018,32(2):75-80.
  [5]王晓莉,古里拉.阿东别克.哈萨克语语句情感识别研究初探[J].计算机应用与软件,2011,28(8):20-23.
  [6]李冬白,田生伟,禹龙,等.深度学习的维吾尔语语句隐式情感分类[J].计算机工程与设计,2016,37(9):2577-2581.
  [7]李敏.基于深度学习的维吾尔语文本情感分析[D].乌鲁木齐:新疆大学,2017.
  [8]帕丽旦.木合塔尔,买买提阿依甫,杨文忠,等.基于BiRNN的维吾尔语情感韵律短语注意力模型[J].电子科技大学学报,2019,48(1):88-95.
  [通联编辑:光文玲]
转载注明来源:https://www.xzbu.com/8/view-15161826.htm