您好, 访客   登录/注册

基于局部粗糙集研究不完备信息系统的理论

来源:用户上传      作者:刘瑶瑶

  摘 要:为了进一步有效处理不完备数据,本文将完备信息系统上的局部粗糙集理论扩展推广到不完备信息系统中,首先基于不完备信息系统的容差关系给出了局部粗糙集的定义,其次,研究了不完备信息系统上局部粗糙集的性质并基于不完备局部粗糙集给出了计算下近似的算法。最后,基于局部下近似的两部分,给出了不同的局部属性约简。
  关键词: 不完备; 局部粗糙集; 属性约简; 信息系统
  【Abstract】 In order to further effectively deal with incomplete data, this paper extends the local rough set theory on complete information systems to incomplete information systems. Firstly, the definition of local rough sets is given based on the tolerance relationship of incomplete information systems. Secondly, the properties of local rough sets on incomplete information systems are studied, and the corresponding algorithms of finding local low approxi is designed. Finally, different attribute reductions are proposed based on two parts of the local lower approximation.
  【Key words】  incomplete; local rough sets; attribute reduction; information system
  0 引 言
  粗糙集理论已成为不确定性管理和不确定性推理的有效工具,并已在人工智能领域得到了成功应用。粗糙集理论的优势在于是其所有的参数都是从给定的样本集中获得的,这可以从文献[1]中看出:“不精确的数值不是预先假设的,而是在近似值的基础上计算出来的,这里的近似值用来表达知识的不精确性”。迄今为止,粗糙集数据分析已广泛应用于特征选择[2-3]、模式识别[4]、数据挖掘[5]和知识发现[6]等。
  在粗糙集理论中,概念近似和属性约简[7]是2个非常重要的问题。概念近似包括:上近似和下近似。给定样本集U和二元关系R,可以构造其等价类[8],可以构建样本集上的任何子集的粗糙集、即上下近似。目前研究粗糙集时,必不可少地会提到Pawlak的经典粗糙集,但是在经典粗糙集中,可以看到集合的上下近似的计算需要扫描给定集合U中的所有对象,同时还要获得近似目标概念的信息粒子[9]。通常将这种粗糙集称为全局粗糙集,而研究即需标记数据[10]。然而,随着大数据时代的到来,标签数据是一件非常耗时费力的工作,为了解决时间复杂度的问题,文献[1]提出了一种新的理论框架:局部粗糙集降低了数据量大时下近似计算和属性约简的时间复杂度。但是在文献[5]中只考虑到了完备信息系统[9]下的局部粗糙集,尚未涉及到不完备[10]的问题。因为目前海量的数据中很多数据的值是不确定的,本文的研究就是在文献[5]的基础上引入不完备的思想,进一步研究上下近似的计算以及相关算法,该研究非常具有现实意义。
  本文的安排如下:首先简要阐述不完備信息系统、完备信息系统、以及局部粗糙集的相关概念;其次,基于不完备信息系统,重新对上下近似进行新的定义;接着,研究不完备信息系统下局部粗糙集的相关性质;而后,设计了计算不完备信息系统中局部粗糙集下近似的算法;最后,给出了全文总结。
  1 基础知识
  5 结束语
  本文在不完备信息系统中,引入了局部粗糙集的理论。讨论了在不完备信息系统的局部粗糙集的相关性质,重点是研究该系统下,如何计算下近似,也给出了计算下近似的相关的算法。
  本文只是在局部粗糙集和不完备粗糙集结合下的一个初步探索。基于本文的结果,可以深入研究局部属性约简的算法,以及进一步降低算法的时间复杂度等内容。
  参考文献
  [1]PAWLAK Z. Rough sets[J]. International Joumal of Computer and Information Sciences, 1982, 11(5):341-356.
  [2]BHATT R B, GOPAL M. On fuzzy-rough sets approach to feature selection[J]. Pattern Recognition Letters, 2005, 26 (7): 965-975.
  [3]ESKANDARI S, JAVIDI M M. Online streaming feature selection using rough sets[J]. International Journal of Approximate Reasoning, 2016, 69: 35-57.
  [4]SWINIARSKI R W, SKOWRON A. Rough set methods in feature selection and recognition[J]. Pattern Recognition Letters, 2003, 24 (6):833-849.
  [5]QIAN Yuhua,LIANG Xinyan,WANG Qi, et al. Local rough set: A solution to rough data analysis in big data[J]. International Journal of Approximate Reasoning,2018,97:38-63.   [6]陈志恩.基于粒关系包含度矩阵的属性约简[J].西北师范大学学报(自然科学版),2017,53(5):24-28.
  [7]张晶,李德玉,王素格,等. 基于稳健模糊粗糙集模型的多标记文本分类[J].计算机科学, 2015,42(7):270-275.
  [8]MA Fumin, ZHANG Tengfei. Generalized binary discernibility matrix for attribute reduction in incomplete information systems[J].The Journal of China Universities of Posts and Telecommunications, 2017,24(4):57-68,75.
  [9]SHAO Mingwen, ZHANG Wenxiu. Dominance relation and rules in an incomplete ordered information system[J]. International Journal of Intelligent Systems , 2005, 20(1):13-27.
  [10]YANG X B, YANG J Y, WU C. Dominance-based rough set approach and knowledge reductions in incomplete ordered information system[J]. Information Sciences,2008,178:1219-1234.
  [11]張文修,吴伟志. 粗糙集理论介绍和研究综述[J].模糊系统与学报,2000, 14(4):1-12.
  [12]WANG Guoyin. Extension of rough set under incomplete information system[C]∥2002 IEEE World Congress on Computational Intelligence. 2002 IEEE International Conference on Fuzzy Systems. FUZZ-IEEE'02. Proceedings (Cat. No.02CH37291).Honolulu, HI, USA: IEEE,2002:1098-1103.
  [13]罗豪,续欣莹,谢珺,等.基于扩展容差关系的不完备信息系统属性约简[J]. 计算机应用,2016,36(11):2958-2962.
  [14]DAI Jianhua, HUHu, ZHENG Guojie, et al. Attribute reduction in interval-valued information systems based on information entropies[J]. Frontiers of Information Technology & Electronic Engineering,2016,17(9):919-928.
转载注明来源:https://www.xzbu.com/8/view-15059411.htm