基于维度变化的矩阵增量属性约简算法
来源:用户上传
作者:闫俊辉
摘 要: 随着计算机网络技术和人们生活节奏的加快,生活中很多数据都在随时发生着变化,那么快速及时的解决数据变化后的属性约简问题,就成了信息技术领域里研究的一个重要课题。剖析了数据更新后相对知识粒度和等价关系矩阵的增量机制,提出了对象属性值增加后的基于矩阵方法的增量属性约简算法。下载了2组UCI数据对提出的增量属性约简算法进行了测试,结果证明了增量属性约简算法能够处理属性值增加后的属性约简问题。
关键词: 属性约简; 知识粒度; 等价关系; 矩阵; 增量机制
中图分类号:TP18 文献标识码:A 文章编号:1006-8228(2022)04-47-04
Matrix incremental attribute reduction algorithm based on dimension change
Yan Junhui
(Yuncheng University, School of Mathematics and Information Technology, Yuncheng, Shanxi 044000, China)
Abstract: With the acceleration of computer network technology and people's pace of life, a lot of data in life are changing at any time. Quickly and timely solving the problem of attribute reduction after data changes has become an important topic in the field of information technology research. In this paper, the incremental mechanism of relative knowledge granularity and equivalence relation matrix after data update is analyzed. Then an incremental attribute reduction algorithm is proposed, which is after object attribute value increasing and based on matrix method. Finally, two groups of UCI data are downloaded to test the algorithm, and the results show that the incremental attribute reduction algorithm can deal with the attribute reduction problem with increased attribute values.
Key words: attribute reduction; knowledge granularity; equivalence relation; matrix; incremental mechanism
0 引言
近些年,算机网络、通信以及存储技术的快速发展,使得各行各业信息系统都有大量的数据积累,其对象的属性值会发生动态变化。例如医院里医教科和人事科都有医生的信息,在整合医教科和人事科的医生信息时,信息系统的属性值会发生变化。此时,如何在原来的数据分析基础上,快速更新对象的属性值增加发生变化后决策信息系统的约简问题,成为信息科学研究领域普遍关注的热点。假若使用非增量属性约简算法[1-3]处理动态的数据属性约简,并不能充分利用先前计算的结果,导致运行速度减慢。
为了克服非增量属性约简算法在解决动态变化数据时属性约简的缺陷,很多学者提出了增量属性约简算法。Wang等通过分析三种信息熵在属性动态增加情况下的增量变化机制,设计了基于信息熵的一种增量属性约简算法[4];根据属性在动态增加和减少时决策信息系统中信息粒度的变化规律,Qian等提出了正向近似和逆向近似,并将其成功应用在启发式属性约简算法的加速中,为粗糙集基础上优化知识发现性能提出了新思路[5];王磊等分析了矩阵方法计算相对知识粒度在对象属性集动态变化时的增量更新原理,探讨了一种属性动态变化下增量属性约简算法[6]; Jing讨论了决策信息系统属性值细化时实现快速计算约简问题的相对知识粒度和计算等价关系矩阵的增量机制,设计了基于对象属性集增加时的动态属性约简算法[7];Shu等在不完备的系统中,讨论了对象属性集在动态增加或删除时基于正区域的决策信息系统动态属性约简算法[8]; Zeng等提出了新的混合距离的概念,并结合高斯核和混合距离,探讨了决策信息系统在属性值细化下的属性约简增量更新机制,提出了基于模糊粗糙集的混合决策信息系统动态属性的约简算法,并对该算法进行了实验验证[9]。通过以上分析,对信息熵和正区域的更新是大多数增量算法实现快速获取属性增加后决策信息系统约简的主要途径,而利用更新知识粒度的方法实现快速获取属性值细化后决策信息系统的约简算法研究很少。
利用矩阵计算处理数值是一种非常有效的方法,已被广泛应用到数值分析、知识发现和系统工程等诸多学科领域。针对决策信息系统如何快速地更新变化后的决策信息系统约简问题,首先探究了矩阵计算变化后的决策信息系统等价关系矩阵和相对知识粒度的增量机制,然后设计了增加对象及其方法,最后通过UCI数据仿真实验的结果,验证了所提出的增量属性约简算法可以有效处理对象的属性值增量后的属性约简问题。
nlc202204151817
转载注明来源:https://www.xzbu.com/8/view-15428563.htm