基于粗集理论的重庆水运显著性因素分析
来源:用户上传
作者: 臧文亚 刘文娜 詹泽东
摘要:本文在建立了重庆水运可持续发展评价指标体系的基础上,以粗集理论和Rosetta软件为工具,提取出了相应的决策规则,并找到了影响重庆水运可持续发展的显著性因素,可以为重庆水运有关部门进行水运建设、规划和决策时提供参考。
关键词:重庆水运 粗集 显著性因素 Rosetta
对于企业来说,面对残酷的竞争,如何在市场中生存、发展,具有重要的意义。对于重庆水运来说,如何提高部分关键指标来促进其发展,具有重要的现实意义。
传统的决策方法是凭决策者的经验和感觉来进行决策,但是由于决策者的主观性较大,而决策对象又处于一种严重不确定的状态,决策数据难免有遗漏或错误,无法精确建模,导致有效数据的损失较为严重。由Pawlak提出的粗集理论1为处理信息粒度提供了一种形式化的框架。粗集理论利用信息表描述论域中的对象,利用信息表描述决策形势。粗集理论被证明是分析多种多属性决策问题的有用工具,它以独特的方式回答了关于决策形势的解释和行动建议的问题。
为解决传统决策方法带来的不精确,本文采用粗集理论,粗集作为一种软计算方法,可以克服传统不确定处理方法的不足,并且和它们有机结合,进一步增强对不确定、不完全信息的处理能力。通过基于粗集决策因素的分析方法,利用Rosetta软件,提取了整个指标体系和发展可持续系数之间的决策规则,并找到了影响重庆水运可持续发展的关键因素,可以为重庆水运有关部门进行水运建设、规划和决策提供参考。
1、粗集理论决策分析
粗糙集理论的主要优势之一是不需要预先给定某些特征或属性的数量描述,即,它不需要任何预备的或额外的有关数据信息。自粗集理论提出以来,许多专家对粗糙集理论及其应用进行了大量的研究工作,使之在理论上日趋完善,越来越受到国际上的广泛关注。
1.1 粗集基本思想
粗集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题分类规则。粗集理论通过信息表来表达知识,信息表由对象集、对象的属性集、属性的值集以及每一属性到属性值的映射关系组成。粗集依据属性的不可分辨关系将论域划分为不同的类,每个类中给定属性的取值都相同。粗集分析属性的重要性及属性之间依赖关系,通过对信息表约简,在保持知识系统分类能力不变的情况,得到最小的规则集。
1.2 粗集理论基础
定义4 知识约简是粗糙集理论的核心内容之一。知识约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的东西。
2、粗集决策分析实例
以2005-2009年重庆水运可持续发展指标值和评价值为决策表对象,即,X1―航道总里程;X2―等级航道;X3―生产性泊位数量;X4―港口通过能力;X5―堆场总面积;X6―仓库总面积;X7―船舶数量;X8―船舶总载重;X9―船闸数量;X10―水运业就业人数;X11―规费收入;X12―货运量;X13―货运周转量;X14―客运周转量;X15―港口吞吐量;X16―水运业GDP占整个社会的比重;X17―货运量占总货运量比重;X18―货运周转量比重;X19―客运量占总客运量比重;X20―等级航道比重;X21―航道船舶密度;X22―单位运输成本;X23―千吨公里燃料消耗;X24―船舶废弃物排放达标率;X25―港口废弃物排放达标率;X26―事故发生次数;X27―事故经济损失。以上述27项指标属性为条件属性,以可持续系数为决策属性, 构成智能决策表系统。
则决策表表示为:本决策表系统有条件属性27个,人工约简非常复杂, 计算量大, 因此利用Rosetta软件可以较快解决该问题。结合评价指标体系, 可以建立了2005-2009年可持续发展决策表。
2.1 属性数据离散化
粗集的数学基础是集合论,为处理离散属性提供了很好的工具,但是难以直接处理连续的属性,而重庆水运指标数据大多是连续的,因此用粗糙集方法处理这些数据时,必须首先对其进行离散化处理。这里选用等频算法对训练子表进行离散化。根据grade值分布特点,为了分类具有代表性,用人工离散化法将其分为1、2、3 档,分别对应值(0,0.4),[0.4,0.5],(0.5,0.61],离散结果如表1所示:
表格 1 数据离散表
2.2 属性数据约简
属性约简是在属性集的所有相对约简中,寻求包含条件属性最小的属性集,选择基因算法对评价指标进行条件属性约简,由于约简得到的规则非常多,需要参考的是处于3档的规则,故对规则以值(0.5,0.61] 进行过滤,共得到94个规则,其中8个最小约简对应的规则为
。如表2所示:
表格 2 约简保留结果
2.3 显著性因素分析
由上述过程可知,为了迅速提高重庆水运可持续发展能力,重庆市政府等有关部门决策时应首先考虑控制其中几个关键的指标,即提高X2-等级航道,X6-仓库总面积,X7-船舶数量,X13-货运周转量,X14-客运周转量,X16-水运业GDP占整个社会的比重,X17-货运量占总货运量比重,X18-货运周转量比重,X19-客运量占总客运量比重,X21-航道船舶密度,X25-港口废弃物排放达标率等指标,并且相应的降低X22-单位运输成本,X23-千吨公里燃料消耗,X26-事故发生次数,X27-事故经济损失等指标。当同时考虑多个因素以及各个指标改变量时,再结合以上规则进行定量决策,能够简单有效地控制重庆水运向可持续方向发展。
3、结论
对于决策者来说,如何抓住解决问题的重点是一个至关重要的问题,而粗集理论恰恰就是一个非常实用的方法。由于粗集理论和其它软计算方法相结合,能够提高数据挖掘的能力。本文以粗集理论和Rosetta软件为工具,结合重庆水运可持续发展的综合评价结果,构造了相对应的决策表系统,并运用Rosetta软件,提取出影响重庆水运可持续发展各种状态的规则,为重庆政府有关部门提供了可以参考的决策规则。
参考文献:
[1]安利平.基于粗集理论的多属性决策分析[M].科学出版社,2008.6.
[2]龚灏,马致远,周仲礼.基于粗集理论的成都市交通可持续发展决策规则[J].成都理工大学学报( 自然科学版),2008,35(5):566-571.
[3]重庆市统计局.重庆年鉴2010[M].中国统计出版社,2010.8.
[4]SWINIARSKI R W,HARGIS L.Rough sets as a front end of neural2 networks texture Classifers[J].Neurocomputing,2001,36:85-102.
转载注明来源:https://www.xzbu.com/1/view-240911.htm