基于决策树算法的电商化电力物资判别
来源:用户上传
作者:
摘 要:国网于2016年提出并开始实施电商化采购模式。当前的目标是要形成科学合理的物资判别规则,因此立足于相关工作文件规定,从其物资的规格型号、国家法律规定、需求频次以及年度需求数量几个业务特征出发。将近两年采购记录数据与决策树算法相结合,得出了决策树模型,总结出了电商化物资判别的规则。并将相应规则转化为了易于理解和操作的“IF—THEN”语言,使得该研究能够应用到实际的电商化采购业务中,得到了新的二级电商目录。
关键词:决策树算法;电商化采购;电力物资
中图分类号:F25 文献标识码:A doi:10.19311/j.cnki.1672-3198.2020.01.023
0 引言
近年来,互联网在各行各业中得以广泛的应用,移动互联网技术也得到了极大的发展,国家《2016 年电子商务和信息化工作要点》提出要深入实施“互联网+ 流通”行动。国网响应国家的号召,顺应发展的潮流,于2016年开始实施电力物资的电商化采购。电商化采购是指通过适用的采购策略确定一定时期内的供应商,明确物资的品类(或规格型号)、单价(或双方认可的计价规则)、配送及服务标准,并在零星物资采购管控平台开展请购,实现操作界面简单直观、采购过程规范快捷、配送服务高效优质的目标。虽然电商化采购模式相较于传统采购具有独特的优势,但并不是所有的电力物资都适合电商化采购模式,所以确定电商化采购目录非常重要。而确定适合电商化的物资,需要先确定其判别规则,然后将规则应用到电力物资判别中,最终形成电商化采购专区目录。
决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。该方法被广泛应用于遥感图像、疾病、林业等各方面的分类,更有学者将其应用于协议库存物资的判别上,但尚未有人将其应用于电商化采购物资。本文将是否适合电商化采购看作两类物资,利用决策树算法进行归纳,得出判别规则,筛选出适合电商化采购的新物资,最终形成新的二级专区目录。
1 指标及数据的获取
1.1 特征指标选取
根据电商化采购特点总结得出的电商化采购判别决策树模型,决策节点都是定性的判断,不适合大量而复杂的物资小类判别,需要进一步量化。而规格品种多、需求频次高、数量无法准确等业务特征无法从零星物资基础采购数据中获取,需要将其特点转化为适用的数据指标。
其中,零星物资一种定义是指的生产耗值较低的物资;另一种定义是指零星采购的物资,零星采购指的是一些金额小、零散的采购行为。《国家电网公司零星物资电商化采购和供应工作规范(试行)》中指出,零星物资包含办公用品、办公电器、办公家具、办公日用、化工、仪器仪表、信息化通信设备、低压电器、生产工器具、劳保用品、五金建材、配件等。由上可知,零星物资的划分可以从所属“大类”以及物资自身的价值(即单价)入手。即将该部分指标选取为“物资大类”和“单价”。
电力物资的基础划分是以大类、中类、小类三级标准进行的。本文研究的目标主体是二级专区的物资目录,最终确定的物资属于物资小类,同一个小类的物资编码(物料ID)是相同的。所以“采购规格品种多”可以从物资小类下的物料描述中的规格种类数和同一小类物资的供应商数来确定。该部分的业务特征细化的数据指标为“规格品种数”。
“需求频次高”这一条件来源于,电商化采购相较于传统集中采购(招标采购等)能够做到随需随采,能够有效减少单次采购的组织成本。从采购周期和相应部门工作周期的角度考虑,该部分指标的选取应选择年度业务特征指标,且在考虑整体需求频次的同时还需要考虑需求在时间上的分布。综合考虑以上因素,最终数据指标确定为“年需求频次(年度需求申请订单数)”。
“数量无法准确预测”的要求是由于电商化采购相较于集中采购,没有采购的组织成本限制,在单次采购的数量上更加灵活。数量无法准确预测的物资进行集中采购,就容易造成“缺货”或者“赘余”的现象,从而导致成本的增加。数量无法准确预测可以理解为年度需求不稳定,数据指标可以选择“采购数据的变异系数”或者“年均采购数量”和“年采购数量标准差”。最终考虑决策树及判别规则的实用性和简化性,选取“采购数据的变异系数”作为模型分类指标。
将初步生成的电商化采购判别决策树模型与指标选取的可得性原则、有效性原则相結合,进一步细化得出4个数据指标,指标选取情况如表1所示。
1.2 指标数据获取
决策树算法应用在的判别特征为是否属于电商化物资,业务特征指标数据需要覆盖到已有电商化专区数据和未加入电商化采购物资的ERP系统数据。其中属于电商化采购的物资采用电商化二级专区数据,不属于电商化采购的物资采用ERP专区订单数据,此次需要重新进行判别的物资不纳入原始模型的建立数据采集。
综合考虑决策树算法本身对于数据量的要求,模型建立所用数据从17年76000余组采购记录和2018年437541组数据中总结提取,一共包含658个小类2年的数据。
2 量化决策树判别模型
国网现在实行的二级电商化目录中将一次设备、二次设备、智能变电站二次设备、装置性材料、辅助设备设施、工器具、建筑材料、劳保类用品、配件、燃料化工、五金材料、仪器仪表、办公类用品、低压电器14个大类中的部分物资划分为零星物资。又在《658标准内小类采购策略分析》中建议将金属材料和信息设备的部分小类纳入电商化采购。二级采购目录中一共包含一次设备、二次设备、智能变电站二次设备、装置性材料、通信设备、辅助设备设施、工器具、建筑材料、金属材料、劳保类用品、配件、燃料化工、五金材料、软件、信息设备、仪器仪表、办公类用品、低压电器18个大类,除去上文提到的16个大类还剩下软件和通讯设备两个大类。从统计的数据分析,软件大类品种规格少、单价普遍偏高、需求频次少,且软件系统的技术要求高,不适合纳入电商化采购;《国网河南省电力公司2019年度二级采购目录》中关于软件大类给出的建议采购方式均为公开招标。通过同样方式的分析,通信设备大类中仍有部分小类可能适合电商化采购,所以将零星物资的大类要求定为除软件大类外的17个大类。此外,通过对电商专区采购的2017年、2018年以及2019年的部分数据分析可知,2017年二级电商专区采购的物资中,单价最高的是大类为仪器仪表,中类为型式试验设,小类为电气性能试验设备的HVDKJ-35型空心电抗器匝间绝缘检测装置,价格为1584000元;2018年二级电商专区采购的物资中,单价最高的是大类为仪器仪表,中类为电气标准器及检测装置,小类为综合自动化系统校验仪的综合自动化系统校验仪,价格为1050000元;2019年部分二级电商专区采购的物资中,单价最高的是大类为仪器仪表,中类为大地测量、测距仪器,小类为激光指向仪的激光器,价格为594224.14元。故而,将零星物资的单价节点定为三年来的最高值1584000元,即单价低于1584000元的小类属于零星物资。 通过对采集到的数据进行统计分析得知,品种规格数多集中在8种以下,可见品种规格在8及8种以上属于不常见情况,可将其划分为“采购规格品种多”的情况。因此,指标“品种规格数”的划分节点可以定为8种,即品种规格在8种及以上(7种以上)的物资适合电商化采购。
电商化采购优于集采的一大特点就在于其敏捷性,克服了集采的流程较长、响应需求的能力迟钝,造成采购时效性较差的不足。所以从需求频次这一指标来区分集采和电商化采购,可以立足于该特点——通过对国网阳光电子商务平台发的公告可知,国网河南电力每年有三批公开招标的物资。表明零星物资如果需求频次在三次以上就肯定需要等待招标的时间,需求的满足会滞后,受到了集采采购时效性差不足的约束,从而该部分物资可以纳入电商化采购,利用电商专区采购的灵活性、敏捷性来解决该部分物资需求频次高的问题,即将年需求频次在3次之上的纳入电商化采购的范围。
年采购数量难以预测的特征用年采购数量的变异系数来衡量,变异系数是综合考虑了年均采购数量以及年采购数量标准差之后的指标,变异系数越大说明年度采购数量的波动越大,也就是数量预测的难度越大。当该指标取值为0.5时,表明该小类物资2017与2018年的采购数量差距在1倍以上,该种情况的波动性已属于较大的情况,可将其划分至年采购数量难以预测的部分。
量化后决策树模型如图1所示。
3 判别规则落实
研究最终形成电商化采购二级专区目录,需要从ERP导出数据、电商专区数据以及国网河南电力的二级采购目录意见出发,涉及的物资达18个大类,近2000个小类。如果以人力按照生成的决策树判别模型逐一进行判别,不仅会因为数据量庞大而耗时耗力,还会由人力的不可控性导致误判。为解决这一难题,需要将生成的决策树判别模型转化为可用软件操作的机器语言或是可以批量判别的简单规则。
决策树模型的相较于其他分类模型的优点之一就是,决策树模型能够转化为易于理解和操作的“if—then”规则,该类型规则既可以转化为Access数据库中常用的SQL语言进行操作,也可以轉化为Excel中的多重if条件进行判别。所以,为了解决涉及判别物资小类过多的问题,下面将模型转化为判别规则。
将决策树判别模型转化为“if—then”规则如下所示:
if“大类”=“软件”,then print “非电商物资”,
elseif 单价>1584000,then print “非电商物资”,
elseif 品种规格数>7,then print “电商物资”,
elseif 年需求频次>3,then print “电商物资”,
elseif 年需求变异系数>0.5,then print “电商物资”,
else ,print “非电商物资”。
论文将形成的判别规则与2017与2018年的ERP采购数据相结合,最终形成了新的有科学依据的电商二级专区目录。
4 结论
本文研究了符合当下“互联网+”趋势的电商化采购模式中的物资判别。从该目标“采购规格品种多、需求频次高、数量无法准确预测且不属于国家法定必须招标”的业务特征出发,结合2017和2018年两年的电商化采购专区数据和ERP系统数据,运用决策树算法,研究得出了电商化物资判别的规则决策树模型,并将其转化为可执行的机器语言。最终将模型转化成了可实际操作的判别方法,实现了科学合理的电商化物资判别,形成了新的有科学依据的电商二级专区目录。
参考文献
[1]罗来平,宫辉力,刘先林,等.基于决策树算法的遥感图像分类研究与实现[J].计算机应用研究,2007,24(1):207-209.
[2]吴生根,陈武,欧剑鸣,等.福建省2008-2013年手足口病重症病例危险因素的分类决策树分析[J].中国卫生统计,2015,32(6):1040-1041.
[3]雷光斌,李爱农,谭剑波,等.基于多源多时相遥感影像的山地森林分类决策树模型研究[J].遥感技术与应用,2016,Issue(1):31-41.
[4]李爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,22(1):17-21.
[5]彭汐单,罗华清,袁宏波,等.基于决策树算法的协议库存采购策略研究[J].江西电力,2018,(7).
转载注明来源:https://www.xzbu.com/2/view-15108702.htm