基于模糊C均值聚类算法的众包任务定价分析
来源:用户上传
作者:
[摘 要]针对“拍照赚钱”众包平台的一些任务分布相对集中的情况,提出一种打包定价方案。使用模糊C均值聚类算法根据任务分布与会员分布实际情况,将一些分布相对集中的任务按该模型进行打包定价,联合发布,使任务定价更加合理。同时缩短了调查周期,提高任务完成效率,使企业与会员互惠双赢。
[关键词]模糊C均值聚类;任务定价;
中图分类号:J51-4 文献标识码:A 文章编号:1009-914X(2019)06-0176-01
0引言
在大数据时代,信息的收集和数据真实性被广泛关注。“拍照赚钱”这种基于移动互联网的自助式劳务众包平台由此应运而生。用户通过APP领取需要拍照的任务,赚取APP对任务标定的酬金。方便企业进行各种信息搜集和商业检查,不仅节省了调查成本,而且有效地保证了调查数据真实性,缩短了调查周期。因此APP成为该平台运行核心,而其中任务定价又是关键要素。本文针对分布相对集中的任务进行打包处理,根据任务分布与会员分布实际情况调查数据进行分析[1-2],建立打包定价模型,提高任务完成效率。
1问题提出
在实际情况下,多个任务可能因为位置相对集中,导致用户会争相选择,一种考虑是将这些任务联合在一起进行打包发布。本文将基于模糊C均值聚类算法提出一种针对众包平台的打包定价模型,优化现有定价模型,提高任务完成率。
2模型建立
2.1模型准备
模糊C均值聚类算法是基于函数最优化方法的一种聚类算法。使用数值计算求取优化目标函数。根据每个样本点对其类中心的隶属度,决定样本点的类属,自动对样本数据进行分类,符合划分区域要求[3]。
把n个向量 划分为c个模糊组,对每个组求该组的聚类中心,令非相似性指标取得最小值。每个数据点是[0,1]范围内的某个值,作为隶属度表示其属于各组的程度。此时考虑到归一化原则,即一个数据集的隶属度之和等于1: (1)
得到FCM的目标函数为: (2)
其中 属于[0,1]; 为模糊组i的聚类中心, 为第i个聚类中心与第j个数据点之间的欧氏距离, 是一个加权指数。
根据拉格朗日条件极值,构造新的目标函数,得到使(2)式达到最小值的必要条件:
(3)
其中 到n是式 的n个约束式的拉格朗日乘数乘子。对变量求导,使(2)式达到最小值的必要条件是:
(4) (5)
根据上述两个必要条件,进行不断迭代来更新这两个值。FCM使用以下四个步骤确定聚类中心 和隶属矩阵 。
步骤1:取在[0,1]之间的随机数对隶属矩阵 初始化,使其满足约束条件式(1)。
步骤2:用(4)式计算聚类中心 。
步骤3:根据(2)式计算目标函数,如果它小于某个确定的阀值,或者它相对上一次目标函数的改变量小于某个阀值,则停止迭代。
步骤4:依据(5) 计算新的 矩阵,并返回步骤2。
由于不能保证FCM收敛于一个最优解,算法的性能依赖于初始的聚类中心。本模型采用每次使用不同的初始聚类中心启动该算法,并多次运行FCM,直至得到符合任务分布的区域划分情况。
根据附件中已显示各个地区任务分布情况及任务完成程度,对这些地区的任务分布使用模糊C均值聚类算法,进行打包聚合。
2.2模型求解
為避免任务发布位置相对集中,造成用户产生竞争,任务打包定价需根据可接受任务的会员分布密度以及会员实际条件给出。故应遵循下列3条原则:
1)充分考虑任务发布地区位置的发布数量及会员可接受任务数量与其的信誉度,维护该行业稳定性。
2)减少并尽量避免会员间的任务竞争,优化外包任务定价方案,充分考虑会员自身的信誉度、任务限额及可接受时间等因素。
3)保障任务发布者的收益利润,减少任务打包后的总金额,实现任务发布者与会员间利益均衡。
此时建立基于模糊算法的任务打包定价模型:
设X,Y为两个模糊矩阵, , ,规定X和Y的“交”与“并”的运算规则:“交”运算是两个对应元素取最小值,“并”运算是两个对应元素取最大值,即:
, (6)
设 为两阵的乘积,即: (7)
假设评价指标集为1行 列的矩阵 : (8)
对于每个评价指标的权重分别为 ,则权重集为:
(9)
评价集为: (10)
指标选取“打包任务数”,则评价集中对应选项可以为“少,较少,适中,较多,多”五种。在具体对某一打包任务进行评分时,每个指标 由成员对其状态所属的等级给出评价,可算出评价指标的相应隶属度 :
(11)
其中: --会员总人数, --对指标 对打包任务 的累计适合会员数
由此得模糊矩阵: (12)
上述算法运算完成后,会员对该打包任务按规定的评价指标的综合评判为: (13)
由于运算结论要便于不同评价对象之间的比较,得出相对价值,故给出评价集一个尺度 ,可将综合模糊评价模型转化为一个确定的标量值 : (14)
从而便于确定不同的打包任务的定价。举例说明有:
3仿真模拟验证
为了解该方案的实施效果,对所建立的模型进行仿真,并将未打包与打包情况下的任务平均完成率与任务平均定价进行对比。
步骤1 模拟任务点的产生。使用 MATLAB 产生随机函数的上下限,模拟任务分布及会员分布经纬度信息,并且规定每个任务只能被单次执行。
步骤2 确定未打包任务的定价。模拟过程中任务的基础定价不变,任务分布和会员分布经纬度不变,通过未打包情况下的定价模型(原模型),得到相应任务的定价与任务完成情况。
步骤3 确定打包任务的定价。将模拟数据代入任务打包模型中,给出打包情况下的任务定价与任务完成率。
结果显示,改进后的模型,任务集中区域的任务基本上全部完成,对于区域中包含已完成任务和未完成任务,经过打包,任务完成量有很大的提高,且对于任务发布者来说,节约了发布任务的经费。
综上,对于打包定价模型的研究,提高了任务的完成率,降低了任务的平均价格,节约成本。
4结语
本文利用模糊C均值聚类算法,根据任务分布与会员分布情况,建立任务打包定价模型,使任务定价更加合理,缩短了调查周期,提高任务完成效率,同时节约成本,使企业与会员互惠双赢。
参考文献:
[1]李忆,姜丹丹,王付雪.众包式知识交易模式与运行机制匹配研究[J].科技进步与对策,2013,30(13):127-130.
转载注明来源:https://www.xzbu.com/1/view-15332326.htm