您好, 访客   登录/注册

一种基于对称加密的隐私保护增量真值发现算法

来源:用户上传      作者:

  摘 要:随着信息技术的飞速发展,群智感知真值发现系统成为物联网领域的研究热点之一,保护用户的隐私是设计真值发现算法的重大挑战。文中设计了一种轻量级基于对称加密的隐私保护增量真值发现算法。该算法中每个用户在一个时间戳内只需要观察一个对象,用户只需要上传该对象的信息即可,无需重复上传之前所有已观察过的“旧对象”的信息,大大降低了用户的计算开销和通信开销。
  关键词:群智感知;增量真值发现;隐私保护;对称加密;轻量级;权重
  中图分类号:TP39 文献标识码:A 文章编号:2095-1302(2020)11-00-04
  0 引 言
  近年来,随着智能设备的普及,群智感知应用[1-3]越来越广泛。真值发现技术[4-6]被应用于群智感知系统中以提高数据聚合的准确度,推断出目标对象的真值信息。例如,为了更精确地评估某一地区当前的温度,第三方机构需要对从不同传感器上收集的数据进行真值发现。由于在真值发现的过程中用户的感知数据可能暴露,导致其隐私信息外泄,比如用户的通讯录、常用地址等,所以在真值发现过程中需要注意保护用户的隐私。
  目前已有的隐私保护真值发现算法大部分基于双云服务器模型,需假设云服务器是半诚实的,但此假设性过强,在实际应用时需要付出不小的代价。也有不少基于单云服务器的隐私保护真值发现算法被相继提出,但计算开销都较大。Miao等人[7]利用单云服务器模型提出了一种隐私保护增量真值发现算法I-PPTD,该算法以顺序方式收集用户的感知数据,并对用户的感知数据和权重隐私进行安全保护。然而,I-PPTD采用的门限Paillier同态加密算法[8]复杂度较高,导致用户端和云服务器端进行加解密运算产生的开销较大。
  本文提出了单云服务器模型下的一种基于对称加密的隐私保护增量真值发现算法,该算法采用对称同态加密[9]方式对数据进行聚合,比门限Paillier同态加密算法更高效,且当用户感知到一个新对象时,用户只须上传对该新对象的加密信息即可。同时,云服务器端也只须估计该新对象的真值。实验结果表明,本文算法降低了用户和云服务器的计算开销和通信开销,提高了隐私保护增量真值发现算法的实现效率。
  1 系统模型
  由于文中方案所考虑的是单云服务器模型下的隐私保护,因此需要一个可信第三方密钥分发中心来对云服务器以及每个用户的密钥进行管理,并且密钥分发中心到用户或者云服务器之间用来传递信息的通信信道不可监听。系统模型如图1所示。本方案的主要参与方由三个实体构成,即可信密钥分发中心、云服务器平台以及用户。各实体的具体定义如下所示。
  (1)可信密钥分发中心。密钥分发中心是具有强大计算能力的第三方机构,它是诚实可信的。在真值发现过程开始之前,密钥分发中心会为云服务器和每个用户安全分配用以生成密钥的随机数集合。
  (2)云服务器。云服务器分配给用户感知任务,收集用户数据,并提供算力资源执行真值发现算法。
  (3)用户。用户使用自身携带的智能传感设备来执行感知任务,提供感知数据。
  假设在当前时间戳中,系统所有的用户集合为U,当前新观测到的对象表示为ol,在这之前用户感知过的“旧对象”表示为o1, o2, ..., ol-1,此时系统的对象集合假设为M。wli表示系统内第i个用户对于对象ol的权重,xli表示用户i的智能设备感测到的对象ol的感知数据。对于每一个对象,都有一个真值xl,而这个真值对于系统中的所有参与方而言都属未知。系统的目标是计算当前时间戳对象ol的真值xl。
  用户连续执行感知任务,通过设备和云服务器平台支持的3G/4G、无线或其他类型的安全网络向云服务器发送时间序列数据。在每个时间戳内,每个用户使用密钥加密自己的感知数据,并将密文上传给云服务器,接收到所有用户的信息后,云服务器将进行数据聚合和增量真值发现过程。系统的目标是计算出每个时间戳对象的估计真值,同时保护每个用户的感知数据和权重信息不被泄露。
  2 增量真值发现算法简介
  隐私保护增量真值发现算法是由Miao等人在最近的研究[7]中提出的。在许多实际的群智感知应用中,感知任务的持续时间可能较长,多为几天或几个月。例如在医疗应用程序中,患者的健康数据通常为逐日收集,待几周或几个月后再分析这些数据极为低效。此时不同对象的观测值通常通过流方式从用户方收集,然后通过增量真值发现算法计算真值。增量真值发现算法能动态更新对象真值和用户权重,它可以在不泄露每个用户私人信息的情况下,通过重新访问之前保存的旧数据及时估计新观测的对象真值。
  在这些以流方式收集感知数据的场景中,用户一个时间戳内只观察一个对象,因此云服务器只需计算该对象的真值即可,无需重复计算之前所有对象的数据,开销比以往的真值发现算法[10-11]更小。不同的是,增量真值发现算法不涉及迭代阶段,并且是从真值更新开始,然后在观察到新对象时更新每個用户的权重,每个用户的权重会随着对象数量的增加而趋于稳定。
  感知数据通常可以分为两类,即连续数据和分类数据。连续数据的数值是连续不断的,相邻两个数值可以作无限分割,例如温度、体重等。分类数据是按照现象的某种属性对其进行分类或分组而得到反映事物类型的数据,其结果只能是其中单独一类或者一组,例如性别、天气类型等。
  增量真值发现过程包含两个步骤。
  (1)真值更新。如果该新增对象ol是系统中的第一个对象,则它的真值由云服务器随机初始化得到;如果该新增对象ol不是系统中的第一个对象,则其真值由用户协助云服务器计算得到。
  云服务器根据上一个时间戳中计算并保存的所有用户权重,使用公式(1)计算ol的真值:
  式中:当感知数据连续时,xl*是对象ol观测值的加权平均值;当数据为分类数据时,xl*为向量,其中每个元素代表某个特定的真实候选结果或答案的概率,对象ol的估计真值将是向量xl*最大的结果或答案。   (2)权重更新。权重更新通常采用CRH中的对数权函数[12]。由于在增量真值发现过程中,在每一个时间戳内用户对于当前对象都有一个权重,在这一时间戳内,云服务器根据用户i的感知数据和真值的差来计算它在此刻对于对象ol的权重:
  式中,是一个距离函数,同以往的真值发现算法一样,其可用来衡量感知数据和真值的差。对于连续数据,采用平方距离函数计算。对于分类数据,感知数据代表用户i为任务ol选择的第q个结果或答案,此时的距离函数表示为:。
  3 算法设计
  3.1 算法概述
  输入:安全参数λ,当前时间戳系统用户i对第l个对象ol的感知数据为,用户i对前(l-1)个对象的“旧信息”为Di,用户i对第(l-1)个对象的加密权重为。
  输出:第l个对象的真值为xl*。
  (1)系统建立。可信第三方密钥分发中心为云服务器和每个用户分发随机数集合。
  (2)初始化。云服务器和每个用户根据接收到的随机数集合生成自己的密钥。
  (3)云服务器估计对象真值。用户加密数据并辅助云服务器估计当前时间戳新对象的真值xl*。
  (4)云服务器估计用户权重。用户根据新对象的真值更新Di,云服务器估计每个用户对新对象的加密权重,并保存加密权重信息。
  3.2 算法设计
  算法所涉及符号的相关描述见表1所列。
  3.2.1 系统建立
  输入安全参数λ,可信第三方密钥分发中心产生|U|份随机且不同的集合S1, S2, ..., S|U|,每個集合中含有数量不等的随机数。用S表示所有随机数的集合,Si(i∈[1,|U|])表示第i个随机数子集,显然。密钥分发中心将集合S1, S2, ..., S|U|和S通过已确保安全的通信信道分别发送给每个用户和云服务器。
  3.2.2 初始化
  接收到密钥分发中心发送的随机数集合后,用户i计算自己的加密密钥,云服务器计算解密密钥。
  由于每个h(fs'(t))都在{0, 1}λ上均匀分布,ski在{0, 1}λ上也均匀分布,因此加密密钥满足底层密码系统的安全要求。假设mi表示用户i的明文,M表示明文空间,则每个用户加密数据为:ci=(ski+mi)modM。云服务器聚合所有用户的密文,并减去解密密钥sk0即可得到解密后的明文总和。验证过程见式(3):
  3.2.3 云服务器估计对象真值
  如果ol是系统中的第一个对象,则其真值xl*由云服务器使用随机数生成器Rand()初始化得到,并将结果通过安全的通信信道发送给每个用户。
  如果ol不是系统中的第一个对象,则其初始真值由用户协助云服务器计算得到。云服务器使用自己保存的前一个对象ol-1真值发现得到的用户加密权重集合()来估计当前对象的真值,具体过程如下:
  (1)云服务器生成随机掩码rc并计算,将结果通过安全的通信信道分别发送给对应的用户;
  (2)用户i接收到数据后,用该数据乘以自身感知数据并加密,同时加密数据ski·xli,xli,并将密文发送到云服务器;
  (3)接收到所有用户发送的密文后,云服务器解密,得到,同样可解密得到。
  (4)计算,并根据公式(1)得到当前对象ol的估计真值xl*。
  3.2.4 云服务器估计用户权重
  云服务器将初始化的对象真值或估计的对象真值通过安全的通信信道发送给每个用户。
  用户i接收到云服务器发送的真值后,根据自己的感知数据计算当前对象ol的距离函数,更新,等号右边的Di表示用户i在过去时刻观测到的所有(l-1)个对象的感知数据的距离总和,即“旧信息”,可表示为。保存更新后的Di,作为后续新对象需要用到的“旧信息”。用户i加密,并计算,将两个结果发送到云服务器。
  云服务器接收到所有用户发送的密文后,聚合解密得到所有用户对所有对象的距离函数总和,并计算,根据用户i发送的值和公式(2)计算得到用户i对于对象ol的加密权重。云服务器将保存加密的用户权重信息,为估计下一个新对象的真值所用。
  4 效率分析
  通过实验将本文算法与I-PPTD算法进行对比分析,展示本文算法的性能和效率。本实验代码用Java编写,并使用Java标准大数类BigDecimal运算,在Eclipse上编译。实验由配置了AMD A6-4455 APU with Radeon(tm)HD Graphics处理器,12 GB内存,以及Windows 7操作系统的PC机运行。
  本实验的感知数据集由随机数生成器Rand()生成,对于每个对象,观测值的取值都在r±(r×10%)以内,其中r属于[0,1]。实验只针对连续型整数,选取10个用户,27个对象为实验样本,实验数据均为重复运行10次后得到的平均值。对比算法实验的安全参数n设为1 024,安全级别约为80 B,本文算法使用SHA-256作为加密算法,通过使用JDK自带的java.security.MessageDigest类调用已集成的安全哈希算法digest()实施,安全级别为128 B,即本文算法的安全级别比算法I-PPTD更高。本文算法的效率可以从计算开销和通信开销两方面分析。
  4.1 计算开销
  图2和图3所示为两种算法在用户端和云服务器端的计算开销。从图中可以看出,本文算法在用户端和云服务器端的计算开销均低于I-PPTD算法。
  4.2 通信开销
  通信开销比较的是两个算法用户端和云服务器端发送或接收的数据,实验结果显示在表2和表3中。通过两个表可以看出本文算法在用户端和云服务器端的通信开销均比I-PPTD算法小。   5 結 语
  本文构造了一种新的隐私保护增量真值发现算法,针对半诚实的双云服务器模型假设性过强的问题,采用单云服务器模型构造隐私保护方法,能够更加灵活地适用于实际应用场景。将对称同态加密技术应用于增量真值发现算法中,可进一步降低用户端和云服务器端的计算开销和通信开销。
  参考文献
  [1] HU Shaohan,SU Lu,LIU Hengchang,et al. SmartRoad:a crowd-sourced traffic regulator detection and identification system. Proceedings of the 12th International Conference on Information Processing in Sensor Networks(IPSN 2013)[C]// ACM,2013:331-332.
  [2] MUN M,REDDY S,SHILTON K,et al. PEIR,the personal environmental impact report,as a platform for participatory sensing systems research. Proceedings of the 7th International Conference on Mobile Systems,Applications,and Services(MobiSys 2010)[C]// ACM,2009:55-68.
  [3] RABBI M,ALI S,CHOUDHURY T,et al. Passive and in-situ assessment of mental and physical well-being using mobile sensors. Proceedings of the 13th International Conference on Ubiquitous Computing(UbiComp 2011) [C]// ACM,2011:385-394.
  [4] LI Yaliang,GAO Jing,MENG Chuishi,et al. A survey on truth discovery [J]. ACM SIGKDD explorations newsletter,2016,17(2):1-16.
  [5] MA Fenglong,LI Yaliang,LI Qi,et al. FaitCrowd:Fine grained truth discovery for crowdsourced data aggregation. Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(KDD 2015) [C]// ACM,2015:745-754.
  [6] MENG Chuishi,JIANG Wenjun,LI Yaliang,et al. Truth discovery on crowd sensing of correlated entities. Proceedings of the 13th ACM Conference on Embedded Networked Sensor Systems(SenSys 2015) [C]// ACM,2015:169-182.
  [7] MIAO Chenglin,JIANG Wenjun,SU Lu,et al. Privacy-preserving truth discovery in crowd sensing systems [J]. ACM transactions on sensor networks(TOSN),2019,15(1):32.
  [8] CRAMER R,DAMGARD I,NIELSEN J B. Multiparty computation from threshold homomorphic encryption [J]. Basic research in computer science,2001,7(14):280-299.
  [9] LI Qinghua,CAO Guohong,LA PORTA T F. Efficient and privacy-aware data aggregation in mobile sensing [J]. IEEE transactions on dependable and secure computing,2013,11(2):115-129.
  [10] MIAO Chenglin,JIANG Wenjun,SU Lu,et al. Cloud-enabled privacy preserving truth discovery in crowd sensing systems. In Proceedings of the 13th ACM Conference on Embedded Networked Sensor Systems (SenSys 2015) [C]// ACM,2015:183-196.
  [11]孙洪山,陆雪,徐嵘,等.一种高效的隐私保护群智感知真值发现机制[J].物联网技术,2018,8(7):20-21.
  [12] LI Qi,LI Yaliang,GAO Jing,et al. Resolving conflicts in heterogeneous data by truth discovery and source reliability estimation. Proceedings of the 2014 ACM SIGMOD International Conference on Management of Data(SIGMOD 2014)[C]// ACM,2014:1187-1198.
转载注明来源:https://www.xzbu.com/8/view-15362881.htm