云计算环境下数据安全与隐私保护
作者 : 未知

  摘 要:现阶段,大数据已成为信息技术产业的发展热点所在,在此期间,对用户隐私数据安全性的保障则成为急需解决的关键问题。文章将数据隐私和安全的保护具体需求进行了列出,并对解决这一问题的关键技术进行了总结,比如说数据搜索、数据共享以及外包计算的加密等。
  关键词:大数据;云计算;数据安全;隐私保护
  中图分类号:TP309 文献标志码:A 文章编号:2095-2945(2018)16-0046-03
  Abstract: At this stage, big data has become a hot spot in the development of information technology industry. During this period, the security of user privacy data has become a key problem to be solved urgently. This paper lists the specific requirements of data privacy and security protection, and summarizes the key technologies to solve this problem, such as data search, data sharing and encryption of outsourced computing.
  Keywords: big data; cloud computing; data security; privacy protection
  1 云�算和大数据的安全挑战
  云计算作为现阶段信息技术以及IT应用方式进行变革的关键所在,已成了现阶段信息技术产业发展以及实现应用创新的热点问题,而其应用前景的扩大,也成为其得以快速发展的有效推动力。就增长速度方面看,云计算要高出IT行业6倍,市场研究公司IDC提出未来四年间,云计算市场将达到26%的年增长率。云计算的应用领域不断扩大,这会极大的推动工业化和信息化的发展速度。大数据时代的到来,释放了云计算的潜力,当前国内云计算产业链逐步形成,如分布式计算、虚拟化技术等逐步得到应用,云计算开始同群众生活密切联系,如医疗健康云、电商云以及交通物流云等的推广应用。云计算虽具备广阔的发展前景,不过其在推广期间仍旧存在缺乏运营经验、用户认可度较低以及不完善的产业链等问题。而其安全性以及隐私问题成为人们最为关心的话题,也逐渐开始对云计算的发展造成阻碍。
  2 数据安全与隐私保护问题
  数据安全指的就是用户数据被有效保护,而不会被非授权者读取,若是数据被假冒亦或篡改,能够对其进行自动甄别,保障用户数据的真实性、安全性以及可用性等。现代密码技术的应用,借助加密、签名以及认证等相关技术,来保障数据安全,但网络安全的所有需求都可借助密码来进行解决方案的获取。隐私在数据隐私保护方面水平仍旧较低,也并未获取有效的结果。在网络中的隐私亦是多种多样的,比如说个人的财产和信息状况、社交软件账号信息、工作单位、住址、邮箱信息、身份证信息、购物和医疗信息、交友信息、浏览记录等信息。在隐私与某个人身份信息PII相关时,如手机号、姓名等,其属于显性隐私信息。通常隐私呈现出隐蔽形式,其仅仅对用户的职业、年龄等模糊信息进行涉及,这些信息无法对某个用户机芯直接标识,不过组合这些信息时,其仍旧有着非常大的隐私风险。这就使得人们对用户属性标签进行深入泛化模糊,来将地址、年龄等信息放置到更大的范围当中,以此让其所有属性对应物的数量足够多,却不能对明确的个体产生关联,这便是k-anonymity。
  3 安全应对之策
  云计算能够有效链接大量计算、软件和存储资源,以此进行巨大规模的虚拟共享IT资源池的形成。用户可将个人数据发送给公共数据中心开展管理,而这是需要对其加密的,对于密文数据的有效共享以及快速搜索,并在此过程中对用户隐私进行保障是非常关键的。这要求进行能够对数据分割机制进行支持的新型混合云存储框架的建立,这样实现对用户数据隐私的保护,并且能够对云平台的计算依据存储进行有效应用。
  3.1 隐私感知混合云数据存取处理
  混合云是能实现不同云间,对数据和应用的迁移,其由私有云和共有云构成,隐私性较强,同时计算成本也比较低,这也得到更多公司依据机构的青睐。当前混合云已经成为对运输局的隐私和安全进行保障的有效方式,公司或是机构能将员工数据、财务数据等作为其核心机密,向其私有云进行保留,公有云则负责存储其他数据外包,一次使得公有云的计算资源被有效利用。
  怎样组合私有云和公有云,来对公有云的计算和存储资源进行充分应用,并且对用户隐私进行有效保障,则成为最为关键的问题。对此,国外学者已经进行了大量的研究,如Zhang等人将Sedic提出,这是一种以大数据为对象的隐私感知混合云计算模式,其基于Hadoop Map Reduce进行了隐私保护模块的增加,使得隐私感混合云计算得以实现;Chen等人则提出大规模混合云计算方案,其能够实现对隐私的保护,主要在进行人类基因序列匹配时使用。虽然针对隐私感知混合云的研究已经有了一些成果,不过其应用范围以及隐私保护都是有限的,水平较低,且出现数据效用的降低,这要求一套更为全面、使用范围更大的对数据挖掘进行支持的混合云隐私保护方案的提出。
  3.2 加密数据搜索
  加密数据之后,使得之前的有序性以及可比较性被破坏,让数据的检索更为困难,云存储中是在云服务器内进行全部密文的下载,并保存到本地,接着对密文进行解密,来获取明文,最终检索明文数据,这种方式的缺陷在于效率较低。而利用关键字来进行搜索的公钥加密是一种效率更高的检索方案。
  2000年Song等人将加密数据检索实用算法进行提出,其借助对称加密算大来分别加密关键字和文档,其服务器可凭借用户的关键字来进行相关文档的检索,不过其无法对文档内容的实用新型进行获取。Katz等人则将内积谓词加密概念进行提出,其中对IPE能够实现对复杂逻辑表达的可搜索公钥加密支持进行了关注,其对任意的能够进行单调布尔逻辑表达式查询进行实现。   以上提到的可搜索公钥加密方案无法对陷门对于相关查询信息不会泄露进行保障,在用�舻牟檠�信息中存在明暗信息时,则会被限制。用户进行查询过程中,同样要对自己的隐私进行保护,这就要求我们可对隐私进行保护,并且对复杂逻辑表达进行支持的有效可搜索公钥加密方案进行构造。
  3.3 加密数据外包计算
  当前第三代外包平台技术发展迅速,云计算为其典型代表,其能够让数据拥有者向云服务进行传送,并可进行计算以及查询,以此使得其自身的计算、存储以及管理等开销得以有效降低。最近几年,在外包云数据的计算中,应用了同态加密以及属性加密等技术。功能加密也被称作是函数加密,其属于是公钥加密的新扩展形式,可进行灵活数据加密法的提供。功能加密期间,所有人都能够借助公钥pk来加密明文m,进而会获得C=Enc(m),持有私钥的人能够将密钥sk[f]发给某函数f,借助sk[f]能够在密文C中对f(m)进行计算,不过除f(m)之外,其不可对与m相关的任何消息进行获取,以属性加密、身份加密以及同态加密为基础的,都能够被当做是功能加密的具体表现形式。
  3.4 数据共享
  之前的多数做法都是在服务器直接存放数据,接着借助访问控制来让共享功能只限定于具备访问权限的用户。但由于其是通过明文形式对数据进行存放,便难以对服务商的保密性要求进行保障,若是运输局中心被非法侵入,则无法保障用户数据的安全。同时借助用户公钥来加密数据,并在运输局服务商处存放,若是用户甲想让其他用户乙来对数据共享,则其要下载数据到本地进行解密,接着通过乙的公钥进行加密,向乙继续发送,这种方法虽简单,却使得运算成本增加。以属性加密为基础的Attribute-Based Encryption,简称ABE,可用来对数据共享问题进行解决,不过其无法对跨域操作进行支持。云计算中的用户所属的管理域是不同的,这使ABE无法发挥效果。而秘闻规则ABE的应用要对共享用户需要满足的条件进行提前满足,灵活性不足。
  以上代理重加密中,授权人无法处于更细致层次中控制代理者。而Weng等人提出的条件代理重加密,在密文对某项条件符合时,代理者才能够转换这一密文,以此使得代理者转换权限被有效控制,并实现对云计算的加密数据共享问题进行解决。在向云计算服务商存储数据前,用户甲需要先对数据借助条件代理重加密方法进行加密,在乙共享甲的数据时,则甲会有针对某条件的转换钥生成,并向云计算服务商传送,接着服务商便能够通过转换钥来对这一条件进行满足的制定加密数据进行转换,成为针对乙的密文,以此乙便可借助私钥对数据进行访问。此过程中,即便是云计算服务商获取了转换钥,其也不可能对用户数据进行获取。现阶段应用该方法的方案都对双线性配对进行了使用,然而这样成本是非常高的,因此这种方案并未达到理想的效率。而对无需双线性配对的条件代理重加密方案的构建已成为对云计算环境进行高效应用,以及对数据共享加密问题解决的关键。当前还有匿名的条件代理重加密方案,其仅可通过简单AND进行表达,但其实现的共享仅限于对较为粗糙粒度数据,所以进行自适应选择密文安全的,能够实现细粒度条件控制的匿名条件代理重加密方案的建立是非常重要的,还需进一步研究。
  4 应用方面的研究
  在过去的一段时间里,在面向云计算安全相关的密码理论研究以及密码技术应用在云计算安全实现方面获得了很大的进步,并获得了很多较有意义的进展。陈克非提出的基于云储存服务的数据共享系统模型,依据这一模型实现了一个原型系统部署之后,使用密文策略属性加密技术同时实现了高效的数据加密以及细粒度的访问控制,合并了加密模块以及访问控制模块。在搜索模块,通过Lucene搭建的轻量级搜索引擎,实现了对于数据的快速检索,同时与访问控制结合,保证授权的内容不会出现在检索结果中。同时对于系统的响应速度、系统资源使用等性能方面的缺陷,提出了利用缓存技术、预解密技术以及使用摘要代替整个源文件对于系统开展进一步的优化,提升了整个系统的效率以及资源的利用率,可以满足于应用的实际需求。
  5 结束语
  随着大数据时代的来临,信息的安全与隐私保护成为一项系统工程,不管是在国家层面还是在技术层面,都是需要负担起相关的责任。首先需要通过法律规范限制对于用户的数据过度采集与使用,同时在技术上需要对于目前的数据储存模型变成真正意义上的分布式储存。这样既可以方便对于重要以及敏感信息的加密保护,同时还可以最大限度的将数据内容以个人的相关信息实现剥离,进而达到对于隐私保护的目标。
  参考文献:
  [1]张晏,岑荣伟,沈宇超,等.云计算环境下密码资源池系统的应用[J].信息安全研究,2016,2(6):558-561.
  [2]刘剑飞.云计算应用环境下的信息安全应急系统研究[J].科技创新与应用,2017(21):56-57.
  [3]周顺淦.云计算环境中数据共享与修复关键技术研究[D].武汉大学,2016.
  [4]方乾.云计算环境下数据隐私保护技术的研究和应用[D].湖南大学,2016.