大数据环境下云存储数据安全探析
作者 : 未知

  【 摘 要 】 随着大数据时代的到来,云存储所面临的数据安全问题日益凸显。文章首先介绍了云计算和云存储,从云存储系统的结构模型、关键技术进行分析,结合当前云存储数据安全所面临的问题,从技术角度提出了云存储数据安全的几点安全策略。
  【 关键词 】 大数据;云存储;数据安全
  【 Abstract 】 With the coming era of large data storage, data security problems in cloud storage occur increasingly. The cloud computing and cloud storage are in the first part of this paper. Then, some security strategies of cloud storage are put forward from the view of technology, which is based on the analysis of cloud storage system structure model and key technology , combines with the current data security problems in cloud storage.
  【 Keywords 】 large data; cloud storage; date security
  1 引言
  随着大数据时代的到来,移动互联网、社交网络,云计算等应用技术的发展越来越成熟,对数据中心的要求也越来越高,存储基础的架构也越来越重要。被誉为“大数据商业应用第一人”的维克托・迈尔・舍恩伯格指出:大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。
  在大数据时代,人们能随时随地记录和保存自己的历史,记录和保存的方式各式各样,产生的数据诸如文字、语音、照片、视频、消费记录、搜索记录等。个人拥有的数据量与日俱增,传统硬盘已经无法满足需求,云存储技术的出现,缓解了存储压力,符合大数据时代的发展需要。随着数据量的与日俱增,如何在大数据环境下方便、安全地存储信息就成了人们亟需解决的问题。
  2 云存储概念
  云存储是在云计算概念上延伸和衍生发展出来的一个新的概念。云计算是分布式处理、并行处理和网格计算的发展,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经计算分析之后将处理结果回传给用户。通过云计算技术,网络服务提供者可以在数秒之内,处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大的网络服务功能。
  云存储的概念与云计算类似,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量的、不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储可分为三类。
  2.1 公共云存储
  像亚马逊公司和Nutanix公司提供的存储服务一样,它们可以低成本提供大量的文件存储。供应商可以保持每个客户的存储、应用都是独立的、私有的。其中以Dropbox为代表的个人云存储服务是公共云存储发展较为突出的代表,国内比较突出的代表的有搜狐企业网盘、百度云盘、乐视云盘、金山快盘、坚果云、酷盘、115网盘、华为网盘、360云盘、新浪微盘、腾讯微云等。公共云存储可以划出一部分用作私有云存储。一个公司可以拥有或控制基础架构,以及应用的部署,私有云存储可以部署在企业数据中心或相同地点的设施上。
  2.2 内部云存储
  这种云存储和私有云存储比较类似,唯一的不同点是它仍然位于企业防火墙内部,可以提供私有云的平台有Eucalyptus、3A Cloud、Minicloud安全办公私有云、联想网盘等。
  2.3 混合云存储
  这种云存储把公共云和私有云、内部云结合在一起,主要用于按客户要求的访问,特别是需要临时配置容量的时候。从公共云上划出一部分容量配置一种私有或内部云可以帮助公司面对迅速增长的负载波动或高峰。
  3 云存储系统结构模型及关键技术
  3.1 云存储系统结构模型
  (1)存储层。存储层是云存储最基础的部分。存储设备可以是FC光纤通道存储设备,可以是NAS和 iSCSI等IP存储设备,也可以是 SCSI或SAS等 DAS存储设备。云存储中的存储设备往往数量庞大且分布多不同地域,彼此之间通过广域网、互联网或者 FC光纤通道网络连接在一起。
  (2)基础管理。基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。
  (3)应用接口。应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。
  (4)访问层。任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。
  3.2 云存储关键技术
  (1)存储虚拟化技术。存储虚拟化技术是云存储的核心技术。通过存储虚拟化方法,把不同厂商、不同型号、不同通信技术、不同类型的存储设备的互联起来,将系统中各种异构的存储设备映射为一个统一的存储资源池。
  (2)重复数据删除技术。随着数据中重复数据的数据量不断增加,会导致重复的数据占用更多的空间。重复数据删除技术一种非常高级的数据缩减技术,其目的是减少存储系统中使用的存储容量,增大可用的存储空间,增加网络传输中的有效数据量。   (3)分布式存储技术。分布式存储是通过网络使用服务商提供的各个存储设备上的存储空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在各个存储设备上。它所涉及的主要技术有网络存储技术、分布式文件系统和网格存储技术等,利用这些技术实现云存储中不同存储设备、不同应用、不同服务的协同工作。
  (4)数据备份技术。在以数据为中心的时代,数据的重要性无可置否,如何保护数据是一个永恒的话题,即便是现在的云存储发展时代,数据备份技术也非常重要。数据备份技术是将数据本身或者其中的部分在某一时间的状态以特定的格式保存下来,以备原数据出现错误、被误删除、恶意加密等各种原因不可用时,可快速准确的将数据进行恢复的技术。数据备份是容灾的基础,是为防止突发事故而采取的一种数据保护措施,根本目的是数据资源重新利用和保护,核心的工作是数据恢复。
  (5)内容分发网络技术。内容分发网络是一种新型网络构建模式,主要是针对现有的Internet进行改造。基本思想是尽量避开互联网上由于网络带宽小、网点分布不均、用户访问量大等影响数据传输速度和稳定性的弊端,使数据传输的更快、更稳定。
  (6)存储加密技术。存储加密是指当数据从前端服务器输出,或在写进存储设备之前通过系统为数据加密,以保证存放在存储设备上的数据只有授权用户才能读取。目前云存储中常用的存储加密技术有全盘加密、卷加密、文件目录加密等。
  4 云存储数据安全状况分析
  大数据环境下,随着云存储的日渐流行,各种云存储服务和产品层出不穷,服务商之间竞争激烈。大部分服务商通过存储容量、服务性能、服务价格等方面的优势来争取更多的用户,而在数据保密性方面考虑较少。对用户来说,将数据存储在云中,最担心的一点便是失去对自己最私有、最保密数据的控制,SONY数据外漏事件影响到的用户高达 1亿,业界对云存储的安全状况提出了很大的担忧。
  云存储安全,根本的目标是保证存储数据的安全,即数据的保密性、完整性和可用性;涉及的过程有数据生成、传输、保存、访问。这其中,既包括传统的信息安全、存储加密等技术,又包括云存储的特殊性带来的安全问题和技术。如何有效地分析云存储的安全性,怎样的模型,能够既覆盖云存储各方面的安全性问题,又不过多使用安全技术,而且使之有机结合,从而保证云存储的安全和完整统一,是我们面临的一个难题。
  目前具有代表性的主流云存储平台,解决了大部分的安全性问题,只是在数据保密性方面关注较少。例如,亚马逊的云平台提供了一系列强大的云服务,但是文件存储服务和数据库存储服务并不提供对数据的加密;华为网盘提供了面向文件的数据存储服务,并有着强大的数据同步和数据共享功能,但是不支持数据的加密;Hadoop 中的 HDFS 和 HBase 提供了开源的云存储解决方案,但是不支持对数据的加密。云存储数据不加密会带来很大的安全隐患,一旦云存储平台被攻破,数以万计的用户和企业的数据将被泄露,云存储服务提供商和用户的利益都将遭受巨大的损失。
  5 云存储数据安全策略
  大数据环境下云存储所面临的数据安全问题,可以通过多种安全策略来提高云存储的数据安全。
  5.1 多副本策略
  多副本策略主要是为了保障不发生由于硬件故障而引起的数据丢失。通过利用物理存储资源对数据进行备份,在云环境下多副本管理主要是依托于现在新型的云存储技术。如果某一个硬件机器失效,那么存储在该台机器上的数据是无法访问的,为了防止数据的丢失和为保证数据安全性,就可以采取多副本策略。
  5.2 密钥策略
  为了避免敏感数据不被恶意用户轻易拿到,除了对数据的存取和访问做到严格的限制以外,还需要对其进行加密,加密提供了资源保护功能,同时密钥管理则提供了对受保护资源的访问控制,所以加密及密钥管理是一种保护数据的核心机制。
  5.3 数据的差异性保存
  云存储还未出来前,数据都是存储在自己私有的服务器中,为了数据的安全性,根据数据的重要性划分其保护级别,这样数据的保密等级就是必不可少的。同样这种策略也可以运用到云存储上面,将关键重要的数据由用户自己保存,剩下的通用型数据存放在云上,这样安全性和实用性都能得以实现。
  5.4 数据传输安全
  在数据传输安全上可以选择在数据传输物理链路上做好屏蔽保护,可采用光纤传输。在公网上数据传输,采用专线或VPN技术。对数据进行加密传输,如多模加密技术,采用对称算法和非对称算法相结合的技术,在确保了数据本源得到高质量加密防护的同时,其多模的特性能让用户自主地选择加密模式,从而能更灵活地应对多重的安全威胁。
  6 结束语
  大数据环境下,云计算的数据存储和应用方式是跨地域甚至是跨国界的。在云存储方面,数据安全仍是要亟需解决的首要问题,本文基于云存储的数据存储模型,通过关键技术的分析,提出了一种可行的数据存储安全策略。本文只是从技术角度对云存储所面临的一些问题进行了分析,在大数据环境下,要想真正的解决云存储的安全问题,需要进一步研究云存储安全技术,真正做到数据在云中的存储安全。
  参考文献
  [1] 周品.云时代的大数据[M].北京:电子工业出版社,2013年10月.
  [2] 张继平.云存储解析[M].北京:人民邮电出版社,2013年03月.
  [3] 刘鹏.中国云存储发展报告[M].北京:电子工业出版社,2013年06月.
  [4] 董晓霞,吕廷杰.云计算研究综述及未来发展[J].北京邮电大学学报(社会科学版),2010年(05).
  作者简介:
  崔建华(1977-),男,云南昆明人,云南师范大学,本科,公安消防部队昆明指挥学校,讲师;主要研究方向和关注领域:计算机信息技术、教学研究。

文秘写作 期刊发表