大数据安全与敏感数据保护技术应用实践
来源:用户上传
作者:杜银霞 李红睿
摘 要:本文主要论述了大数据敏感数据的分级,分析了大数据安全需求环境下敏感数据保护技术具体应用。旨在为大数据安全敏感信息的保护提供一些参考建议,提升大数据安全保护有效性。
关键词:大数据安全;敏感数据保护技术;信息泄露
随着信息技术的发展和信息量的暴增,信息安全保护的需求日益上升,国家为此颁布《网络安全法》、《电信和互联网用户个人信息保护规定》等规定,以保证广大人民群众、企业、国家的切身利益。大数据在现如今已经覆盖了各大网络平台,且业务数据全程数据保护状态。虽然大数据安全保护措施以面向全社会积极开展,但一些敏感数据的保护仍旧存在漏洞,需要进一步完善。研究大数据安全与敏感数据保护技术的应用实践对于提升大数据平台的可信度有着重要的意义。
一、大数据敏感数据的分级
大数据敏感数据根据应用场景可划分为B域系统、O域系统、M域系统和信令、DPI系统四类,按照数据内容可划分为A、B、C、D四类。A类数据指与用户身份相关的数据,如可以表明用户人实体人份、用户的基本资料、自然人身份、网络身份等相关的信息。B类数据指与用户服务闲逛的内容信息,如用户订购的服务内容、业务内容等。C类数据是指由用户服务衍生出来的相关数据,即用户服务内容发生的应用数据,如消费账目记录、服务记录、订购记录、业务往来记录等。D类信息指企业在运营管理的過程中产生的数据,如企业干礼数据、网络营运王丽数据、与合作伙伴的合作信息、企业业务信息等。对以上信息进行细分,可分出更多的敏感信息内容,如C1-1信息为消费账目记录信息中的一部分具体内容,及具体的账目服务日记等。这类数据被定义为详单信息,可对应具体用户的主叫号码及归属地、被叫号码及通话时长等字段。
大数据类型较多,常见的有原始数据、脱敏数据、标签数据、群体数据等,这些大数据的安全与敏感级别不同,因此开放度也不同。其中原始数据属于安全与敏感度级别最高的数据,其次为脱敏数据,它是指对大数据网络明天的大数据敏感属性进行模糊、脱敏、加密、加扰、转化之后的数据,识别和处理难度较大,需要应用逆向推算、枚举推算等技术进行分析。脱敏技术是提高大数据安全的重要举措。要增加大数据的安全性与敏感性,必须对数据进行匿名操作与脱敏处理,按照相关的安全与敏感级别实施分级管理。由此可见大数据敏感数据分级是降低大数据敏感风险的重要方法。
二、敏感数据保护技术的具体应用
(一)数据匿名处理技术
数据匿名处理是大数据安全与敏感保护的处理方法之一,目的是通过用户匿名来保护信息,降低大数据信息的风险性。常用的匿名方法有等价匿名法、标准识符匿名法、K匿名算法等。等价匿名指采用与数据价值相等的信息对大数据进行个性化的匿名,如采用兴趣模型对用户的兴趣进行等价测算,寻找兴趣模型与用户兴趣之间的相似性,将其作为等价权值进行大数据树洞,从而阻断了根据背景内容识别用户的途径,保护了用户的大数据信息安全。指采用三目运算符、内置函数、匿名函数等度大数据信息进行匿名保护,通过标准运算符代替大数据信息,创建全新的对象语句,保护用户的服务数据。K匿名算法指通过对大数据信息中引入K匿名算法对大数据进行抽象化、概括化的描述,从而达到保护个人、企业数据因素的目的。K匿名算法往往是将大数据中同一属性的数据采用K条信息链接进行匿名,攻击者在识别用户信息是由于大数据属性范围变大,因此增加了大数据识别的难度,因此安全性和敏感数据保护程度增强。以上方法在大数据安全与敏感数据保护中可同时应用,通过标签打码来消除敏感信息,降低信息泄露的危险系数,通过等价匿名来保护用户数据,防止数据脱敏保护的过程中发生信息丢失的问题,而K匿名则增加了大数据信息识别和攻击的难度。
(二)敏感数据清除技术
敏感数据清除也是提高大数据安全的重要方法之一。为了防止大数据使用记录泄漏,在使用完毕后需要对敏感数据彻底清除。常规的数据清除法攻击者可对清除数据进行恢复,采用数据覆盖法利用新数据覆盖原始数据,之后再采用数据清除软件清除,就可以彻底清除敏感数据。覆写技术采用的是二进制数据存储法,在原始数据上覆盖上毫无规律的0、1,存储在硬盘上的原始数据信息编码就会混乱,破坏了数据文件的完整性。它就好比碎纸机,是最具安全的大数据敏感数据清除法之一。根据敏感数据的保密级别,覆写技术软件覆写常用逐位覆写、跳位覆写、随机覆写等不同模式,覆写的次数越多,则敏感数据清除的安全性越高。此外,数据清除还用消磁、盘体销毁的方式。消磁需要借助消磁机来实现,消磁后的硬盘或磁带表面磁性颗粒方向发生了改变,数据书序排列也方发生了改变,原有的数据就会失去价值。消磁清除可通过保修进行恢复,敏感数据有一定的恢复概率,盘体销毁会生产污染。因此覆写技术是安全性最高的大数据消除技术。
三、结语
综上所述,大数据平台数据安全与敏感保护是云技术及其服务创新发展背景下互联网服务行业面临的巨大挑战。在信息时代,大数据每天的产生量难以技术,而数据安全隐患处处存在,影响着大数据平台的可靠性与新任务,同时也影响着大数据平台服务企业的竞争优势。企业为了更加长远的发展,必须充分利用人工智能技术等对大数据网络平台进行数据安全及敏感处理,加强大数据的安全及敏感保护,为用户提供一个安全的网络平台应用环境,切实的保护用户的利益。只有这样,才会提升大数据平台在同行业的竞争力,为平台吸引越来越多的用户,提升大数据平台运营管理的经济效益,保持平台更加长远的生命周期。
参考文献:
[1]马晓亭,梁俊荣.大数据环境下图书馆敏感数据保护方法研究[J].图书馆学研究,2016(21):50-55.
[2]马晓亭.大数据环境下图书馆敏感数据的识别与保护[J].图书馆论坛,2017(04):129-136.
[3]王晓周,乔喆,白雪,王馨裕.大数据安全与敏感数据保护技术应用实践[J].电信工程技术与标准化,2019(11):60-63+92.
课题来源:河北省教育厅科技处2019年度高等学校科学研究科技-指导项目课题编号:Z2019004
转载注明来源:https://www.xzbu.com/1/view-15204776.htm