您好, 访客   登录/注册

语音合成技术应用的安全风险分析

来源:用户上传      作者:

  国家计算机网络应急技术处理协调中心广东分中心 广东 广州 510000
  摘 要 语音合成技术是人工智能实现语音交互的關键技术之一。目前语音合成技术已经越来越成熟并得到广泛应用,但语音合成技术在应用上仍存在诸多问题,例如数据安全风险、网络安全风险、信息安全风险等,尤其被应用于诈骗、不良舆论导向、反动宣传等领域,这些黑灰产业或将阻碍其健康发展及产出,因此对语音合成行业进行监管已经势在必行。
  关键词 语音合成;网络安全;人工智能
  现阶段语音合成技术已经发展到能够模仿人类的声音、语气和情感,其输出的音频明显更接近自然真实人声。这意味着,以往人类声音特有的强生物特征将被弱化,机器通过模仿便能发出以假乱真的声音,这种进步或将人类带进一个真假难辨的境遇。
  1 语音合成技术发展迭代迅速
  语音合成技术(下简称“语音合成”)是人工智能时代实现人机交互[1]的关键技术之一,使机器能够实时地将任意文本转换成连续可懂的自然语句输出,从而实现与人对话。从2016年下半年语音交互市场突然爆发,语音合成的技术手段和解决方案不断更新迭代,几乎每隔一个多月,语音交互的效果都会出现较大的提升[2]。
  2 语音合成技术的广泛应用
  目前国内外市场上,语音合成技术已经成功应用在很多领域,包括语音导航、信息播报、有声阅读、广告促销、游戏娱乐等。语音合成以贴近场景需求的合成效果,主要在语音交互、阅读教育、泛娱乐化三大场景中得以应用。
  语音交互方面,随着人工智能的发展,语音合成扮演着人工智能与人对话的自然语言输出的重要角色。阅读教育方面,语音合成通过将文本转换成语音,解放了人们的眼睛,为人们提供了一种可以并行输入的方式,在开车时、散步时、锻炼时,都可以轻松获取信息。在泛娱乐化场景中,以社交游戏为例,利用语音合成技术,可以实时转换音色音调进行变声,增加社交游戏的趣味性。
  3 语音合成技术的黑灰产业应用
  任何技术都是一把双刃剑,语音合成广泛应用于人们生活的各个领域,为人们提供高效、便利的生活方式,具备巨大发展效益的同时,一种不安分的情绪也蠢蠢欲动,语音合成的大量黑灰应用逐渐被曝光出来。
  (1)语音合成应用于诈骗。骗子通过盗取微信号和外挂软件,制作“克隆微信”,不仅能够完全盗取并复制用户在微信平台留存的语音信息,通过语音合成软件加以处理实施诈骗,通过熟人的声音进行诈骗的成功率更高一些。
  (2)语音合成应用于造假信息传播。个人声纹是一种强生物特征,能够在一定程度上区分不同人物,因此也同个人指纹一样被应用于加密领域。曾有人利用美国前总统奥巴马的声音,合成出一段批评特朗普总统的虚假视频,引起轩然大波。这意味着音频可以伪造的,音视频已经不再能够成为直接证据。
  4 语音合成的安全风险
  语音合成技术在实际应用中,确实存在着诸多安全风险,包括数据安全风险、网络安全风险、信息安全风险、社会安全风险和国家安全风险。
  (1)数据安全方面,部分语音合成服务由境外企业提供,个人声纹数据存储于境外,数据安全难以监管,导致数据泄露而无法控制;同时,逆向攻击等黑客技术可导致重要的内部数据泄露,个人声纹作为个人信息数据同样面临着泄露的风险。
  (2)网络安全方面,与人脸识别一样,声纹特征也同样被应用于加密、解锁领域。不法分子或可利用声纹复刻技术破解声音锁等加密机制,窥探个人隐私或盗取个人财产。
  (3)信息安全方面,语音合成可制作不良信息音频进行传播,制作虚假信息内容用以实施诈骗等非法活动。2017年,我国浙江、湖北等地发生多起犯罪分子利用语音合成技术假扮受害人亲属实施诈骗的案件[3]。
  (4)社会安全方面,语音合成技术可被应用于制造不良导向舆论,利用有影响力的公众人物的声纹制作虚假负面的音视频,制造社会混乱,对社会安定造成威胁。
  (5)国家安全方面,目前我国正面临着复杂的国内、国际形势,各个地区、各个层面上的竞争对手们或单独或联合地对我国进行包围,试图破坏我国民族团结。语音合成技术通过声纹采集的方式模拟他人声音,过给国家领导人音视频等配上不当言论,煽动民众情绪,误导舆论导向,威胁国家安全[4]。
  5 语音合成技术亟须监管
  语音合成实现走出实验室,一方面加速了智能语音交互应用的发展,为科技进步和人工智能时代的发展提供了巨大支持;另一方面可拓展出持续发展的智能语音交互市场空间,推动人工智能的产业化进程,同时形成带动力,促进新型产业的衍生和发展。
  毫无疑问,这将更大化地改善人类的生活方式。但随着语音合成不断创新突破,应用场景日益增多,其安全风险也将动态演进,将越发具有广泛化、场景化、融合化的特点,对人类生产生活、国家政治经济等方面产生深远影响。因此,在发展洪流中提前对安全风险有意识地规避,是明智之举。
  从国家和社会层面上看,任何技术和行业都需要标准规范,才能实现可持续发展的目标。语音合成在应用的时候,应注意加强防护个人信息数据安全,严审行业准入资质,对涉嫌违法乱纪的企业或程序严格查处;另外,密切跟踪颠覆性的技术研究,组织科学家及时研判隐含的技术风险,完善学术规范和监管框架,为科技创新发展提供先进的技术指导和良好的发展环境,是促进社会向智能化快速发展。
  参考文献
  [1] 白林丰,杜恩龙.语音交互技术重构出版[J].科技与出版,2018, (2):49-53.
  [2] 陈孝良.语音交互为何迭代如此之快[J].科技导报,2017,35(3):92.
  [3] Mehri S,Kumar K,Gulrajani I,et al. SampleRNN: An Unconditional End-to-End Neural Audio Generation Model[J].arXiv preprint arXiv,2016,16(12):78.
  [4] 崔鑫彤.语音合成技术专利分析[J].电子技术与软件工程,2018, (4):142.
转载注明来源:https://www.xzbu.com/1/view-14900336.htm