您好, 访客   登录/注册

基于自适应参数的多窗谱谱减法算法改进

来源:用户上传      作者:

  摘 要:当今人工智能发展迅速,语音识别成为人机交互的重要方式。为提高语音识别准确度,在分析语音信号前去除语音信号噪声干扰并提高语音信号能量尤为重要。在实际应用中,不同语音信号包含不同的噪声。针对不同的语音噪声,在传统谱减法基础上,通过判断算法窗函数,根据不同的噪声能量改变多窗谱减法的过减因子参数,以增强算法自适应能力。仿真结果表明,在低信噪比情况下,通过改变过减因子值,可取得一个最优过减因子值以改进谱减法下的音乐噪声和失真度。自适应多窗谱减法改进后与基本谱减法相比,信噪比提高了29%;与多窗谱减法相比,信噪比提高了16%。该自适应多窗谱减法可适应不同噪声环境下的语音信号,增强语音信号中的关键信息并减少噪声干扰。
  关键词:谱减法;自适应参数;多窗函数;语音降噪
  DOI:10. 11907/rjdk. 191973 开放科学(资源服务)标识码(OSID):
  中图分类号:TP312 文献标识码:A 文章编号:1672-7800(2020)005-0074-04
  0 引言
  人工智能与互联网衍生出各类智能产品。人类可在嘈杂的环境下提取有效信息进行沟通,当转换到机器上时,如何使其更有效地识别并提取有用信息成为研究重点。
  在语音信号处理中,接收到的语音信号大多含有噪声,语音增强技术应运而生。语音增强的目的是提高语音质量,需在降噪和语音失真之间找到一个最好的权衡点。文献[1-2]对谱减算法进行改进,在传统谱减算法的基础上,对无声段进行平滑处理,得到噪声功率;文献[3-4]通过约束先验信噪比与调整后验信噪比,提出基于[MMSE]的短时谱幅度增益函数计算方法,即根据信噪比取值范围对増益函数进行适当调整;文献[5]提出一种基于约束方差频谱平滑与极小值跟踪(VCSS-ML)的噪声谱估计算法;文献[6-7]研究了谱减法与深度神经网络语音增强算法;文献[9]提出基于优化迭代谱减法的音乐无噪声语音增强方法。现有研究在低信噪比下的改进效果并不明显,如何选取最优参数值,使该算法既能减少“音乐噪声”,又不会使波形失真成为研究热点。因此本文提出一种改进的谱减法,通过调整参数得到相对情况下较优的参数值。
  1 基本谱减法
  基本谱减法从输入的含有噪声的信号总能量中减去噪声能量,从而获得有用信号的能量。设含噪语言信号为[xn],加窗分帧处理后得到第[?]帧语音信号为[xi(m)],帧长为[N],对[xi(m)]作离散傅里叶变换(DFT)后[Xi(k)]为:
  谱减算法增强处理后的信号会残留较多噪声,因为有一定的节奏感,所以又称为音乐噪声[2]。产生音乐噪声的元音与噪声信号的特点有关,因为其符合高斯分布,幅度随机变化的范围较宽[3]。所以引用无语音期间噪声统计方差表示噪声时,会根据信号帧噪声分量大小,残留一部分较大的噪声,在频谱上表现为随机凸起。增强后的语音信号会有节奏地残留噪声,这些音乐噪声严重影响语音自然度质量。
  2 基于多窗谱改进的谱减法
  窗函数一般具有低通性,选择不同窗函数会有不同的带宽和频谱泄漏,语音信号分析常用的窗函数有矩形窗、海宁窗和汉明窗。其定义为:
  数据窗是一组相互正交的离散椭球序列。为克服谱减法不灵活的问题,融合不同窗函数和自适应参数的选择,让该算法变得灵活,具体方法如下:
  (1)对带噪的语音信号进行预处理。一般语音信号预处理包含加窗分帧,在加窗部分对其进行判断,并根据窗函数是否为汉明窗的条件选择不同方法。若为汉明窗,以自适应参数进行分析;若不为汉明窗,以不同的窗函数进行分析。
  (2)对加窗分帧后的信号[xi(m)]进行傅里叶变换,求出其幅度谱和相位谱。其中平均幅度谱[Xi(k)]为:
  3 实验结果分析
  3.1 加窗对比
  实验语言信号频率为16khz的纯语音信号。将一段纯语音信号与白噪声叠加,得到信噪比为-5、0、5dB的带噪信号,分别采用矩形窗、海宁窗和汉明窗对语音信号进行分帧处理,其中语言信号频率为16khz,采用汉明窗对语言信号进行加窗分帧,帧长为25ms、帧移为10ms。纯语音信号(见图2(a))叠加白噪声信号(见图2(b))后采取不同的窗函数进行分帧,采用改进的多窗谱方法降噪后的结果见图2(c)-(e)所示,其信噪比变化情況如表1所示。
  从表1可以看出采用多窗谱的谱减法,分别选用不同的窗函数进行对比,发现矩形窗频谱泄露均大于汉明窗和海宁窗,其中对频谱包容性更佳的是海宁窗,所以在噪声环境下,多窗谱算法选择海宁窗。
  3.2 自适应参数对比
  在相同汉明窗和信噪比的条件下运用该自适应多窗谱减法,从而得到一个关于参数与提高的信噪比曲线图,如图3所示。
  从图3可得到最优参数,将得到的参数与相邻参数在不同的白噪声下进行对比,结果如图4所示。其中,虚线代表在一定噪声环境下对其进行自适应得到的最优参数,另外两种代表该最优参数的邻近参数,不同参数下运用谱减法得到的波形如图5(a)-(c)所示。
  结合图4、图5可看出过减因子参数变化明显影响了谱减法。从图5可看出当过减因子过小时,谱减后的波形带有大量音乐噪声,从而使得到的语音信号难以分辨;若过减因子过大,则会引起语音信号失真,从而丢失语音帧。本文实验采用融合多窗谱谱减法与参数自适应算法,得到的最优参数优于在同样条件下的其它参数。
  将改进的自适应多窗谱减法与基本谱减法和多窗谱减法进行对比,在相同噪声环境(这里的噪声使用对纯净语音加高斯白噪声进行模拟)下,分别采用3种谱减法对其进行实验,改进的自适应多窗谱减法与基本谱减法相比,其信噪比提高了29%,与多窗谱减法相比其信噪比提高了16%。
  4 结语   在语音识别中,语音前端处理尤为重要。语音识别精度在一定程度上依赖于原始语音增强和去噪。对原始语音进行增强有利于突出原始语音中最重要的信号,而对原始语音去噪可减少外界对语音识别的影响,有利于提高语音识别精度。
  本文着重研究了语音识别中的前端处理,在基本谱减法的基础上增强窗函数,发现在同一噪声环境下,海宁窗语音信号包含度优于另外两种窗函数,在窗函数相同的情况下可通过输入语音信号噪声,自适应地改变谱减法参数,提高算法自适应能力。下一步将利用本文算法处理语音信号,通过语音识别准确率进一步验证算法有效性。
  参考文献:
  [1] 董鹤.  噪声环境下基于谱减法的语音识别研究[D].  哈尔滨:哈尔滨工程大学,2016.
  [2] 刘辰晨. 噪声下的语音识别算法研究[D]. 南京:南京大学,2014.
  [3] 张建伟. 基于噪声谱估计和信噪比约束的语音增强研究[D]. 合肥:安徽大学,2016.
  [4] 陈紫强,曾庆宁,刘庆华. 基于先验信噪比参数自适应的频域联合语音增强方法[J]. 电子与信息学报,2007(2):439-442.
  [5] 方瑜. 语音增强相关问题研究[D]. 北京:北京邮电大学,2012.
  [6] 魏泉水. 基于深度神经网络的语音增强算法研究[D]. 南京:南京大学,2016.
  [7] HINTON G E. Training products of experts by minimizing contrastive divergence[J]. Neural Computation,2002(8):1771-1801.
  [8] MIYAZAKI R,SARUWATARI H,INOUE T. Musical-noise-free speech enhancement based on optimized iterative spectral subtraction[J]. IEEE Transactions on Audio Speech and Language Processing,2012,20(7):2080-2094?.
  [9] 卢景,赵风海. 一种基于小波变换和谱减法的改进的语音增强算法[J]. 电声技术,2018,42(12):8-12,69.
  [10] 张青,吴进. 基于多窗谱估计的改进维纳滤波语音增强[J]. 计算机应用与软件,2017,34(3):67-70,118.
  [11] 赵发. 基于多窗谱估计谱减法和能熵比法的语音端点检测算法[J]. 巢湖学院学报,2016,18(6):80-85.
  [12] EL-FATTAH M A,DESSOUKY M I,ABBAS A M,et al.?Speech enhancement with an adaptive Wiener filter[J]. International Journal of Speech Technology,2014(1):53-64?.
  [13] 严思伟,屈晓旭,娄景艺. 基于连续噪声谱估计的谱减法语音增强算法[J]. 通信技术,2018,51(6):1296-1301.
  [14] 张悦. 基于过量功率谱减的语音增强算法研究[J]. 蘭州文理学院学报(自然科学版),2017,31(5):89-92.
  [15] 屈晓旭,李朝辉,娄景艺. 改进谱减法语音增强研究[J]. 通信技术,2017,50(9):1925-1928.
  [16] 代龙翔,李冠宇,马宁. 基于谱减法语音增强效果研究[J]. 西北民族大学学报(自然科学版),2017,38(2):21-25,87.
  [17] 齐立萍,孙昊,杨鹏,等. 基于参数自适应的改进谱减法[J]. 科学技术与工程,2016,16(3):192-196.
  [18] 闵姝君.  基于自适应谱估计的语音增强算法研究及应用[D]. 济南:山东大学,2011.
  [19] 田莎莎,田艳. 基于改进谱减法的语音识别系统去噪[J]. 大众科技,2012,14(12):47-48.
  [20] 白静,史燕燕,薛珮芸,等. 融合非线性幂函数和谱减法的CFCC特征提取[J]. 西安电子科技大学学报,2019,46(1):86-92.
  (责任编辑:江 艳)
转载注明来源:https://www.xzbu.com/8/view-15252225.htm