关于语音信号处理技术及应用的探讨
来源:用户上传
作者: 唐 欢
当今世界正处于工业时代向信息时代的飞速转变时刻,语音在人类社会中起了非常重要的作用。随着电子购物、因特网络的普及、多媒体通信及其应用的蓬勃发展,语音始终是人类互相交流、互相通信的最主要、方便、快捷的信息载体。
一、语言信号处理及技术的发展
随着科学技术的快速发展,语音信号处理取得了重大的进展:
20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换等是语音信号数字处理的理论和技术基础。
70年代后期提出了用于语音信号的信息压缩和特征提取的线性预测技术,并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法。
80年代初一种新的基于聚类分析的高效数据压缩技术―矢量量化应用于语音信号处理中;而用隐马尔可夫模型描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。
目前,人工神经网络的研究取得了迅速发展,它的许多成果也体现在有关语音信号处理的各项技术之中。
二、语音信号处理技术概述
语音信号处理是综合性的多学科领域和涉及面很广的交叉学科。它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。
语言信号处理大都采用数字计算机技术,所以又称为语言数字处理。语言信号处理的研究起源于对发音器官的模拟,即建立发音过程的数字模拟系统,亦即声道数字模型的研究。利用这一模型,可对语言信号进行分析与合成,借以发展各种通信频带压缩技术和保密通信的新体制。在语言分析合成的基础上,研制出了各种语言自动识别装置,赋予计算机以听觉功能。语言的信息主要包含在语言信号的参数之中。因此,准确而迅速地提取语言信号的参数是进行语言信号处理的关键。常用的语言信号参数有:共振峰频率、音调和嗓音噪声的判别等。这类参数仅反映发音过程的一些平均特性,而实际语言的发音变化相当迅速,需用非平稳的随机过程来描述。因此,研究语言信号动态的非平稳的参数分析方法得到迅速发展。
三、语音信号处理技术的应用
语言信号处理的研究应用于工业中,话控技术可提高生产的自动化水平,提高生产效率;医疗部门可通过语言信号处理对聋哑病人进行病情诊断。公安部门可利用发音特征的鉴别对作案人进行鉴定;国防部门能实现高保密通信,还可实现指挥员直接口呼命令;其中最重要应用包括语音编码、语音合成、语音识别以及语音增强等。
(一)语音编码
目前语音编码分为三类:波形编码、参量编码和混合编码。主要应用在通信领域。语音信号的传输和存储是语言信号的基本要求。对语音信号的传输,希望是传输的速度快,传输的质量高;对语音信号的存储,希望存储的空间小,存储的信息多。这两个方面的要求,促进了语音编码的产生。语音编码算法可以解决语音传输和存储的问题。所以,语音编码具有十分重要的价值,是目前语音信号处理最广泛的算法。
(二)语音合成
语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。
(三)语音识别
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统、语音控制系统、语音拨号系统、智能对话查询系统等等。
(四)语音增强
语音增强是语音信号处理的重要应用之一。由于人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声,通信设备内部电噪声,乃至其它讲话者的干扰。这些干扰最终将使接收者接受到的语声已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。语音增强技术就成为数字语音信号处理中的重要组成部分。
所谓语音增强就是对带噪语音进行处理,以改善语音质量。提高语音的清晰度、可懂度和舒适度,使人易于接受或提高语音处理系统的性能。大多数实用的语音增强系统均是由精确的噪声估计器和良好的滤波器来实现对带噪语音进行去噪。所以,研究语音增强具有十分重要的价值,无论在民用还是在军用都有非常大的应用前景。
(五)潜在的语音信号处理应用
语音信号处理在手持设备、移动设备和无线个人设备中的应用正在不断增加。语音功能为用户提供自然的输人和输出方式,它比其他形式I/O更安全。在大多数应用中,语音都是键盘和显示器的理想补充。其他潜在的语音应用包括如下几个方面:①个人信息管理。允许用户通过语音指定预约、查看日历、添加联络信息等等。②信息检索。股票价格、标题新闻、航班信息、天气预报等都可通过语音从互联网收听。③语音导航。在自动和人眼不够用的条件下获取导航的完全语音输人/输出驾驶系统。④语音浏览。利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。⑤语音电子邮件。包括浏览邮箱、利用语音输入写电子邮件以及收听电子邮件的读出。
四、总结与展望
随着计算机技术、数字信号处理技术和大规模集成电路的迅速发展,语音信号处理是目前发展最为迅速的信息科学研究领域的核心技术之一。语音具有便捷性、高效性、随机性、交互性等显著特点,是实现人机交互的一种重要通信方式,进一步提高社会的信息化和自动化程度。
参考文献:
[1]杨行峻等,《语音信号数字处理》电子工业出版社 1995年
[2]刘静萍,姜占财,德熙嘉措,语音信号的预处理技术探讨[J] 甘肃联合大学学报(自然科学版) 2006年05期
[3]韩纪庆,张磊,郑铁然,韩纪庆著,《语音信号处理》 清华大学出版社 2004年9月
[3]春勇,语音数据信号高质量无线传输解决方案[N] 电子报 2001年
作者简介:
姓名:唐欢,性别:男 学历:本科,出生年月:1986年2月生,籍贯:湖北宜昌,职称:学生,研究方向:物电工作单位:孝感学院
转载注明来源:https://www.xzbu.com/2/view-427022.htm