智能家居在线语音识别技术
来源:用户上传
作者:
摘要:针对智能家居而言,它是一个非常典型的的3C系统,将计算机以及通信等集为一体。通过各种技术的应用连接家庭智能设备,主要包括网络传输技术、音视频技术、信息处理技术等,利用效率极高的管理系统对全部设备进行统一管控。根据人类交流的实际情况来看,最为直接的一种方式为语言交流。当应用智能家居的时候,有机结合语音识别技术和控制技术,这是现在一个热门话题。随着智能手机的应运而生,不断促进语音识别技术发展。专用语音识别芯片在传统智能家居系统中主要被用来管控智能设备,目前所研究出的语音识别产品通常将互联网作为重要依靠。为使硬件资源得到有效节约,并且改进与完善互联网存在的问题和缺陷,本文探究了智能家居中在线语音识别技术的应用。
关键词:智能家居;在线;语音识别技术
引言:
随着社会的发展和科学技术的进步,广大群众的生活水平不断提升,在日常生活中越来越频繁地与机器进行交流。家庭是人们生活中最频繁和最直接的互动形式,各种家用电器已融入人们的生活。随着生活节奏的加快,人们更倾向于与家庭智能互动而不是传统的家用机器按钮,从而创造了智能家居的概念。语言是人与人之间最自然、最直接的交流方式。随着软硬件的快速发展和各种模型的改进,语音识别技术正变得越来越成熟。
一、语音识别与智能家居
在智能家居市场不断发展的过程中,充分结合智能家居和语音,在此基础上互联网巨头进入到智能家居行业中。日益加大Apple HomeKit智能家居平台和Siri的整合强度。再如微软,对Cortana这一语音助手进行發布,突出其在智能家居行业中的重要地位,使其成为互动门户。由众多互联网行业巨头向语音领域加大投入能够看出,目前智能家居与在线语音的融合已经成为一种必然趋势。在今后的智能家居设备中,语音这种人类最直接与方便的交流方式占据着举足轻重的地位[1]。
1.语音识别技术
语音识别技术还可被称之为自动语音识别,也就是ASR,该技术主要服务于人类,主要目的是转化存在于我们语音之中词汇,使其成为计算机能够读写的输入。相较于说话者识别及其确认,存在较大差异,通常所识别和确认的是说话者,并非蕴含其中的词汇内容。将语音识别技术结合机器翻译等处理技术,能够组建成复杂度更高的应用程序[2]。随着语音识别技术的不断发展,目前已经在计算机的多种处理技术中占据至关重要的地位,成为一项关键技术。
2.语音识别算法
目前,代表性语音识别方法主要包括动态时间规整技术、隐马尔可夫模型、矢量量化、人工神经网络、支持向量机、独立分量分析等方法。
动态时间扭曲(DTW)是一种简单有效的非特定人员语音识别方法。解决了具有不同发音长度的模板匹配问题,这是语音识别技术中早期且更常用的算法。
隐马尔可夫模型(HMM)是语音信号处理中的统计模型。由于模式库是通过重复训练形成的最佳模型参数,并且具有与训练输出信号一致的高概率,代替预先存储的模式样本,并且在识别过程期间,将与要识别的语音序列和 HMM参数之间的最大似然比相对应的最佳状态序列用作识别输出,因此是较理想的语音识别模型。
矢量量化是信号压缩的重要方法。与HMM相比,矢量量化主要应用于孤立词汇的小词汇量和词汇量。
人工神经网络(ANN)本质上是一种模拟人类神经活动原理的自适应非线性动力学系统。凭借其适应性、并行性、容错性和学习特性,其强大的分类和输入输出功能在语音识别中具有吸引力。
支持向量机是一种应用统计理论的新型学习机模型。支持向量机因其良好的理论基础而被广泛应用于各个领域。近年来,已经进行了许多研究以使用支持向量机对扬声器进行建模[3]。
二、基于 NL6621 嵌入式硬件设计
用于语音识别的硬件平台主要包括中央处理单元NL6621、可读写存储器、声卡芯片vs1003以及一些外围设备。MCU采用的最高主频为160 MHz,支持802.llb/g/n/i/e/p和Wi- Fidirect、BSSSTA、软AP、Wi-Fi保护设置以及WMM-PS和WPA/WPA2安全协议。编解码器芯片是vs1003它与核心控制器NL6621的数据通信是通过SPI总线执行的。它集成了麦克风输入、音频输出和IMA ADPCM编码,用于麦克风输入或线路输入,以便有效接收和播放音频信息。
三、基于 NL6621 嵌入式软件设计
软件设计主要包括两部分:软件控制嵌入式系统和基于HMM技术的语音识别算法。主要使用NL6621提供的软件开发套件,使用SDK编写应用程序,包括硬件引脚初始化、波特率匹配、录制文件配置、Wi- Fi配置、录制、音频文件格式转换,编程需要使用编程工具进行编程。系统然后开始工作,通过语音输入设备MIC收集语音,并通过声卡VS1003输入语音。
四、智能家居中在线语音识别技术的应用
1.在智能电视中的应用
该应用包括语音输入、处理和执行三个部分。第一种是语音输入,可以通过遥控器、智能电视的内置麦克风或相应的移动应用程序完成。但是,使用移动应用程序需要用户将移动电话和电视放在同一网段上,并通过WiFi传输语音数据。用户可以通过告知他们的需求来实现智能电视操作,例如更换频道、浏览网页或打开下载的应用程序。第二是处理语言信号。首先,通过网络,在特征提取和降噪处理之后,语音信号被发送到网络识别客户端。然后,网络识别客户端将其发送到智能电视以执行命令。第二是在本地识别。最后,在语音识别引擎处理语音信号之后,执行用户命令将命令发送到相应的接口,以实现相应的功能模块。
2.在空调方面的应用
目前,由于家中的空调大多数没有连接到网络,因此语音信号的识别通常在本地进行,所以不能通过网络进行语音输入。那么,用户只能通过遥控器或家用空调的内置麦克风输入语音。语音的处理也需要在本地完成,这需要用户建立自己的同义词库。在空调处理之后,用户自己的语音特征向量被存储在同义词库中。创建词汇表后,用户命令的执行很简单。例如,如果用户想将温度升至26°C,他只需要说“空调”,“电梯”“2”,“6”和“空调可以正确地处理和执行用户的命令。
3.在照明方面的应用
在家庭照明系统中主要有两种组成部分,一是语音采集设备,二是控制中心。相较于智能电视与智能空调,家庭照明系统存在着较大差异,必须进行布线。但是,所应用的语音输入方法一致,同时语音信号能够通过不同类型的语音获取设备进行收集,比如内置麦克风或者是远程设备。根据大部分家庭照明系统的实际情况来看,在采集语音信号时均应用内置麦克风,而且会产生比较大的噪声,所以有必要加大降噪强度,和家庭应用的空调相同,该系统同样没有与网络设备连接,所以必须在本地识别语音信号,还能够利用同义词建立这一方式达到目的。对比家庭空调,该方式的更为简单便捷,最后将同义词词库存放于存储器内,便可实现智能化目的。
结束语:
综上所述,在线语音识别技术已经被广泛应用于智能家居中,如上述所呈现的智能电视、照明以及空调等,除此之外还有扫地机器人等方方面面的应用。通过应用在线语音识别技术能够使广大群众的家庭生活发生翻天覆地的变化。
参考文献
[1]侯猛,胡晓红,赵航涛.在线语音识别技术在智能家居中的应用[J].信息与电脑(理论版),2018(24):118-120.
[2]孙羽川. 工程模拟器音效仿真及语音通话系统设计[D].西安理工大学,2018.
[3]伍斯龙. 群智感知中语音识别系统的研究与实现[D].华南理工大学,2013.
(作者单位:江苏崇德电子有限公司)
转载注明来源:https://www.xzbu.com/1/view-14738021.htm