语音识别抗噪算法的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:sdvfg4gf3fg3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引人的噪声,通信设备内部电噪声,乃至其它讲话者的干扰。这些干扰最终将使接收者接受到的语声已非纯净的原始语音信号。因此,语音抗噪技术就成为数字信号处理的重要组成部分。本文研究了谱减法的一般方法,在此基础上,论文提出了采用过零率的方法来确定带噪语音在语音间歇段的噪声功率谱,利用最小二乘法原理得到其它帧的噪声功率谱估计值。从带噪语音功率谱中减去噪声功率谱的估计值得到纯净语音功率谱。结合此功率谱值和原始的相位信息重建语音信号。仿真结果表明,算法在去除背景噪声的同时,保证了较小的语音失真,且很好的抑制了音乐噪声。小波分析由于能同时在时域和频域中对信号进行分析,所以它能有效地实现对信号的去噪。阈值的选择直接关系到语音去噪的效果,因此,本文提出了改进小波阈值函数的方法,该方法能够在自适应搜寻最佳阈值的的基础上满足对时变信号的实时处理,实验表明,该方法能有效地去除噪声,同时重构信号能较好地表示原始语音。由于谱减法和小波阈值去噪受噪声的影响较大。本文研究了一种不依赖于噪声估计的语音识别抗噪方法,该方法是基于隐马尔可夫能够有效地提取时序特征和小波神经网络能够细分类的基础上的,通过实验表明该方法在不同的信噪比的情况下比传统的隐马尔可夫(HMM)的识别率更高,在低信噪比的情况下效果更为明显。
其他文献
数字图像作为一种多媒体信息,在互联网及人们生活中扮演着举足轻重的角色。随着信息技术的快速发展,以及功能强大的图像编辑软件的出现,篡改数字图像变得更加简单,且人眼难于
家庭基站,即Femtocell,是一种移动通信系统室内覆盖的解决方案。目前研究WCDMA系统下的Femtocell基站侦听比较多。TD-SCDMA系统是我国自主研发的系统,起步较晚,所以TD-SCDMA
随着中国铁路系统的高速发展,人们也面临着越来越严重的铁路事故。与此同时,智能交通已成为交通科技领域的研究热点,然而,大部分的学者研究领域主要几种在公路交通,对铁路交
缺陷接地结构(DGS)是近年来在光子带隙(PBG)结构的基础上发展而来的一种新结构。DGS是通过在微波电路的接地板上蚀刻出周期的或非周期的形状,以改变电路衬底材料的有效介电常
移动通信近几十年来得到了广泛的研究,为人类社会的发展进步做出了巨大的贡献。尽管如此,电磁波在实际传输中却面临着更为复杂的传播环境。其中多径衰落效应是无线通信质量的
期刊
随着经济全球化的不断发展,人们的生产和生活不再局限于某一个城市或某一个国家,越来越多的公司或机构需要借助电视电话会议来完成彼此间的沟通。因此,清晰、高质量的宽带数
智能视频(IV,IntelligentVideo)是源自计算机视觉(CV,ComputerVision)的一种技术,是人工智能(AI,ArtificialIntelligent)研究的一个分支,它能够在图像及图像描述之间建立映射
近年来,随着微机电技术(MEMS)、无线通讯技术和数字电子技术的发展而出现了许多新的信息获取和信息处理方式,无线传感器网络是其中之一。无线传感器网络是无线Ad hoc网络的一