自动语音识别噪声鲁棒性方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wuyiguogdut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别系统在噪声环境下的鲁棒性是语音识别系统从实验室走向实际应用的关键,其主要研究目的是为了解决应用环境与训练环境之间不匹配所造成的识别性能下降问题。本文在总结和分析现有噪声鲁棒语音识别方法的基础上,重点针对信号空间和特征空间的端点检测、语音增强和鲁棒特征提取等问题进行了一定的研究,具体的工作及创新如下:首先,本文对语音信号产生的数字模型和语音识别的基本原理进行了简单介绍,并根据语音识别系统的构成将自动语音识别中的噪声鲁棒性方法按照信号空间、特征空间与模型空间进行分类总结。然后,针对语音识别中预处理阶段的端点检测算法进行了分析,在研究基于短时能量、短时过零率和谱熵的端点检测算法的基础上,提出改进谱熵端点检测算法,仿真实验的检测效果优于基本谱熵算法,具有更好的噪声鲁棒性。再者为了抑制噪声对语音信号的影响,研究了谱减法与改进谱减法。仿真实验表明,两种典型的改进谱减法能有效地改善系统输入信号的信噪比。其次,从特征空间研究了鲁棒语音识别中的特征参数提取问题,分析比较了语音识别系统中常用的三种特征提取参数,线性预测系数(Linear Prediction Coefficients,LPC)、线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)和美尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)。构造出一种基于MFCC的鲁棒特征参数:SS-MFCC,在不同噪声环境下进行了识别实验,得到新的特征参数相对于MFCC的改善程度,验证了新参数的优良鲁棒性。最后,研究了隐马尔可夫模型,利用Matlab建立了一个基于HMM模型的语音识别系统。实验表明,综合各部分的算法建立起来的语音识别仿真系统,在信噪比为10dB的白噪声条件下对汉语数字0-9的识别率能达到83.75%,具有良好的鲁棒性。
其他文献
在各类光纤传感技术中,基于干涉原理的相位调制型光纤传感器由于其高灵敏度,高检测分辨率、传感对象广泛,结构多样化等优点,在光纤传感技术应用于军事、民用、生活各领域中均可扮
传统无线收发系统功能单一、可扩展性差,其局限性日益显现。软件无线电的出现从根本上改变了无线电台的设计理念,它强调以开放性的最简单硬件结构为通用平台,尽可能地用可升
本文的研究工作来源于国家 863 重大课题“TD-SCDMA 网络测试仪”。其中硬件部分要求完成数据采集、处理和提供软硬件接口功能。需要研制四种不同类型的板卡:STM-1 数据采集卡
随着移动通信技术的发展,手机成为人们日常生活中必不可少的通信工具,而 SIM/USIM 卡在第二代移动通信和第三代移动通信系统中担任了重要的角色,卡片内不仅存储着用户重要的帐户
超宽带(UWB)通信具有数据速率高、功率谱密度低、定位精度高以及抗多径能力强等优点。超宽带技术已成为短距离无线通信领域研究与开发的热点。本课题根据超宽带信号处理及实
近年来,随着移动台迅速普及,运营商提供的服务也更多样化,其中无线定位引起了强烈关注。自从美国联邦通信委员会于1996年发布E-911条列,规定移动通信运营商对移动用户提供一定精
随着计算机网络特别是Internet的发展,IPv4已经逐渐不能适应这种高速发展的要求,IPv6呼之欲出。对比IPv4, IPv6有如下的特点:简化的报头和灵活的扩展;足够大的地址范围和层次