基于隐马尔可夫和人工神经网络混合模型的语音识别

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:shigaomin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一门内涵丰富,应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。在语音识别系统中,隐马尔可夫模型是当前最为流行的语音识别模型,占据着主导地位。HMM模型之所以应用较为成功,主要是它具有较强的对时间序列结构的建模能力,尽管如此,HMM技术也存在一些缺点,如:决策分类能力弱,需要语音信号的先验统计知识等。人工神经网络方法作为模拟人脑思维机制的工程模型,它与HMM正好相反,其分类决策能力和对不确定事物的描述能力已得到举世公认,但它对动态时间信号的描述能力尚不尽如人意。本论文在介绍HMM模型和人工神经网络的基本原理的基础上,将两种方法有机结合,进一步提高语音识别的准确率。 对于含噪语音信号的有效特征提取是语音识别至关重要的一步。本论文首先介绍了在语音识别中最常用的两种特征参数:基于发声系统模型导出的线性预测倒谱系数、基于听觉系统模型导出的Mel频率倒谱系数,而这两种特征参数在纯净语音下识别效果比较好,但是在噪声环境下识别效果不尽如人意。接着提出利用小波变换对含噪语音信号进行去噪的方法,再经Mel滤波器组转换为Mel频率下的倒谱系数,这种新的特征参数进一步反映了语音信号的动态特性、增强抗干扰能力,从而提高了识别率。 提出了用隐马尔可夫和人工神经网络混合模型对语音信号进行识别的方法,即有效的运用了经典HMM模型对动态时间序列较强的建模能力,又充分利用了人工神经网络较强的分类决策能力。实验证明,该模型适合于对噪声背景下的语音进行识别,同经典的HMM模型相比较,具有更好的抗噪鲁棒性,在信噪比较低的情况下,识别率比经典的HMM模型有明显的提高。
其他文献
应急通信系统在抢险救灾,各类事故突发情况的指挥调度有着非常重要的作用。文章通过对短波通信在应急通信中的优劣性进行全面的分析,研究了单载波频域均衡技术在应急通信系统中
智能科学的机制主义“信息-知识-智能转换”理论的提出使得与这一理论相关的许多基本概念和基本关系得到了初步的澄清,这不仅仅是一个理论研究的命题,它已经在许多应用研究中取
智能天线技术利用数字信号处理技术,产生空间定向波束,使天线阵列的主波束(主瓣)对准期望用户信号的到达方向,而旁瓣或者零陷则对准干扰信号的到达方向,达到充分高效的利用移动用
多输入多输出(MIMO)和正交频分复用(OFDM)结合形成的MIMO-OFDM技术,不仅可以实现高速率、大容量的传输,而且有很好的抗噪声、干扰和多径的能力,从而成为4G的核心技术。论文对空
动态频谱接入技术是认知无线网络研究的重要内容之一,其实现方式包括动态授权和动态频谱共享等。动态频谱共享技术将频谱资源同时授予多个网络,使频谱资源得到共享。本文的主要
无线通信的迅速发展使人们随时、随地接入Intemet的愿望成为可能,自组织网络就是一种基本无需基础设施支持的无线通信技术。但是当前自组织网络的发展遇到了一些技术瓶颈,如节
随着社会各方面的迅猛发展,IP可视电话将成为人们生活中的重要组成部分,它不仅适用于家庭生活,而且还可以广泛应用于各项商务活动、远程教学、安防监控、医疗诊断、科学考察等不
近年来由于集成工艺水平的提高,电路设计技术的不断改进,模拟集成电路的设计得到较大的进展,同时对电路的性能提出新的挑战。目前随着便携式电子系统的普遍应用,对模拟集成电路的各方面性能也有了更高的要求。带隙基准电压源之所以是模拟电路中重要的模块,是因为它能够提供近似恒定的参考电压,这个电压不随温度,电源电压,工艺的变化而变化。这一特性使得带隙基准电压源在诸如DC-DC电路,模/数转换器(A/DConve
阵列信号处理技术一直是近些年来国内外十分关注的研究焦点,阵列信号处理技术中一个很重要的研究方向就是目标方位估计。在这个领域,目前的一个热点是分布式目标的方位估计,之所