语音识别中基于模型补偿的噪声鲁棒性问题研究

被引量 : 0次 | 上传用户:lifeonetime
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在噪声环境下的语音识别鲁棒性算法研究是当今主流语音识别系统中最重要的研究课题之一。虽然当前的语音识别系统在实验室环境下已经取得了令人满意的成果,但是实际使用情况下,语音识别系统的识别率受不同类型的噪声干扰相比实验室环境将有非常大的减低。在这一背景下,本文围绕如何在噪声环境下对语音声学模型进行针对性的补偿,使得它更加吻合加噪语音的分布规律从而提高语音识别系统识别率这一研究方向,进行了较系统而深入的研究。并且在模型参数补偿算法、声学模型训练算法等方面都有一定的创新。首先,本文介绍了我们所提出一种新的语音声学模型在噪声环境下的参数补偿算法—UT变换补偿算法。针对声学模型参数在噪声环境下非线性变化的补偿问题,现在国际上广泛使用的PMC和VTS声学模型参数补偿算法只能达到其线性展开的一阶近似,所以本文通过使用自动控制领域用来提高扩展卡尔曼滤波器性能的称作Unscented Transformation(简称UT)的技术,可以达到对声学模型参数非线性变化的二阶近似,得到的声学模型参数更加精确。在对声学模型静态参数的补偿过程中,我们提出了多种不同的使用UT变换算法的工程实现方法,其中效率最高的实现方法相对于传统的UT变换实现方法效率提升了6倍以上,最终实验结果证明其相对于传统的VTS方法具有明显的优势。其次,我们尝试将UT变换补偿算法进一步扩展到对声学模型动态参数的补偿工作中来。语音特征信号中动态特征复杂的计算方法使对于声学模型中动态参数进行补偿变的非常复杂。在本文中,我们通过严格的数学推导获得了准确的动态参数非线性变化函数,并利用UT变换补偿算法进行补偿。实验结果表明,UT变换补偿算法的优势得到充分发挥,进一步提高系统性能。最后,受到语音识别领域最近几年在说话人自适应训练方面不断取得进展的启发,本文第一次提出了基于噪声环境下模型参数补偿算法的模型自适应训练算法。在本文中,针对我们在模型参数补偿过程中所使用的VTS算法,利用使补偿以后的声学模型针对带噪语音数据似然度最大的准则,将待补偿的声学模型直接训练出来,从而在最终的模式识别中取得更好的结果。噪声补偿模型自适应训练方法是一种较好的将非线性变化补偿算法的误差吸收到声学模型自身中去的训练方法。实验表明,该算法显著降低了语音识别系统的识别错误率,并且已经成为现在噪声环境下语音声学模型训练的基本方法之一。
其他文献
配电网电压等级的优化配置是提高配网输送能力、降低网损、提高系统稳定性的有效手段和重要措施。由于配网负荷的不断增大,导致了供电半径减小,电能损耗增大,变电站密度增加
基于灰色系统理论,建立了原地浸出采铀浸出液铀浓度的预测模型。通过实际生产数据,讨论了GM(1,1)在浸出液铀浓度预测的方法,给出了VB程序的具体实现方法。
介绍了一种新型加工技术——旋转车削,根据其加工特点提出有限元模型,并用有限元软件对旋转车削和硬车削进行模拟仿真,重点对比分析其等效应变、等效应变率、等效应力和温度
1997年9月中共十五大报告首次提出“现代服务业”这一概念以来,中国现代服务业的发展突飞猛进,取得了骄人的成绩。然而在对现代的服务业研究中,发现国内现代服务业存在明显的
目前广西在建高速公路14条,总里程1485公里,概算总投资856亿元,其中隧道累计有155座,隧道工程总投资超过60亿元。以目前情况来看,公路隧道运营10年左右均进入维修高峰期,可见
纵观北岛在国内与海外三十年的创作,其文体样式表现为多样化的特点,各种文体之间也内蕴着丰富的对话性和开放性,而且诸文体之间形成了多重的复调结构,这种复调结构通过诗歌、
目的:总结先天性肺动脉瓣狭窄(PS)经皮INOUE球囊扩张成形术(PBPV)的经验,评价其即刻疗效、安全性。方法:2012年5月至2014年5月间,共对14例单纯肺动脉瓣狭窄患者应用INOUE球囊行PBPV
知识经济的到来使得人才日益成为企业竞争力的核心,对人才的内在素质,包括知识、行为、个性特征、内驱力等因素与工作绩效之间关系的研究日益深入,基于胜任特征的人力资源管
钢结构住宅建筑具有重量轻、抗震性能好、施工周期短、工业化程度高、环保效果好等特点,符合我国国民经济可持续发展的要求。我们的国情决定了钢结构住宅的发展不可能照抄西
目的调查普通外科住院手术患者入院时营养风险、不足和住院期间营养支持情况。方法采用定点连续抽样方法,对2010年1月至2011年11月在该院普通外科住院手术患者应用营养风险筛