基于HMM和ANN混合模型的孤立词语音识别研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户:qingshuiyilian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孤立词识别是生活应用最广的应用于人们的日常生活之中,如智能家居,汽车导航,手机软件,学习机等,孤立词识别有着很好的市场前景和研究价值。在语音识别领域中,动态时间规整(DTW)技术基于马尔可夫模型(Hidden Markov Model)技术是被广泛应用的。随着近些年的研究深入,人工神经网络(Artificial Neural Network)在语音识别的应用成为了一种新的研究热门。对于HMM模型,它有极强的动态建模功能,所以对于动态性能的语音信号建模有着很好的优势,但对于模型的分类功能略显不足。在ANN模型中,输入输出映射能力的优势,让它处理模式分类和判决的问题能力强大,但在动态信号处理能力,它的不足也是显而易见的。本文针对两种模型的优缺点,提出基于HMM-ANN混合模型,来提高信号的处理能力,从而提高孤立词语音识别系统的识别率,而在ANN模型中,我们采用概率神经网络(PNN)。本文的主要工作包括以下几个部分:(1)分析了孤立词语音信号的预处理与特征提取的过程,重点讨论了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种语音特征提取方法。通过对孤立词语音信号的预处理和特征提取,为了得到了能表示语音信号本质的特征参数,并减少由于环境噪声和发音长短不均和强度不同等因素造成的语音识别率偏低,提出一种基于自适应谱熵的端点检测,通过实验对比传统双限门算法与谱熵算法,后者对于孤立词是别的抗噪能力有了明显提高。(2)通过对传统HMM模型的算法的深入研究,Viterbi算法对于孤立词识别运算复杂,且系统的计算量过高。对于Viterbi算法进行改进与优化,提出了一种基于门限设置来优化算法,对于计算模型输出的最优路径最优路径。优化后的模型算法对于系统的识别时间,识别率都有了一定的提高。(3)研究了语音识别的现状和原理,比较ANN和HMM各自的优缺点及不足,构建了HMM-ANN混合模型,通过MATLAB软件分别仿真实现了HMM,ANN,HMM-ANN这种三种模型的孤立词的语音识别功能。
其他文献
采用大米米饭固体培养基培养出蛹虫草子实体,且进行了小规模中试,在菌株、培养基、接种方式三个因素中筛选出人工培养蛹虫草子实体高产的最优组合。
<正> 建设上海国际金融中心是由1992年10月召开的党的第十四次全国代表大会提出的决策:“以上海浦东开放为龙头,进一步开放长江沿岸中心城市,尽快把上海建成国际经济、金融、
中西方因地域、民族、文化、历史及社会经济的不同,而呈现出不同的艺术形式和艺术风格。中国水彩画作为从西方传入的艺术形式。来到中国后就必然受到中国传统文化的冲击和影响
目的:探讨西医基础上加粉萆薢治疗2 型糖尿病(Type 2 Diabetes Mellitus,T2DM)患者合并非酒精性脂肪性肝病(Non-Alcoholic Fatty Liver Disease, NAFLD)的可行性。方法:将110
<正>Am J Hypertens,2018,31(7):797-803.体位性低血压(orthostatic hypotension,OH)一般发生在站立后调节血压水平的机制发生变化以后。目前尚不清楚不同性别间OH的发生率和
研究现代信息技术环境下的初中英语教学,是初中英语老师的一个新的课题。本文从现代信息技术在初中英语课堂中的应用,在学生课外拓展中的应用以及在学生课后评价中的应用三方
目的探究有痛分娩与无痛分娩在产程观察以及分娩结果中的差别,并总结无痛分娩的优势.方法选取我院100名自然分娩的产妇作为研究对象,并将这些孕妇分成两组,一组是采用有痛分
翻译过程是译者的思维行动过程,译者的思维结构与翻译过程中出现的矛盾紧密相关,同时译者的思维结构与行为标准的关系就是翻译过程与翻译标准的关系,现代科技的发展推动着心
目的:探讨T3期声门上喉癌喉功能保留手术的可行性、技术操作和临床疗效。方法:回顾性分析1994~2003年收治的T3期声门上癌70例,均行喉功能保留手术,其中喉声门上水平部分切除