基于HMM和ANN混合模型的孤立词语音识别研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户：qingshuiyilian

【摘要】

：

孤立词识别是生活应用最广的应用于人们的日常生活之中,如智能家居,汽车导航,手机软件,学习机等,孤立词识别有着很好的市场前景和研究价值。在语音识别领域中,动态时间规整(D

【作者】

：

罗洋

【出处】

：

昆明理工大学

【发表日期】

：

2018年01期

【关键词】

：

HMM-ANN混合模型语音识别特征提取端点检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

孤立词识别是生活应用最广的应用于人们的日常生活之中,如智能家居,汽车导航,手机软件,学习机等,孤立词识别有着很好的市场前景和研究价值。在语音识别领域中,动态时间规整(DTW)技术基于马尔可夫模型(Hidden Markov Model)技术是被广泛应用的。随着近些年的研究深入,人工神经网络(Artificial Neural Network)在语音识别的应用成为了一种新的研究热门。对于HMM模型,它有极强的动态建模功能,所以对于动态性能的语音信号建模有着很好的优势,但对于模型的分类功能略显不足。在ANN模型中,输入输出映射能力的优势,让它处理模式分类和判决的问题能力强大,但在动态信号处理能力,它的不足也是显而易见的。本文针对两种模型的优缺点,提出基于HMM-ANN混合模型,来提高信号的处理能力,从而提高孤立词语音识别系统的识别率,而在ANN模型中,我们采用概率神经网络(PNN)。本文的主要工作包括以下几个部分:(1)分析了孤立词语音信号的预处理与特征提取的过程,重点讨论了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种语音特征提取方法。通过对孤立词语音信号的预处理和特征提取,为了得到了能表示语音信号本质的特征参数,并减少由于环境噪声和发音长短不均和强度不同等因素造成的语音识别率偏低,提出一种基于自适应谱熵的端点检测,通过实验对比传统双限门算法与谱熵算法,后者对于孤立词是别的抗噪能力有了明显提高。(2)通过对传统HMM模型的算法的深入研究,Viterbi算法对于孤立词识别运算复杂,且系统的计算量过高。对于Viterbi算法进行改进与优化,提出了一种基于门限设置来优化算法,对于计算模型输出的最优路径最优路径。优化后的模型算法对于系统的识别时间,识别率都有了一定的提高。(3)研究了语音识别的现状和原理,比较ANN和HMM各自的优缺点及不足,构建了HMM-ANN混合模型,通过MATLAB软件分别仿真实现了HMM,ANN,HMM-ANN这种三种模型的孤立词的语音识别功能。

其他文献

蛹虫草高产子实体固体培养条件的优化

采用大米米饭固体培养基培养出蛹虫草子实体,且进行了小规模中试,在菌株、培养基、接种方式三个因素中筛选出人工培养蛹虫草子实体高产的最优组合。

期刊

蛹虫草米饭培养基高产子实体

上海如何推进国际金融中心建设

<正> 建设上海国际金融中心是由1992年10月召开的党的第十四次全国代表大会提出的决策:“以上海浦东开放为龙头,进一步开放长江沿岸中心城市,尽快把上海建成国际经济、金融、

期刊

国际金融中心建设

中西方早期水彩画艺术的审美比较

中西方因地域、民族、文化、历史及社会经济的不同，而呈现出不同的艺术形式和艺术风格。中国水彩画作为从西方传入的艺术形式。来到中国后就必然受到中国传统文化的冲击和影响

期刊

水彩画中西方审美比较

中西医结合降低尿血酸治疗2型糖尿病合并NAFLD的临床研究

目的:探讨西医基础上加粉萆薢治疗2 型糖尿病(Type 2 Diabetes Mellitus,T2DM)患者合并非酒精性脂肪性肝病(Non-Alcoholic Fatty Liver Disease, NAFLD)的可行性。方法:将110

期刊

二甲双胍粉萆薢2型糖尿病非酒精性脂肪性肝

体位性低血压的危险因素:老年男女存在差异

<正>Am J Hypertens,2018,31(7):797-803.体位性低血压(orthostatic hypotension,OH)一般发生在站立后调节血压水平的机制发生变化以后。目前尚不清楚不同性别间OH的发生率和

期刊

体位性低血压患病率收缩压危险因素

现代信息技术环境下的初中英语教学

研究现代信息技术环境下的初中英语教学,是初中英语老师的一个新的课题。本文从现代信息技术在初中英语课堂中的应用,在学生课外拓展中的应用以及在学生课后评价中的应用三方

期刊

现代信息技术初中英语教学英语课堂课外拓展课后评价

有痛分娩与无痛分娩中的产程观察及分娩结局对比研究

目的探究有痛分娩与无痛分娩在产程观察以及分娩结果中的差别,并总结无痛分娩的优势.方法选取我院100名自然分娩的产妇作为研究对象,并将这些孕妇分成两组,一组是采用有痛分

期刊

有痛分娩无痛分娩分娩结果

论译者的思维结构

翻译过程是译者的思维行动过程,译者的思维结构与翻译过程中出现的矛盾紧密相关,同时译者的思维结构与行为标准的关系就是翻译过程与翻译标准的关系,现代科技的发展推动着心

期刊

译者翻译过程思维结构

保留喉功能的T3期声门上喉癌的手术治疗

目的:探讨T3期声门上喉癌喉功能保留手术的可行性、技术操作和临床疗效。方法:回顾性分析1994~2003年收治的T3期声门上癌70例,均行喉功能保留手术,其中喉声门上水平部分切除

期刊

喉肿瘤喉切除术喉功能

基于HMM和ANN混合模型的孤立词语音识别研究

其他学术论文