基于HTK的汉语连续语音识别系统的设计与实现

被引量 : 0次 | 上传用户:gn64954
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别最直接的目的是让计算机听懂人说的话。经过半个多世纪的发展,语音识别理论已趋近成熟。大量的实验结果和实践操作证明,日前很多语音识别算法和识别模型非常有效。语音识别技术已被广泛应用于各行各业中。本文主要探究了语音识别理论在汉语连续语音识别中的应用。本文先介绍了语音识别系统的基本流程,语音信号处理的基本理论并且重点探讨了端点检测、特征参数提取的方法和原理。然后再从以下两方面对汉语连续语音识别的方法、原理进行深入的阐述:一方面从模式识别的研究角度,探讨了汉语语音的发音特点,提取了适合汉语语音识别的特征参数,训练了相应的语音识别模型,并且建立了汉语连续语音识别实验平台。本文基于隐马尔可夫模型(HMM)的连续语音训练和识别算法理论,结合美尔频率倒谱系数(MFCC)提取技术,单音素HMM建模技术,基于上下文相关的三音素HMM建模技术以及基于维特比算法的识别技术等一系列技术,利用隐马尔可夫模型工具箱(HTK)构建了基于HTK的连续语音识别实验平台。实验结果表明,随着HMM从单音素建模到三音素建模的转换,测试语句在语句级和字词级的识别率都呈增加的趋势,捆绑三音素后识别率达到稳定状态。语句级和字词级的识别率分别由开始的76.00%和90.67%提高到最后的96.00%和98.00%,识别效果非常理想。另一方面从语音识别软件开发的角度,设计和实现了汉语连续语音识别售票模拟系统。文中先介绍了HTK接口应用程序ATK (An Application Toolkit for HTK)的基本组成和基本原理,接着利用ATK在VS.NET平台上实现了汉语连续语音识别售票模拟系统,最后进行了相应的平台测试。测试结果表明它基本实现一个初级汉语语音识别售票系统的功能。
其他文献
人物在艺术作品中的地位极为重要,无论是从古代到现代,还是从国外到国内,人物的表现方法总是独树一帜,拥有极为多变的表现风格,这点在平面设计作品中被应用地越来越广泛。根
本文对邯郸市60家酒店员工进行了工作满意度问卷调查,并且对造成员工不满的因素的原因进行分析。本文主要从员工的个人属性和社会属性两个方面惊醒研究,个人属性主要是针对个
当前我国已进入社会转型期,社会阶层和社会结构发生激烈变动,人们的价值取向越来越多元化,多元的价值观念如果处理不好,必定会引起冲突。受社会文化的影响,作为机关软实力和
目的本研究主要针对常用的预防或延缓糖尿病的两种措施即生活方式调整与二甲双胍干预进行临床实证研究。通过对其实施后的血糖指标的变化、两种干预措施的依从性、体重变化、
在现实中旅游开发规划理论多运用在指导某个旅游景区的开发和规划上,而对于某个地区的旅游开发规划并没有系统指导理论。本文从发展移民县城云阳地区经济和旅游业的角度出发,
隐私人人有之,但是却没有人愿意公开自己的隐私。隐私权人人需要,但却没有人敢于大胆主张自己的隐私权。人人都希望保守个人的隐私不为他人知道,但人人却又希望能了解到他人
目的:冠心病是成人死亡的主要原因,随着我国人民生活水平的不断提高,冠心病发病率、死亡率呈逐年上升趋势,严重危害着我国人民的健康。本研究在基于冠心病心绞痛既往病例回顾
歌剧自诞生后经过了一百多年的发展,意大利正歌剧逐渐变成了宫廷结庆社交的装饰品,无论从作曲家还是从歌手和听众都是沉湎于一种虚荣、虚化的状态之中,而它的题材都是关于历
以往的文献或者研究都将经济增长的原因归结到资本、劳动力的投入,后来深入到技术的进步,认为内生的技术因素是经济持续增长的原因,在波特的国家竞争力提出之后,产业集聚正逐
销售人员是企业最为宝贵的资源之一。合理的销售考核制度,能够充分调动销售人员的积极性,实现人尽其才、才尽其用,在实现企业价值最大化的同时,也实现销售人员个人价值的最大