基于HTK的孟津方言语音识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:yuxk781224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术给智能时代的人们带来了极大便利,大大提升了人机交互的效率。尤其是在如今的移动互联网时代,智能移动终端等智能设备已经大范围普及,对于语音识别技术的研究需求比以前更大。在汉语语音识别方面,普通话及各大方言语系的语音识别已经相当成熟,然而在现实生活的使用场景上,即使是同一语系的方言也会有大的差别,这会影响到语音识别的识别率及系统的鲁棒性。在各类复杂环境及发音者自身因素的影响下如何提高系统对方言语音的自适应性仍然是个难题。而现在对于一些方言的语音识别研究还没有深入到如此小的语系分支。基于以上几点原因,以及笔者家乡在河南省洛阳市孟津县,对孟津方言十分熟悉,较易获取大量语音资料,因此选定此题目作为本文的研究课题。本文主要对语音信号的预处理、特征参数提取等进行了研究,并构建了基于HTK的孟津方言语音识别系统,主要内容如下:(1)阐述了本文的选题背景及意义,介绍了语音识别技术的发展和现状(2)概述了语音识别系统,介绍了语音识别系统的相关技术及其原理,从语料库的建立到语音信号的预处理以及特征参数提取的原理。(3)介绍了语音识别的模型,重点阐述了隐马尔可夫模型的思想及定义,给出了隐马尔可夫模型的三个基本问题的解决方案。(4)简介了 HTK工具包及其工作原理,给出了 HTK工具包在Windows 7环境下的编译过程。(5)介绍了基于HTK搭建语音识别系统的过程,给出了一个实例验证了此系统的可靠性,研究了孟津方言的语音特点,找了 10名年龄、性别、文化程度各不相同的当地人员录制了 200条训练语音数据和20条测试语音数据,搭建了基于HTK的孟津方言语音识别系统,进行了实验仿真。在实验室录音环境下39维MFCC特征参数提取条件下得出的词识别率为80.95%,13维MFCC特征参数提取条件下得出的词识别率为77.78%,然后又做了一个在微信语音录音环境下的对比实验,在39维特征参数提取条件下的词识别率为79.37%,13维MFCC特征参数提取条件下得出的词识别率为68.25%。
其他文献
草木染,“出方有土,采以时月”。用从山野植物萃取出染料染就的产品质朴、纯净、美好,凝聚着独特的东方美和天人合一的中国古典哲思。它有着悠久发展的历史,是中华民族长久以
人工髋关节置换术后护理非常重要,必须要调查资料、做好术前评估、确定护理问题、实施护理措施,术后护理观察病情及康复指导。本文通过对髋关节置换术后护理的分析,降低患者
在兰州至中川机场城际铁路建设中采用水泥掺量为12%,16%,20%的水泥土搅拌桩进行地基处理并观测其沉降,运用双曲线法、三点法、Asaoka法预测复合地基的沉降,研究水泥土搅拌桩
语音识别是人机交互最简单直接的方式,它是一门综合性学科,涉及语言学、模式识别、人工智能等一系列学科,具有非常广泛的应用前景。近年来,随着信息科技的发展,汉语语音识别
关于高空抛物侵权行为概念的界定是存在一定的争议的。《中华人民共和国侵权责任法》第87条规定了高空抛物侵权行为的责任承担方式,但是该法条所规定的这种侵权行为的存在在
搜索引擎已成为互联网流量分发器,大型正规学术论文网站应高度重视SEO技术,通过了解搜索引擎规律,优化网站结构、网站内容及用户体验,从而提升在线论文网站的流量及引用率。
在“与市场经济接轨”的旗号下,我们的教育似乎越来越“务实”,因而越来越远离理想。正是在这样的心境下,我读到了朱永新先生的新著((新教育之梦》。坦率地讲,对作者所憧憬的“新教
2015年我国的林场改革方案,将国有林场主要功能明确定位于保护培育森林资源、维护国家生态安全。如何让国有林场更好的发挥公共效益以及如何更全面的评价国有林场的综合效益
本文进一步简化了生物固氮研究中的乙炔还原定量的气相色谱法,并把其应用于测定植物生长调节剂对大豆根瘤固氮作用的影响。
从CO混合气中提纯CO、甲醇转化制二甲醚、甲酸甲酯制N─甲基甲酰胺通过国家验收由化工部西南化工研究院承担的从CO混合气中提纯CO的开发、甲醇制二甲醚和甲酸甲酯制N-甲基甲酰胺及其他产