【摘 要】
:
语音识别将语音数据转换成文本序列,是人机语音交互的主要组成部分。语音识别技术从最初的孤立数字识别发展到现阶段的非特定人、大词汇量连续语音识别。语音识别包括三种模型
论文部分内容阅读
语音识别将语音数据转换成文本序列,是人机语音交互的主要组成部分。语音识别技术从最初的孤立数字识别发展到现阶段的非特定人、大词汇量连续语音识别。语音识别包括三种模型,分别为声学模型、发音模型和语言模型。发音模型对提高自动语音识别系统识别率的影响显著,所以研究发音模型是很重要的任务。因此本文以研究发音建模方法为目的,并专门就发音模型在维吾尔语自然口音连续语音识别系统中的应用方面做了探索和实验。本文的主要工作如下:1)研究了维吾尔语自然口语中发生的发音变异现象,归纳出造成发音变异的因素,并且建立了一个小规模的自然口音语料库,并按照语音语料库标注规范进行标注。2)研究了基于条件随机的维吾尔语自然口音发音预测模型。本文首先建立了1.3万个词汇的维吾尔语多发音词典,该词典包含每一个词的标准发音和发生变异的发音,并且在本文设计的特征模板的基础上建立了基于条件随机场的维吾尔语发音预测模型。最后对维吾尔语发音预测模型在测试集上进行发音预测实验。3)研究了维吾尔语发音预测模型在维吾尔语自然口音连续语音识别系统中的性能。本文采用维吾尔语多发音预测模型对维吾尔语6万个词进行发音建模,并且在自然口语语音库进行识别实验,从实验结果中可以看出,本文提出的维吾尔语发音建模方法有助于提高维吾尔语自然口语语音识别系统的识别率。
其他文献
2008年奥运会即将到来之际,了解宗教与奥运之间千丝万缕的联系,对于奥运安保人员有一定的警示意义.从奥运会的历史看,历届奥运会参与人数持续增长,来自于不同国家和地区,有着
2011年11月~2012年8月,采用WPS宽范围粒径谱仪在北京地区连续监测10nm~10μm间不同粒径大气颗粒物数浓度,并同步记录气象参数.结果表明,颗粒物数浓度均值为25014个/cm3,多呈
目的总结手术外伤性脾切除术后肠梗阻的诊治体会。方法分析2004年6月—2013年12月收入院的脾切除术后肠梗阻手术患者共45例,均行手术治疗,术式包括单纯的粘连松解术和粘连松
研究音乐创作中横向速度变化嚷术是作曲者在写作时对速度参数进行理性思考,使音乐作品表达更丰富而准确的内容。速度变化的意义一方面与人的心理相关,另一方面与人的生理相关,第
随着网络的迅猛发展,网络证据的收集保存难度逐渐提高,如何在网络取证中发挥公证制度的价值,是需要关注的重点话题。基于此,本文先是研究了我国公证制度网络取证的现状,然后
报刊是海外华侨、华人传承中华传统文化、保留华人特征的重要媒介,也是观察海外华人社会的重要窗口。菲律宾华文报业兴起于19世纪末,在20世纪50、60年代达到顶峰,70年代初受
分析研究一所城市的公共艺术设计可以将城市文化作为解读密码,城市文化不仅包括传统文化和新型文化,还包括未来的文化发展趋向。汕尾城市公共艺术设计既有传统文化的体现,也
"人性论"是中国传统文化中的主元素之一,也是研究传统文化不可或缺的内容。通过对相关文献材料的梳理,透析各家学派在人性论上的特点和异同,凸显人性论在传统文化中的地位和作
目的研究罗库溴铵与顺式阿曲库铵在全麻气管插管中的临床应用价值。方法选取我院在2013年5月至2015年1月收治的62例实施全麻气管插管麻醉患者,根据不同麻醉药物分为两组(n=31