基于发音词典自适应的民族语口音汉语普通话语音识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:feiyelsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非母语口音、少数民族语口音是汉语普通话连续语音识别应用中必须面对的问题。论文以纳西语口音为实例,研究如何利用民族语口音的发音变异规律,在低成本和易于扩展的前提下,实现由标准普通话识别器到民族语口音普通话识别器的变换。论文的主要工作包括:(1)基于HTK平台,用863标准普通话语音数据库训练了一个标准普通话语音识别器,以作为基线系统。(2)采用MLLR和MAP方法,实现了对民族语口音语音数据的声学模型自适应。(3)用经过声学模型自适应的语音识别器对民族语口音语音数据进行语音识别,根据识别结果计算声母、韵母和音节的混淆矩阵。(4)研究民族语口音普通话的声母、韵母和音节的变异规律,采用专家知识指导下的数据驱动方法,设计出了一种新的多发音词典生成策略,以实现用某种口音(或某说话人)的音节混淆矩阵自动构建该种口音(或该说话人)的多发音词典。(5)在有语言模型和无语言模型的条件下,用实验验证了说话人相关、口音相关发音词典的有效性。实验结果表明,在有语言模型、不考虑声调的前提下,基线系统识别纳西语口音的最好识别率为:50.26%,引入MLLR+MAP声学模型自适应后识别率提高为:80.56%。在声学模型自适应的基础上,分别引入说话人相关、口音相关发音词典,则最好识别率可分别到达:85.15%、82.59%。
其他文献
深化教育体制改革,促进管办评分离,推进教育治理能力现代化使教育督导的重要性日益凸显。中小学责任督学挂牌督导制度的实施使责任督学成为督导队伍主体,督导职能转向学校办
目的:研究Wilms基因(WT-1)在急性髓系白血病(AML)病人骨髓细胞中的表达,并分析其表达与临床疗效的关系。方法:收集AML病人66例,其中急性早幼粒细胞白血病(APL)组8例,急性非淋
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
介绍了第二届北京国际快速成形及制造会议概况 ,分析了快速成形 (RP)技术的发展趋势 ,指出RP技术研究领域的重大进展及学科发展的主攻方向是 :由RP向快速制造 (RM )发展 ;由R
目的:通过研究丹皮酚对食管鳞癌细胞株KYSE450、TE10放射敏感性的影响及探讨该作用的分子机制,为丹皮酚作为放射治疗增敏药物应用于食管鳞癌的综合治疗提供根据。方法:稳定培
育雏是黑凤乌鸡饲养成败的关键,如果育雏技术不过关,会造成饲养失败而导致严重的经济损失.现将黑凤乌鸡的育雏技术要点介绍如下.
目的探讨经皮穴位电刺激在取卵术中对疼痛干预的效果及安全性。方法选择2018年1—6月在中国医科大学附属盛京医院生殖中心非全麻取卵患者100例,随机分为实验组与对照组各50例
市委十一届五次全会提出,全市各级党组织和广大党员干部群众要更加紧密地团结在以习近平同志为核心的党中央周围,不忘初心、牢记使命,坚定不移推动全面从严治党向纵深发展,毫不动
报纸
农产品触网,滞销商品变“网红”纸皮核桃、葡萄干、柿饼、红枣……这些都是陕西武功西域美农网络科技有限公司的主打产品。“有了电商,以前愁销路的农产品,如今都成了抢手的