多发音字典在维吾尔语方言语音识别中的应用

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:stayrose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。 The standard speech-based recognition system has a lower recognition rate when recognizing speech corpus with phonetic variations. To solve this problem, a method of generating multi-pronunciation dictionary based on standard Uyghur pronunciation dictionary is proposed. Based on the combination of expert experience and data-driven method, this paper analyzes the variation rules of the pronunciation of the Uyghur dialect, constructs the variation set of the pronunciation, generates the initial polyphony dictionary, and applies the automatic data processing algorithm and the threshold threshold method to make the dialect accent Automatically obtain streamlined multi-pronunciations dictionary for training speech data. Experimental results show that this method can enhance the recognition performance of Uyghur dialect accent.
其他文献
今年以来,广州石化在纪检监察干部和各直属党组织共同努力下,"教育、制度、监督、惩处"四位一体,齐头并进,党风建设和反腐倡廉工作取得了一定成绩。然而,滋生腐败的土壤和源头
<正>天津市和平区小白楼街地处天津市中心,面积2.27平方公里,居民11398户,30982人,有9个社区居民委会,223个社区社会组织。我街社区社会组织的建立和发展已近十四个年头,多年
会议
我国经济体制改革,各项法规制度逐步健全,在当前的建筑市场,加强工程造价管理是一项涉及面广,难度大的工作。只有认真须知工程造价管理,提高造价人员素质,才能有序的促进建筑业健康
高中化学空间结构问题主要包括有机模型问题、有机物分子共线、共面的问题、常见物质的键角与分子构型的关系和新情景的空间结构问题等。
经过不断扩招,我国高等教育进入大众化阶段。新升级的本科院校承担了大部分扩招任务规模迅速扩大,但大部分院校升级时间还不长,缺乏传统本科院校的经验沉积。ISO9000标准体系集
目前在我国的石油消费中,80%以上用于石油加工业、化纤制造业及化学原材料行业,足够的油料供应是保证这些行业持续发展的基础,而我国石油资源的持续紧张,使我国未来石化工业的发展
对屈服强度为350MPa级的压力容器用钢16MnR、20g和屈服强度为500MPa级的压力容器用钢CF-62进行厂疲劳裂纹扩展速率的试验研究和数据收集,试样分别为三点弯曲(TPB)和紧凑拉伸(
作为一种具有直接带隙的Ⅱ–Ⅳ族半导体材料,ZnO具有无毒、廉价易得、高效等优异性能,其应用范围已涉及到电子、光催化、橡胶等行业。本论文综述了含苯酚废水的特点、危害及处理方法,ZnO的晶体结构和性质,ZnO的化学合成法及其光催化降解苯酚的机理。采用溶剂热/水热法,通过改变反应时间、反应温度、辅助剂用量等参数,合成具有不同形貌的ZnO多级结构,同时用XRD、SEM、UV-Vis漫反射光谱和PL发射光谱