基于分节信息的方言语音系统的研究与实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:sunsarry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习的兴起引领了现代语音识别技术的发展,深度神经网络相较于传统机器学的优势主要表现在几个方面:首先,深度神经网络在训练过程中整合了特征提取,而传统的机器学习模型的特征提取与模型的训练问题是相互独立的。其次,深度神经网络擅长端到端的学习,具有强大的非线性特征表达能力。语音识别的广泛应用建立在不断提高性能和鲁棒性的基础之上,这些都是语音识别研究永恒不变的主题,这个主题有各种不同切入点。本文从发音学的角度出发,在前人研究的基础之上,结合语音识别的特点,研究了如何利用深度神经网络模型提取分节信息,并考量分节信息对语音识别性能提高的程度,以期在方言口音的差异上更好地利用分节信息。深度神经网络强大的表达能力很适合作为提取特征的模型,在这方面借鉴前人的“转换提取”分节信息的经验和采用联合学习的思想,利用基于联合学习的训练方法改进了语音特征提取模型的方法。本文研究了深度学习优化学习方法,并在知识蒸馏(knowledge distillation)方法的基础上,在声学模型上应用广义蒸馏学习方法来利用分节信息,将大模型上学习到的分节特征的知识迁移到较为精简的小模型上。使用口音差异数据集和蒸馏方法训练几组略精简的模型,并在教师模型的训练上应用了改进的分节信息提取方法,对比各个模型在语音识别的性能上的差别,得出性能较好的模型。
其他文献
针对树木生长建模的复杂性和挑战性,采用分形的方法对树木的生长过程进行建模。根据树木枝干和叶片的自然生长特点,模拟叶片的生长过程,采用分形的算法生成树木的主要枝干,并
针对部分上市公司存在的股权质押情况,2018年10月以来,政策层面陆续采取一系列“纾困”措施,以化解可能由此引发的风险。$$单就上市银行而言,股东股权质押问题也已经得到明显缓解
报纸
要使施工质量得到保证,除了施工中使用合格的材料、优秀的施工人员外,最主要是严格按照相关国家规范和有关标准的要求来完成每一道工序,严禁偷工减料,狠抓施工过程的质量控制
反贫困是桂西区域经济发展的一项重要内容.桂西反贫困必须突出:多元化模式反贫困;主体化主体反贫困;市场机制反贫困;项目基点反贫困;生态重心反贫困;发展区域经济反贫困;税费
犊牛腹泻是指哺乳期犊牛由多种原因引起的以腹泻为特征的疾病。本病一年四季均可发生,尤其以初春及夏末秋初多发,于出生后3周龄以内的新生犊牛多发生,特征是拉稀便,软便或水
期刊
化工过程的安全管理与化工企业的健康快速发展具有直接关系,因此,为了确保化工企业有序的运转,相关人员及部门应该加强对化工过程的全方面安全管理。在化工过程中,多种易燃易
高职院校是我国高等音乐教育中的重要组成部分,在大力倡导素质教育的今天,绝大多数职业院校都纷纷开设了音乐欣赏类的课程,在取得良好教学效果的同时,也出现了很多的问题。本
神秘主义,从灵学史的角度来考察,是一个世界现象。所以考察俄罗斯神秘主义的流行,就必须放在一个大环境下来思考。俄罗斯神秘主义流行与前苏联的演变有密不可分的关系,与美苏
十八届三中全会发布了《关于全面深化改革若干重大问题的决定》后,对于《决定》中提出的组建若干国有资本运营公司,笔者认为,可从以下四方面入手。$$ 一是通过国有资本经营公
报纸
新世纪哈佛大学本科课程改革中的普通教育强调对哈佛大学普通教育传统的继承,以分配要求替代目前的核心课程,强调各系的课程在普通教育中的作用,突出普通教育课程的跨学科特点,坚