基于迁移学习和自学习情感表征的情感语音合成

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:xiaohan5213250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学和人工智能等领域的发展,作为人机交互核心技术的语音合成技术已经较为成熟,但目前语音合成技术主要针对中性语音的合成,情感语音合成技术仍然有待提高。情感作为一种重要的信息,会很大程度上改变语音所表达的内容,在缺少情感信息时会造成表达有歧义、人机沟通不顺畅等问题。本文针对情感语音合成中的情感表征问题进行分析,提出了一种自学习情感表征方法,并且基于自学习情感表征提出了一种情感语音合成方法,主要研究内容如下:1.针对现有情感表征对情感的描述力不够、不同人进行情感语音标注时存在差异以及人力标注代价过大等问题,提出了一种自学习情感表征方法,该方法通过一种自编码网络对语音中的情感信息建模,将语音中的情感信息进行量化,在训练时使用了对抗训练的方法保证在情感建模的过程中不受到说话人个体差异的影响。实验结果表示,自学习情感表征在不需要人工参与的情况下具有较好的情感描述能力,解决了标注代价大和个体标注差异性的问题。2.提出了一种基于迁移学习和自学习情感表征的情感语音合成方法。该方法将文本无关说话人验证任务中的说话人判别模型迁移至情感语音合成方法中,用来提取说话人的个性化信息;将个性化信息、自学习情感表征与文本内容输入到端到端情感语音合成器中,合成梅尔语谱图;通过WaveNet声码器将梅尔语谱图转化为情感语音。该方法在训练时不需要情感标注信息和说话人标签信息,相比于其他情感语音合成方法更加灵活,实验结果表示该方法可以合成自然度和情感度较高的情感语音。
其他文献
目的:评估多层螺旋CT胸部低剂量扫描检测肺微小结节的灵敏度及显示结节征象的能力,探讨最优的扫描参数。方法:在模型预扫描的基础上,对200例行常规CT检查发现肺微小结节(直径
针对吉林春玉米氮肥施用中存在氮肥用量偏大,且具盲目性的现状,采用田间试验研究农民习惯施氮量和推荐施氮量下氮肥不同施用方式对春玉米干物质积累、子粒产量、氮素吸收和利
通过添加泡腾剂,使奶片溶于水后迅速溶解。具有了泡腾片的特性,实现口味上的多元化,适应不同消费者的需求。通过对奶粉、复合碱剂、复合酸和甜味剂四因素不同水平的正交实验.从奶
春玉米是我国东北地区主要粮食作物,但由于连年耕作和氮肥的高投入,春玉米农田也可能成为重要的温室气体排放源。因此,通过优化田间管理措施在保证作物产量的同时实现固碳减
星载合成孔径雷达(SAR)是一种以卫星为载体对地进行高分辨观测的成像系统,具有宽测绘带、不受国界、气象条件限制等优点,在实际应用中潜力巨大。目前在轨的星载SAR卫星均为低
从主电路、控制电路及相关技术等几方面 ,阐述了CO2 气体保护焊技术的发展。指出电力电子化是CO2 气体保护焊主电路的发展方向 ;微机化、智能化及精密化是CO2 气体保护焊控制
目的:观察血液透析后患者动静脉内瘘狭窄在超声引导下进行球囊扩张术治疗的临床疗效与安全性。方法:回顾性分析我院2016年2月至2018年12月住院的31例上肢动静脉内瘘血管狭窄
道岔是列车转入或越过轨道时必要的设备,是铁路的重要组成部分。但是由于长时间承受列车载荷所带来的冲击力,道岔的尖轨部分通常容易被磨损和产生裂纹。然而,现有的道岔探伤
产生于特定历史时期的《共同纲领》在新中国建国之初起到了"临时宪法"的作用。其产生的背景、过程与内容使其具有承上启下的特点。其中有些内容,如对民情国情的现实主义态度
目的评价患妊娠期糖尿病(gestational diabetes mellitus,GDM)的孕妇,其后代患自闭症谱系障碍(autism spectrum disorder,ASD)的风险。方法通过Pub Med、Springerlink、Web o