基于深度学习的单通道语音增强方法研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:wcfsoa2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术的目的是通过去除音频中的非语音噪音或去除语音混响等方式提高语音听感质量和语音可懂度。语音增强在通信系统、语音识别、助听器等场景有着广泛的应用。语音增强原本属于数字信号处理研究领域的一个研究方向,但随着深度学习技术的发展,目前越来越多的研究开始更偏重使用深度学习方法处理语音增强任务。得益于神经网络强大的建模能力,目前基于神经网络监督学习的语音增强方法相对于传统数字信号处理的方法已经取得了压倒性的优势。虽然基于深度学习的单通道语音增强技术已经取得了很好的效果,但在本文的研究与实验中发现,现有的基于深度学习的单通道语音增强技术仍存在较大的性能提升空间。为了进一步提升基于深度学习的语音增强算法的性能,本文先后提出了更加符合人类感官的相对损失函数和基于对抗训练的μ律压缩频谱对抗生成网络。均方误差是目前最常用的语音增强监督训练目标函数,但是该目标函数衡量误差的方式并不符合人类的感官响应,为此本文通过在语音频谱误差计算中引入频谱原始数量级的方式设计了更加符合人类感官的相对损失目标函数。实验结果显示相对损失在语音听感质量、语音短时可懂度和信号失真率等语音增强客观衡量指标上都取得了优于均方误差的得分。为了进一步提升单通道语音增强的性能,本文受对抗生成网络和语音压缩算法的启发设计了用于频谱生成任务的μ律压缩频谱对抗生成网络。μ律压缩频谱对抗生成网络在判别器中引入了新设计的可训练频谱压缩层以提升判别器的判别能力,同时使用可训练的压缩层约束生成器的训练以使生成器在训练过程中更容易发掘增强频谱和纯净频谱的差异。实验结果显示μ律压缩频谱对抗生成网络在语音听感质量、语音短时可懂度等各种衡量指标上已经超越了目前很多的单通道语音增强研究工作。
其他文献
青海云杉是中国特有树种,是祁连山地区主要森林再生树种,也是西北地区主要用材林。青海云杉目前的遗传改良还处于初级阶段,无法满足日益增长的青海云杉良种需求,亟需开展青海云杉良种升级换代工作。此外,青海云杉分子遗传学研究基础薄弱,缺少其基因组信息及特有分子标记,极大阻碍了青海云杉分子育种工作的进程。因此,本研究对来自甘肃省张掖龙渠青海云杉无性系种子园99个15年生和20年生的青海云杉半同胞家系进行了树高
废水排放是雌激素向环境暴露的重要途径,已引起各国学者越来越为广泛的关注。生物降解是去除环境中雌激素的一种重要方法,然而不同类型的微生物,特别是水环境中广泛存在的真菌和细菌,对雌激素类污染物去除效果的比较研究还较少。本文以17β-雌二醇(17β-estradiol,E2)为雌激素的典型代表,系统考察了真菌(产朊假丝酵母CU-2)和细菌(干酪乳杆菌LC-1)对E2的去除效能、影响因素、降解动力学、降解
栎属(Quercus L.)植物,分布广泛,是天然林中重要的组成树种,也是常用的绿化造林树种。栎属植物上寄生多种子囊菌并引起真菌病害,严重时导致树木死亡,甚至造成林分衰退,带来生态与经济损失。截至目前,中国栎属植物上记载的子囊菌多达100多种,但大部分物种缺乏菌株及基因序列,其分类地位不清晰,同物异名现象颇多,对病害防控以及森林经营管理带来一定的困难。本研究收集和观察了采自我国9个省(市、自治区)
学位
在气候变化、城市化和工业化背景下,水资源短缺与内涝灾害频发成为城市发展中亟需解决的问题。城市雨水收集利用系统(Rainwater Harvesting Systems,RHS)收集储存雨水资源并加以利用,具有缓解城市水资源危机及减轻供排水系统压力等功能。然而,在降雨和用水变化的影响下,RHS供水和径流调控功能的变化以及由此引起的经济可行性不确定是限制其广泛推广应用的重要因素。本研究以我国不同气候区
枣(Ziziphus jujuba Mill.)是我国独具特色的重要经济林树种,种质资源丰富。‘马牙枣’(Ziziphus jujuba Mill.Maya zao)是优良鲜食早熟品种,果皮薄,营养丰富,经济价值较高,深受消费者喜爱。前期研究中,本课题组采用秋水仙素田间诱导‘马牙枣’产生2n雌配子,自由授粉后获得了三倍体新种质。本研究以该三倍体种质为材料,进行父本分析,并在此基础上,通过对比观测该
落叶阔叶林生态系统在改善生态环境方面具有重要作用,北京松山位于暖温带与中温带的过渡地带,是典型的温带落叶阔叶林生态系统。研究该地区净生态系统生产力(NEP)变化特征是对森林碳循环规律研究领域的有效补充,对评估该地区森林生态系统固碳能力以及碳汇功能提升管理具有重要意义。本研究以北京松山落叶阔叶林生态系统为研究对象,利用物候相机拍摄的数字图像提取相对绿度指数数据拟合植被生长曲线,划分物候期;利用涡度相
学位
一级枝的垂直及水平分布构成树冠的基本形态,它决定了叶片的数量,从而影响树木本体与环境之间物质交换能力的强弱,影响树木有机物质的获取与积累。因此研究枝条因子的分布是研究树冠内部空间结构,分析树木对自然界物质吸收与转换程度的基础。长白落叶松是我国东北林区中分布广泛的用材树种之一。本文对不同年龄人工长白落叶松枝条基径、枝条长度、枝条角度、枝条数量的分布规律进行分析。通过方差分析判断差异显著性,并对差异显
植物的根系将土壤覆盖层锚固在下方的基岩上,可以极大地提高土体的抗剪强度。根系的力学性质一般包括根系的抗拉特性及根土界面摩擦性能,根系和土壤之间的摩擦力对于固持土体至关重要。自然界的植物根系承受山洪冲击、风雪荷载,相当于直接或间接地对根系施加了疲劳荷载的作用。本研究以冀西北地区常见乔木(白桦和落叶松)根系为研究对象,从根系直径、根系埋深、土壤含水率、生长环境(海拔)、生长方向和树种等方面考虑,对土中