【摘 要】
:
语音增强是语音信号处理领域一个十分重要的研究课题,其目的在于改进带噪语音的质量。该技术不仅与信号处理理论有关,还涉及到人的听觉感知学和语音学。语音增强是一项支撑技术,对于提升其它应用系统的鲁棒性起到至关重要的作用,如目前市面上的语音识别、声纹识别等智能设备使用语音增强技术来保障其整体性能的稳定性。近年来,基于深度学习技术的语音增强方法有了长足的进步,相较于维纳滤波、卡曼滤波等传统的增强方法而言,在
论文部分内容阅读
语音增强是语音信号处理领域一个十分重要的研究课题,其目的在于改进带噪语音的质量。该技术不仅与信号处理理论有关,还涉及到人的听觉感知学和语音学。语音增强是一项支撑技术,对于提升其它应用系统的鲁棒性起到至关重要的作用,如目前市面上的语音识别、声纹识别等智能设备使用语音增强技术来保障其整体性能的稳定性。近年来,基于深度学习技术的语音增强方法有了长足的进步,相较于维纳滤波、卡曼滤波等传统的增强方法而言,在性能及普适性等方面都表现出了较大的优势。本文在以下几个方面开展了研究工作:1)基于深度学习的语音增强技术;2)语音增强技术在说话人识别系统中的应用;3)基于深度学习的信源分离技术。本论文所取得的具体工作成果包括:(1)提出了基于零相位的端到端语音增强系统针对于语音增强中相位谱估计问题,提出了零相位特征提取方案,并结合Unet神经网络设计了端到端的语音增强系统。在该系统所采用的目标函数方面,对原始的wSDR方式进行了改进,有效提升了增强的语音的效果。(2)设计并实施了具备鲁棒性的端到端说话人识别系统将上述语音增强系统与基于I-vector的说话人识别系统进行了融合,同时提出了说话人模型及其得分机制的改进方案。实验表明上述改进提升了基础说话人识别系统的鲁棒性。(3)依托上述语音增强系统,提出了一种完成信源分离任务的深度学习架构。在该架构中,结合信源分离的评价指标,优化了系统的目标函数。
其他文献
目的 观察颈椎后路单开门联合微型钛板内固定治疗多节段脊髓型颈椎病的临床效果.方法 以116例多节段脊髓型颈椎病患者为研究对象,按随机数字表法分为对照组(58例)和研究组(58例),对照组行颈椎后路单开门联合缝线固定术,研究组行颈椎后路单开门联合微型钛板内固定术,比较两组手指标差异,测定JOA评分和颈椎椎管矢状径,评价手术临床疗效,观察术后并发症.结果 两组术中出血量、手术操作耗时和术后康复训练开始时间差异均不具有统计学意义(P>0.05);研究组术后12个月JOA评分和颈椎椎管矢状径数值均显著高于对照组(
移动通信技术的飞速发展引领了新型业务的出现和繁荣发展。尤其随着虚拟现实、自动驾驶、万物互联等概念的兴起,人们对通信服务质量提出了更高的需求。未来网络面临系统容量、用户体验速率、传输时延和资源紧缺等多方面的压力。毫米波以工作在30 GHz-300 GHz频段极大地丰富了频谱资源、缓解了移动通信系统中频谱资源短缺带来的挑战。而大规模天线技术以大规模天线阵列使用户获取高波束赋形增益,弥补毫米波信号高路径
如今,光接入网络中的流量趋势已从简单的基于Web的服务转移到了多媒体和视频服务。多播是一对多流量的转发方法之一。但是,由于它需要在路由器中存储很多状态,因此发展很少。依靠技术发展IP组播(IP MC)成为主要行业之一。在传统的多播中,它需要为每个会话维护一个路由条目(多播地址)。因此,它不能像单播一样通过前缀来聚合地址。因此,一个多播会话需要所有相关的路由器维护一个路由条目,这可能在传输过程中带来
目的 探讨三氧化矿物聚合物(MTA)修复在年轻恒牙活髓保存治疗术中的临床效果及对牙髓干细胞(DPSCs)体外增殖分化的影响.方法 行便利抽样法选取2018年1月至2019年7月期间收治于本院行年轻恒牙活髓保存治疗术的64例患者为研究对象,随机划分为研究组和对照组,每组32例.对照组行传统根尖诱导成形术治疗,研究组行MTA修复治疗.比较分析两组患者随访术后6个月修复成功率、术后12个月根尖周指数(PAI)和培养不同时间点的DPSCs体外增殖吸光度.结果 研究组术后6个月及12个月修复成功率显著高于对照组(P
区块链作为新兴分布式存储技术,在物联网系统中的得到了广泛的应用。使用区块链作为物联网数据共享系统的底层协议,提供了宝贵数据一致性、可靠性和可溯源性。然而,物联网系统与区块链技术结合也带来了新的有待研究和解决的问题。(1)区块链系统中的每条消息都通过数字签名保证消息内容的可靠性,但在面对大量传感器消息共享场景时,会带来高昂的密钥存储和通信负担。(2)传统物联网数据共享系统的信息发布只需要单轮广播过程