低信噪比环境下语言增强的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:moxiaomi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类相互之间交流信息最快捷、最重要、最有效和最方便的形式。然而在实际环境下的语音应用过程中,如语音识别、语音编码、语音转换、语音通信等,不可避免地受到来自周围环境的各种噪声影响。噪声严重影响着这些应用技术的性能,甚至导致系统失败。语音增强是解决噪声污染的有效方法,其目的是从含噪语音信号中尽可能提取纯净的语音信号,抑制背景噪声,提高语音的清晰度和可懂度。该技术涉及诸如助听器、电子耳蜗、盲人语音通信、人机交互系统和移动语音通信等多方面的应用。   近年来出现了多种语音增强方法,这些技术在较高信噪比时已取得比较好的效果,然而对弱语音信号或在低信噪比环境下,增强后的语音常伴有无法抑制的残留噪声和背景噪声,同时语音失真度很大。在此背景下,本文研究了低信噪比环境下的语音增强,主要工作如下:   1、在低信噪比环境下,采用传统的算法进行语音端点检测存在正确率低、抗噪性能差等问题。本文研究了一种基于希尔伯特-黄变换(HHT)瞬时能频值的语音端点检测算法。运用HHT分离出语音的瞬时幅值与频率,提取基于时间-能量-频率特征参数的瞬时能频值,利用该特征值对语音和噪声进行区分,从而进行端点检测。实验结果表明该算法检测的正确率均高于零能法、熵函数法等方法。   2、提出了一种基于约束方差频谱平滑和极小值跟踪(VCSS-ML)的噪声谱估计算法。该方法根据含噪语音子带平滑功率谱与其最小值之间比值,通过加权含噪语音功率谱来估计噪声谱,同时通过含噪语音平滑功率谱的方差对噪声谱进行平滑。该算法可以在很短的语音间隙中更新噪声功率谱,大大提高了算法的适应速度。实验结果表明估计的噪声谱既能快速适应背景噪声的变化,又能保证噪声谱估计的准确性。特别是在强背景噪声和慢变化噪声情况下,性能都得到了明显的提高。   3、提出了一种基于听觉感知小波阈值的清音增强方法。该方法采用听觉感知小波变换对含噪语音分解,得到小波听觉感知子带层系数,采用HHT瞬时能频值进行清浊音判别,对浊音部分采用听觉掩蔽阈值进行处理,对清音部分采用一种基于噪声功率谱估计的改进软限幅阈值算法来进行处理。实验结果表明该方法很好地解决了语音信号的保护和噪声去除之间的矛盾,在抑制噪声的同时清音信号也得到了较好地保留。   4、提出了一种听觉神经模型和量子听觉神经网络相结合的语音增强方法。低信噪比的含噪语音经过听觉神经模型处理后,增强为信噪比较高的语音。采用听觉皮层模型提取每一帧语音信号时频信息,利用量子神经网络的非线性映射和自学习能力来优化减参数,从而进行语音增益估计,实现语音增强。实验结果表明该方法利用神经网络的自适应学习能力,减少了对目标语音信号的失真,在主观和客观的听觉性能指标上都有明显的改进。   5、耳语音是一种低信噪比的弱语音信号,采用传统的谱减类算法进行耳语音消噪时更容易产生令人烦躁的“音乐噪声”。本文提出了一种基于修正Mel域听觉掩蔽模型和无语音概率(SAP)的含噪耳语音增强方法。该方法根据耳语音的发音特点对Mel频率进行修正,对每一帧耳语音信号进行Mel域频带滤波,再通过无语音概率动态地确定每个频带的听觉掩蔽阈值,对不同的听觉掩蔽阈值自适应地调整谱减系数来进行含噪耳语音的增强。实验结果表明,该方法与其它谱减法相比,能将残留噪声和背景噪声控制在人耳掩蔽阈值下,语音失真更小,主观听觉方面也得到了很大的改善。
其他文献
喷泉码是一种高效,可靠的数据传输方法。喷泉码的编码过程迅速,解码算法复杂度低,数据恢复性能上佳。喷泉码相比于传统的数据广播方式,可以有效地提高数据广播的效率,减少发
由于目前可使用的系统资源已十分有限,而通过合适的调度算法选择共享时/频资源的用户进行数据传输可以提升系统吞吐量和频谱利用率,因此该类算法已成为LTE及LTE-Advanced系统
近年来随着宽带信号、目标识别、高速电子电路以及非线性系统等这些需要得到瞬时信息的工程需求日益增加,较为成熟的频域方法存在局限性,所以众多学者开始研究时域方法。由于
无线传感器网络(Wireless Sensor Network, WSN)中的节点自定位问题是无线传感网络领域的重要研究内容之一,具有及其重要的研究价值和应用意义。能够实现传感器节点(Sensor N
数据处理是我们这个时代最大的特点,人工智能、深度学习、5G等新兴技术的出现,对于处理器计算能力提出了更高的要求。在超标量处理器设计中,支持SIMD的向量浮点单元将会得到更多
随着人们对视频体验要求的不断提高,高清、超高清视频的处理已经成为现代视频技术的发展方向,然而高清、超高清视频所带来的巨大数据量限制了其应用。为此,联合视频编码组(JC
水下传感器网络(Underwater Sensor Networks, UWSNs)是由部署在水下区域,具有声学通信能力的传感器节点构成的水下监控系统。作为无线传感器网络向水下应用的延伸,水下传感
正交频分复用多址(Orthogonal Frequency-Division Multiplexing Access, OFDMA)技术凭借其抗符号间干扰、抗频率选择性衰落以及频谱利用率高等优点,已被LTE (Long Term Evol
随着无线通信技术的快速发展,以及手持的广泛普及,基于手持设备的IPSec VPN能够很好的满足用户进行异地局域网之间的安全访问。Android系统是一个适用于各种手持设备的,以Lin
随着近年来基于IEEE802.11标准的无线局域网接入技术的飞速发展,无线局域网(WLAN)已获得了广泛应用,无线局域网用户规模呈现爆炸式增长。如何为越来越多的无线网络用户提供更为高