论文部分内容阅读
在现代信号处理中,语音信号是一类典型的非平稳信号。对于这类频率随时间变化的信号,传统的时间域和频率域的分析方法都不能够全面的反映信号的特征,而时频分析是分析和处理此类非平稳信号的有力工具。它将信号表示为时间和频率的联合函数,揭示了时间域与频率域的联合时频分布信息,清楚地为我们描述了信号频率随时间变化的分布关系。从时频分析的角度看,语音信号的时域和频域特性和噪声的时域、频域特性有着明显的差异,通过时频建模的方法可以达到语音增强的目的。本文提出语音信号的局部余弦基建模。构造局部余弦基字典,其对时间轴的分割适应于语音信号时频结构的变化,而且有较高的时频分辨率。使用局部余弦基原子的时频分布来对语音信号进行时频分析。该分布继承了魏格纳-维利时频分布高时频聚集性的优点,同时避免了魏格纳-维利时频分布中存在交叉项的弱点。通过仿真试验,本文验证了使用局部余弦基模型对语音信号进行建模的可行性和有效性。在各种基于语音生成模型的增强算法中,如何准确地提取模型参数一直是个难点。本文选用自适应信号分解方法——匹配追踪法提取时频模型参数。选择合适的字典对含噪信号进行匹配追踪分解后,噪声在时频面中被稀释,而语音成分则相对地聚集在时频面上某个区域。匹配追踪算法具有自适应性,在每一步中都会提取到跟待分解信号相关性最强的时频原子的参数。仿真结果显示,基于匹配追踪的语音信号局部余弦基建模,可使语音信号中的时频特征能够很好地聚集在字典中的原子上,然后从含噪语音中尽量多地提取语音成分,且这种语音增强方法不需要先验地获知有关信号和噪声的统计特性。匹配追踪分解可以通过控制迭代的次数来达到滤除噪声的目的。但是当信噪比过低时,噪声原子的能量可能比语音原子的能量大,这样匹配追踪分解就会把噪声原子误当语音原子给分解出来。为此,本文提出匹配追踪分解与子空间方法结合的方法,带噪语音信号的矢量空间可以认为由一个信号加噪声的子空间和一个纯噪声子空间构成。可以利用信号子空间处理技术,消除纯噪声子空间,然后对语音信号进行分解,实现语音增强。仿真结果显示,子空间中进行的匹配追踪分解在低信噪比和加有色噪声的情况下都有效地达到语音增强的目的。