论文部分内容阅读
在现实环境中,音频信号总是不可避免地会受到环境噪声以及其他声源信号的干扰,这给声音信号的处理带来诸多挑战,另外如何在大量的音频信息中迅速找到并识别出感兴趣的声音信息也是一个难点问题,同时更是近些年来声音信号处理领域的研究热点之一,因此多音频信号分离与识别系统的建立,对于工业应用、国防军事等很多相关领域都有极其重要的理论研究与应用的价值。 在已有的听觉生理学的科研成果基础上,建立了一个听觉模型。该模型主要包括可以提升声音数据中、高频特性的外耳、中耳模型,可以对音频信号进行多频道滤波处理的基底膜模型以及能够获得特征信息的内毛细胞-听神经模型。 利用双耳时间差、双耳水平差、听觉神经发放概率以及自相关图谱等特征参数,实现多音频信号的分离。系统阐述了将多频率声音信号的混合数据通过Gamma tone滤波器实现多频率通道的分离,求出每一个频率通道的信号的声源位置方位角,根据方位角的差异将频率通道划分为几个大的归属类别,由每个频率通道的自相关图谱等特征参数利用幅度谱特征迭代算法来实现信号波形的重构,并且根据半波整流逆变换技术恢复前面丢失的负信号部分,以此来实现各个频率通道声音信号波形的恢复,把同属一个类别的多个频率通道的波形图进行迭接相加,获得了音频信号的完整波形图,其他归属类别的波形图恢复过程相同。最终实现音频信号的分离。 接着再对分离出来的各个音频信号进行识别。本文在提取信号特征参数过程中主要获得了两个典型的特征:梅尔倒谱系数特征(MFCC)以及稀疏特征,然后利用支持向量机分别对这两个特征进行训练、识别。同时对信号的稀疏特征运用了特征加权技术,使此特征能够更加完全地表征目标信号,有效地提升了识别的准确性,并最终实现了利用SVM分类器识别音频信号的目标。 之后根据整个系统模型的原理,利用Matlab GUI仿真软件实现了多音频信号分离与识别系统的建立。 最后是总结与展望部分。从整体上阐述分离与识别系统的原理性内容及其优缺点,以及所完成的工作,最后叙述未来需要继续完成的任务。