多音频信号分离与识别技术的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sulinpep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实环境中,音频信号总是不可避免地会受到环境噪声以及其他声源信号的干扰,这给声音信号的处理带来诸多挑战,另外如何在大量的音频信息中迅速找到并识别出感兴趣的声音信息也是一个难点问题,同时更是近些年来声音信号处理领域的研究热点之一,因此多音频信号分离与识别系统的建立,对于工业应用、国防军事等很多相关领域都有极其重要的理论研究与应用的价值。  在已有的听觉生理学的科研成果基础上,建立了一个听觉模型。该模型主要包括可以提升声音数据中、高频特性的外耳、中耳模型,可以对音频信号进行多频道滤波处理的基底膜模型以及能够获得特征信息的内毛细胞-听神经模型。  利用双耳时间差、双耳水平差、听觉神经发放概率以及自相关图谱等特征参数,实现多音频信号的分离。系统阐述了将多频率声音信号的混合数据通过Gamma tone滤波器实现多频率通道的分离,求出每一个频率通道的信号的声源位置方位角,根据方位角的差异将频率通道划分为几个大的归属类别,由每个频率通道的自相关图谱等特征参数利用幅度谱特征迭代算法来实现信号波形的重构,并且根据半波整流逆变换技术恢复前面丢失的负信号部分,以此来实现各个频率通道声音信号波形的恢复,把同属一个类别的多个频率通道的波形图进行迭接相加,获得了音频信号的完整波形图,其他归属类别的波形图恢复过程相同。最终实现音频信号的分离。  接着再对分离出来的各个音频信号进行识别。本文在提取信号特征参数过程中主要获得了两个典型的特征:梅尔倒谱系数特征(MFCC)以及稀疏特征,然后利用支持向量机分别对这两个特征进行训练、识别。同时对信号的稀疏特征运用了特征加权技术,使此特征能够更加完全地表征目标信号,有效地提升了识别的准确性,并最终实现了利用SVM分类器识别音频信号的目标。  之后根据整个系统模型的原理,利用Matlab GUI仿真软件实现了多音频信号分离与识别系统的建立。  最后是总结与展望部分。从整体上阐述分离与识别系统的原理性内容及其优缺点,以及所完成的工作,最后叙述未来需要继续完成的任务。
其他文献
pH值对溶液的物理、化学性质都有很大影响,在污水处理过程中,大都要对水的pH值进行检测与控制,其控制质量的好坏直接影响污水处理的合格程度,因此在污水处理过程中占有举足轻重的
目前,自由基聚合物的产量占总聚合物产量的70%以上,可见,自由基聚合在工业生产和理论研究中占有非常重要的地位。典型的自由基聚合反应包括链引发、链增长、链终止、链转移等多种
本文研究的课题是高精度数粒机控制系统的研究与设计。如今,随着科学技术的不断发展,数粒机在医药行业自动化生产线上的应用越来越广泛,有着巨大的市场应用前景。现阶段,国外
等离子在工业以及军事上的应用具有十分广阔的前景。介质阻挡放电(DBD)是一种典型的可通过大气压放电产生等离子体的技术,因而受到国内外的广泛关注。高频高压脉冲电源是介质阻挡放电的核心部分。本文探讨了等离子脉冲电源系统的设计方法,它包括两部分,一是高频高压正弦波电源,二是基于此电源基础上的磁压缩陡化电路。本文重点研究了高频高压正弦波电源的软硬件设计,同时讨论了高频变压器的设计要点,IGBT的特性和使用
足球机器人视觉系统是目前机器人研究领域的一个热点课题,它涉及了诸多领域的前沿研究,是一个极富挑战性的高技术密集型研究平台。作为机器视觉领域的一个分支,足球机器人视