改进的局域判别基算法及其在音频分类中的应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yd2846996
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频、图像和音频等多媒体数据已经成为信息处理领域的主要信息媒体,其中音频占有很重要的地位。传统的基于文本的检索存在主观性和不完整性等缺点,为此,基于内容的音频检索成为未来必然的研究和应用方向。音频的特征提取与分类识别是音频检索的基础。小波变换是近年来兴起的一种新型数学工具,其对非平稳信号的良好分析能力使其越来越多地受到人们的关注。如何利用小波分析技术有效地提取音频信号的时频域特征是本文的主要研究工作。   本文在时频域特征提取方面重点研究了局域判别基(LDB)算法的基本原理,在该算法的几个主要环节上作了部分补充和改进,主要的工作集中在以下几个方面:(1)小波包变换后,在构建LDB小波包树前,没有沿用欧氏距离、相对熵和对称相对熵作为区分度量值,而是引入了一个新的、更具物理意义的区分度量值,即节点归一化能量差;(2)在原有小波包树裁剪规则的基础上,补充了两条新的规则,新规则的引入有利于剔除冗余的子带,对LDB小波包树起到了精简的作用;(3)特征提取过程不再直接选用节点区分度量值,而是采用了节点分帧统计特征,实验中发现后者的识别效果要明显高于前者;(4)由于小波包分解层数为5层,尽管采用了局域判别基算法对小波包树进行了裁剪,但保留的正交子空间的数量还是相对较多,这也意味着特征矢量的维数会比较高。因此,在将特征矢量送入SVM分类器之前,采用了Fisher准则对高维特征矢量降维,降低分类的复杂度。实验中采用小波包变换作时频域分析、采用局域判别基算法提取音频特征、采用SVM作分类器,对纯语音、带背景音乐的语音、音乐和环境噪音四类音频进行分类识别,取得了较高的识别率。   本文最后给出了局域判别基算法各主要环节的实验数据,同时给出了不同特征下的识别精度,并对实验结果进行了分析和比较。
其他文献
互联网技术的发展使越来越多企业通过网站来进行宣传,让潜在的客户能够通过网站了解企业及其产品的信息,企业也通过网络进行营销。搜索引擎作为网站推广和产品促销的主要手段,得
随着Internet(因特网)及Web(万维网)技术的发展,众多基于Web的应用系统应运而生,Blog就是其中之一。Blog用于提供用户以日志方式发布网页,由于采用了RSS技术,Blog的沟通方式
学位
TTCN-3作为一个测试技术已被越来越多的人所熟知。它不仅可以进行一致性测试,还可用于多种测试,包括互操作性测试、健壮性测试、回归性测试、系统及集成测试。TTCN-3是一种灵
面向方面程序设计(Aspect-Oriented Programming,AOP)是一种在面向对象程序设计(Object-Oriented Programming,OOP)基础之上发展起来的新技术。该技术有效地解决了横切关注点的
学位
随着网络技术的应用与发展,基于网络的应用已经成为开发计算机应用程序的基本功能。在许多计算机应用系统中,不可避免地涉及到有关数据库的操作,其中相当一部分是以数据库为
实时数据流挖掘是目前数据挖掘与数据库领域的新兴研究热点,针对实时数据流的聚类分析技术也是该研究中最具有挑战性的难题之一。本文首先介绍了基于实时数据流的数据挖掘和
在通信的应用中,我们总是假设存在一个可靠的网络链接。但组成网络的物理系统经常受到信号失真和链路或节点失败等问题的影响,要进行可靠的信息传输,就必须采用一系列的网络容错
随着Internet技术的飞速发展,网络技术已深入到经济社会的各个层面。但是,由于Internet固有的开放性和匿名性特征,导致其安全问题成为了网络应用的主要障碍。如何有效的保证
学位
随着Internet和Web技术的发展,基于Web的应用大量涌现。为了有效的整合利用网络上的资源,一种新的软件架构模式——面向服务架构(SOA)——随之出现。如何把现有的Web服务重新组合