基于内容的音频分割与分类

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sbb20005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和存储技术的发展,以及多媒体应用的普及,互联网上音频数据的数量迅速增长。广播、音乐、电影/电视伴音、教学录音等音频资源目前都可以通过互联网获取。如何有效地对这些音频资源进行组织和管理,使人们能够方便地找到所需要的音频片段已经成为一个迫切的需求。基于内容的音频分割和分类技术是音频索引和检索的基础,它可以应用于基于内容的音频检索、音频监控、音频转录、音频内容理解等领域。在音频分割方法方面,对DISTBIC提出了若干改进。如果一个候选分割点的BIC差值为负,DISTBIC就会将其从候选分割点集合中移除,这种做法过于激进,会造成真实分割点的丢失。针对这一问题设计了一种新的BIC确认方法,该方法使候选分割点有多次机会被确认。DISTBIC在对候选分割点进行BIC确认时,惩罚因子采用一个固定值,这个值过大会导致分割方法准确率高、查全率低,过小则会导致准确率低、查全率高。针对这一问题,提出一种惩罚因子自适应方法以提高分割方法在准确率和查全率两方面的综合性能。在音频分类方面,通过互相关和信息增益两种算法进行特征选择,使用二叉树音频分类方法将音频分为音乐、纯语音、环境音、非纯语音和静音五种类型。实验结果表明,提出的改进算法有效地提高了音频分割方法的综合性能,大大降低了分割方法对惩罚因子的敏感度,使其在实际使用中更容易达到最佳性能。实验结果还表明特征选择能够在降低特征维度的同时提高分类任务的识别率。
其他文献
随着计算机和网络的发展,企业机房里的服务器数量也迅速地增长着,要方便、快捷地维护好这些服务器也变得越来越难。为了能方便机房管理员对服务器进行维护,研究和实现了一种
随着计算机技术和网络通讯技术的日益发展,大量数据涌到人们面前。如何有效地选择需要的信息成为了越来越突出的问题,数据挖掘技术就是顺应这种需要而发展起来。分类技术作为
近年来,随着人们生活质量水平的提高和计算机技术、通信技术及多媒体技术的发展,智能视频监控系统的应用日益广泛。但目前的智能视频监控系统大多是基于PC架构的,具有监控场景布
圆形Packing问题是一个典型的布局优化问题,也是一个有代表性的NP难度问题,NP难度问题是现代计算机科学中难于求解的一类问题,对于该类问题,目前尚不存在经典数学要求的既精
网格被认为是下一代网络,其目标在于实现网络环境内的资源共享和协同工作,而实现资源共享和协同工作的关键前提在于有效地发现资源。因此,网格资源发现机制长期以来都是网格研究
随着各种新型遥感卫星传感器的不断涌现,可用的多光谱、高空间分辨率的遥感图像数据日益剧增。但由于观测的限制和设计的原因,各种传感器有自己的特性,所以图像融合要充分的利用这些传感器的特性,不仅可以弥补单一图像信息的不足,而且有效增强图像的信息分析能力。遥感图像融合是一门综合多种学科的学科。本文在基于像素级融合的基础上,以遥感图像中多光谱图像和全色图像为例,研究如何充分利用两者的优势,在多光谱图像保持光
本文着重分析了Web服务研究最核心的问题——发现与组合技术,指出了当前所存在的困难;并在分析、总结现有Web服务发现和组合技术优点与不足的基础之上,提出了-个Web服务发现和组
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。近年来在机器
学位
计算机取证技术近年来获得飞速发展。与此同时,随着计算机犯罪的多样化以及民事调查类型的增多,计算机取证分析师却在多方面面临着挑战,如:海量数据、案件复杂程度的增加、取证结
学位
随着网络流量快速增长,人们对带宽的要求越来越高。WDM网络被认为是下一代网络中解决带宽问题的最具潜力的光网络之一。网络编码打破了传统网络中处理信息的方式.在传统的网络