基于内容的压缩音频分类研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:bkguo2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的音频分类是一个涵盖十分广泛的研究领域,为了使计算机能够像人那样对音频语义实现自动理解,这个领域的研究从初始对原始音频流分析向目前感知理解发展,从实际认识向抽象理解发展,因为人脑对事物的理解是抽象的,是基于知识的。 目前,基于内容的音频分类研究主要集中在非压缩音频的分类上,专门针对压缩音频进行分类的方法研究较少。虽然非压缩音频的分类方法也可用于对压缩音频进行分类,但这些方法的效率太低,计算量太大。专门对压缩音频进行分类的方法也有学者进行了研究,但已有方法普遍存在一些不足之处:如对特征参数提取的理论分析不够深入,没有很好地利用音频压缩编码过程的计算结果,对人耳的听觉特性考虑得较少。 本文设计了一个对压缩音频进行基于内容分类的系统,并对系统各个模块的实现方法和原理进行了深入的分析和探讨。本文提出方法的优势在于,充分利用了编码器的计算结果,充分考虑到了人耳的听觉特性,使用了心理声学的研究成果。另外,本文还对从压缩音频中提取参数的含义做了透彻的分析,并通过实验检验了方法的有效性,从而在理论和实践两方面验证了方法的正确性和可行性。
其他文献
科学技术的迅猛发展,可以让人们运用互联网不限时间、不限地点地完成几乎生活所涉及的一切事物。在这样的大环境下,新颖的网络教育模式正在以全新的面貌慢慢融入人们的学习之中
Petri网是一种广泛应用于描述异步并发现象的图形化建模和分析工具,Petri网的可达性判定问题是进行Petri网建模和分析的基础。判定Petri网可达性的基本方法有可达树、可达图、
随着高性能应用需求的迅猛发展,单台高性能计算机已经不能胜任解决一些大规模应用问题,这就需要将地理上分布的多种资源通过网络连接起来,共同解决大型应用问题,这就是网格技术。
本体——共享概念模型的明确的形式化的规范说明,自提出以来,在知识工程、信息检索、语义Web等多个领域都得到了较为广泛的应用。本体建模是本体研究的基础性热点工作,其中涉
本论文主要研究网格计算开发平台GBuilder代码自动生成技术,构建了一个用于网格应用开发的代码自动生成器,给出了代码自动生成器的总体设计,然后详细说明定义书、模板文件、X生
本文是对我国现阶段电子政务的实现技术进行总结的基础上提出新的电子政务技术与实现的方法和实现技巧,主要对现行电子政务中的很多关键性技术进行了论述,全文分为六个部分:
随着化石能源的日益消耗,各国政府不仅要面临着能源日益枯竭的现状,更要面对化石能源使用所带来的环境污染问题。新型可再生能源的利用是缓解当前现状的一种很好的通径,光伏发电作为一种具有无污染、无噪音、无枯竭风险等特点的发电方式,引起了各国的广泛关注。中国作为光伏发电的大国,在2017年的中国的光伏发电量占世界比重接近三分之一。新能源的大规模利用不仅可以减少环境污染、能源短缺,更是带动了产业升级和技术革命
本文对数据库技术在文件系统设计中的应用进行了研究,从数据库的角度去阐述了现代文件系统设计中所必须面对的问题以及解决方法。主要包括:(1)使用数据库日志技术来增加文件系