论文部分内容阅读
近年来,随着计算机和网络技术的发展,人们从互联网中获取信息的方式更多的向基于音视频的视听体验转移。网络的快速发展和人们不断增长的需求为传统传媒方式提供了一个广阔的发展空间。网络广播电视在上述背景下应运而生并迅速发展。广播电视的音视频节目内容丰富、信息量巨大,然而面对如此海量的数据,还缺乏能够有效的对其进行信息处理的相关技术。本文针对上述背景,研发了一个基于音频的能对广播电视节目信息进行自动处理的实时分析系统。它能够直接从互联网获取网络广播电视节目,并基于其中的音频信息对节目进行分类处理。本文在以下方面展开工作:1.分析了系统的详细需求,并在此基础上提出了系统的整体框架的设计方案。该方案针对系统的功能进行合理的模块划分。另外,还就各模块的具体功能进行描述,同时有效抽象出各模块的接口定义。2.详细研究了系统的节目获取和解码等功能的实现方案。包括对主流的流媒体传输协议的支持、节目数据的缓冲排序、常见流媒体文件格式的解析,以及音频压缩数据的解码和重采样等方面。3.研究了基于音频的场景分类技术。首先针对具有特殊场景的目标音频,分析了其音频在不同特征上的分布情况,选取了最具代表性的特征。然后提出基于SVM(Support Vector Machine)的短时音频片段的分类方法,并综合音频流的长时信息对分类结果进行确认。最后,通过相关测试验证了方法的正确性和有效性。4.在上述工作的基础上,对系统的整体功能和性能进行了测试。最后通过对系统的总结,提出了系统尚需完善和改进的方面。