论文部分内容阅读
随着互联网的普及,尤其是移动互联网时代的到来,上网终端的多样化使得多媒体应用特别是音乐应用,越来越深入人们的日常生活,这使得数字音频内容得到了极大的丰富,对数字音频数据的管理也越来越重要。但是,人工管理海量的数字音频数据是一件几乎无法完成的工作,这就直接促使了音频指纹技术的快速发展。音频指纹是一段基于音频内容的紧凑数字签名,其目的是建立一种用于比较两个音乐数据听觉质量的有效机制,可用于数字音频内容的音频内容识别、版权保护、内容完整性校验等领域。本文介绍了音频指纹技术的基本概念、产生背景、应用领域和总体框架,并围绕音频指纹的关键技术展开研究,主要的工作有以下几个方面:l)概述了现有的音频指纹提取算法,并分析研究了一些经典的音频指纹提取算法,指出了各种经典算法的优缺点。2)分析了现有音频指纹提取算法后,提出一种新的基于计算机视觉技术的音频指纹提取算法,即采用一种基于小波变换并用LDA对其进行降维的方法,来用于音频指纹的提取。3)提取指纹后,分析了指纹在数据库中进行检索的相关算法,也对比了它们的优缺点。4)针对本文音频指纹数据库数据量大、数据维数高的特点,采用一种近似最近邻的高维数据索引算法—位置敏感哈希(Locality Sensitive Hashing,LSH)算法用于音频指纹检索,并结合本文的应用进行了算法参数优化。5)利用本文研究的音频指纹提取和检索算法,设计并实现了一个音频指纹检索系统,取得了良好的效果。