论文部分内容阅读
随着网络技术的不断发展,越来越多的人们希望通过网络寻找到他们感兴趣的东西,如音乐,图片等。人们的这种需求对多媒体搜索提出了新的要求。音频检索是继图像检索之后在基于内容的检索领域中发展起来的研究新热点。作为基于内容的音频检索的一个分支,基于内容的音乐哼唱检索为用户提供了一种全新的检索方式,使得用户可以通过哼唱音乐片段的方式,在大规模的音乐数据库中快速的寻找到目标歌曲。将这种新型的音乐检索方式应用到互联网上,可以在很大程度上提高用户的交互体验。本文紧紧围绕基于Web的音乐哼唱检索关键技术,开展了以下研究工作:(1)深入研究了音频信号的相关理论基础、音乐乐理若干知识,为后续的音乐信号处理及系统实现工作奠定了基础。(2)分析音乐信号的本质特征,在研究音乐旋律的表示方法及音乐信号旋律特征提取算法的基础上,给出了基于音高轮廓的旋律特征提取算法。同时对语音信号基音检测方法做了深入研究,实现了一种复杂度较低的基音周期检测算法。(3)对部分基于内容的音乐检索算法以及音乐相似度计算方法进行详细地描述和分析,并结合本文中音乐特征的表示方法以及对哼唱输入的错误分析,使用相似度匹配的方法进行音乐检索,实现了基于动态规划思想的音乐特征相似度匹配算法。(4)给出了基于Web的音乐哼唱检索系统框架,设计了音乐特征存储模式,完成了基于Web的音乐哼唱检索系统的开发。对系统的哼唱检索结果进行了分析,验证了系统的有效性和可行性。本研究工作得到国家自然科学基金“基于Web的音频识别与检索关键技术研究(基金编号:60673100)”的资助。