基于单源欠定语音分离的音乐主旋律提取方法研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:QQ747881021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机技术的发展,音视频内容的数量呈爆炸性增长。对于用户来说,想要快速查找到自己需要的内容则愈发困难。基于内容的音乐检索为用户提供了一种全新的音频内容检索方式,他摆脱了通过乐曲名、作曲家等文字信息对音乐进行查找的传统模式。用户可以使用录音片段或乐曲旋律找到自己需要的音乐,在数字版权管理等方面也有广泛应用前景,是目前基于内容检索中的研究热点之一。音乐主旋律提取又是基于内容的音乐检索中的一项非常重要和关键的技术,但是由于相关的盲分离和计算听觉场景分析等关键技术还未发展成熟,针对音乐主旋律提取的方法也一直在探索当中。本文提出了一种基于语音谐波能量互相关的基音频率跟踪算法。算法基于人类在发出元音音节的过程中声带和声道的变化特征,提出相邻语音帧谐波能量互相关值较大的假设,并使用大量各类型的语料对该假设进行了验证。对多声源基音频中可能出现的情况进行了详细分析,并基于以上结论设计了基音频率跟踪算法。随后,本文设计了一套基于谐波能量互相关的音乐主旋律提取算法,该算法首先利用谐波能量互相关的假设对音乐进行多基频提取,然后从多基频数据中筛选出人声演唱的部分作为该段音乐的主旋律。最后使用ADC04数据库和MIREX09测试数据库对算法进行了测试,测试结果显示该算法可以成功完成音乐主旋律提取任务,与MIREX2011的测评结果相比,提取性能优异,准确度较高。较以往的算法实现简单,不使用复杂的学习算法和概率模型,而且还可以应用在多说话人盲分离、语音降噪等领域。
其他文献
随着现代科技的高速发展,社会对于无线通信需求越来越大,人们不断追求高质量的无线通信网络速度和通信服务质量。但是无线通信中的信号传输多径衰落效应一直是限制无线通信发
近些年来,基于数字信号处理(DSP)的相干检测技术引起了人们的广泛关注。一方面,该技术的应用可以带来更高的频谱效率,从而提高系统单信道传输容量;另一方面,基于DSP的相干检测
摘要:新课程下的教学模式,主要强调学生的主体性,并激发学生的学习兴趣。多进行情境教学,在教学过程中,用生动的场景来激发学生的学习兴趣,以提高学生的积极性和主观思维能力,这也适应了新课改的要求。本文以新课改下的高中数学教学研究为基础,结合笔者的教学实践,提出了几点有效的教学策略,希望能提高现代高中数学教学质量。  关键词:新课改;高中数学;有效教学;措施  中图分类号:G633.6 文献标识码:A