基于波形文件的音乐特征提取及其应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:xie2372
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐作为人们精神上的一种思想表达开始广泛流行于人们的日常生活,早在东汉时期,许慎在中国的第一部系统的分析汉字的形状及来源的字典《说文解字》中按照是否需要人通过心灵想象创造来指明了声音和音乐之间的关系:“音,声也。生于心,有节于外,谓之音”。音乐受其自身来源特性的影响,和数学、物理存在着强烈的相关性,随着计算机自身计算能力的日渐强大和相关软硬件的研发周期逐渐缩短,计算机与音乐之间的关系也愈加紧密。
  本文着重于对音乐节奏检测的研究,在对前期基本特征的提取上,结合音乐信号相对于简单语音信号变化速度更快,因此提出了二阶差分过零率和三阶差分过零率来反应一段乐曲的变化趋势。在获得简单特征的基础上,在后续复杂特征估计的部分,本文从两个方面来讨论音乐的节奏,一个是音乐节拍的划分,另一方面是对音乐行进速度的估计。
  首先,本文先后从时域方面和频域方面对音乐进行分析,在给出了时域、频域、倒谱域以及功率谱之间的变换关系后,针对当前比较主流的对音频信号的基本特征提取方法,进行了相关的实验,获得了音乐的多种特征信息;随后,借鉴于CQT检测法将源分离方法与之进行结合,通过对音乐信号进行周期估计,实现了节拍点的相对位置的获取;通过对隐含马尔科夫模型的构建和算法实验,创造性的运用隐马模型对快速音乐、慢速音乐和中速音乐来进行检测识别;最后,结合实际生活的应用要求,将提取到的特征作为依据实现对舞蹈机器人的控制。
  本文完成了从波形文件中提取基本音乐特征,对其中所蕴含的深层节奏特征进行的研究工作也取得了阶段性进展。论文对未来进一步深入研究的内容及算法的改进方向也给出了思路。
其他文献
表面质量是带钢生产的一项重要指标,如何快速精确地检测出带钢表面缺陷,一直是带钢生产企业关心的问题。由于冷轧带钢生产现场环境恶劣、受外界干扰严重,现有检测算法存在复杂度高、计算时间长和非缺陷信息被误报为缺陷等问题。针对上述问题,本文的主要研究内容如下:  (1)带钢缺陷检测系统设计。根据带钢生产现场特点选择具有合适参数的相机和光源,完成硬件平台设计和搭建;编写软件程序,实现带钢缺陷检测分类算法以及图
学位
钢铁成品铁运装配包括集配和配载两个作业环节。集配计划是根据成品信息从库区中选择合适的成品组成运输计划;而配载计划是决策集配计划内成品在车皮上的空间位置。目前钢铁企业集配和配载计划是独立编制,缺乏系统性决策从而影响车皮装载效率。因此本文从实际铁运装配过程中提炼出集配—配载集成计划问题,研究其问题的建模和求解方法,有助于提高车皮利用率、降低物流运输成本。  本文以钢铁企业成品铁运装配物流过程为背景,研
学位
随着“工业4.0”的推进,钢铁产品生产将朝着智能化、高效化、节能化的方向不断发展,高效的管理方式将成为企业提升核心竞争力的有效途径。合同计划编制是根据客户订单及工厂实际情况自动安排出符合工艺约束及生产要求的排程计划。此问题的合理解决,将帮助企业实现生产管理的高效化及定制化。  本文针对钢铁棒线材生产过程中的炼钢-连铸-轧钢三大核心工序进行合同计划优化问题研究,主要工作如下:  1)针对炼钢-连铸工
学位
随着卖方市场向买方市场的转变,消费者需求不再是被动的而是主动的,对供应链的更高要求随之出现。供应链的实现,需要联系起由供应商、生产厂家、分销商、零售商组成的链路上的每一个环节,并进行优化,使生产资料迅速地通过生产、销售环节变成价值增值的产品,呈现到消费者面前。因此企业的竞争实力体现在供应链给消费者提供的价值的增加,以及供应链成本的减少。供应链优化问题成为所有企业追求发展与进步所关注的核心内容和重要
学位
随着市场的快速发展和完善,作为资产配置的重要媒介,金融的重要性愈加突显,与此同时,人们对于金融理论的研究也愈加重视。作为金融研究的核心课题之一,投资组合优化问题主要研究如何在不确定情况下对金融资产进行合理配置与选择,从而实现收益率最大化与风险最小化间的均衡。这是所有投资者和投资机构都要面临的问题。然而,以往的研究者主要是假定投资的终止时间是固定的,并没有将投资的时间变动考虑到投资组合优化的范畴,而
钢管切割问题的任务是决策如何将原始钢管进行切割,形成符合合同订货长度的子管,从而满足合同的需求量。在实际生产中,钢管切割是一个两阶段的过程,第一阶段将原始钢管等距切割成为中间管,第二阶段根据合同的具体要求将中间管切割成符合需求的短管,因此钢管切割需要同时决策两个阶段的切割方案。钢管切割计划是钢管生产制造管理过程中的一个必要且重要的环节,对于提高材料利用率和提升企业的利润具有重要意义。  本文以钢管
随着互联网的不断发展,大量的用户在此类产品上都会留下评论以进行交流,这些文本的评论信息具有传播速度快、传播范围广、影响人数多等特点。那么对于这些评论文本信息进行深层次的挖掘无论在商业角度还是社会角度都十分有意义。学术界目前的研究重点是利用深度学习等机器学习技术将文本情感分为正向和负向两类。国内对于情感分析的研究发展比较缓慢,本文深入地研究了中文情感分析的相关技术之后,主要工作如下:  首先,提出了
学位
分数阶微积分在数学领域是一个古老而又年轻的领域,在分数阶微积分概念提出以后的200多年里,研究者们主要侧重于其纯数学领域的研究。随着计算机技术的发展,很多以前不能解决的问题目前已经迎刃而解,客观上为其在工程实践中的应用创造了条件。分数阶微积分能够比整数阶微积分提供更丰富的信息,具有更好的灵活性。分数阶控制系统在原整数阶控制系统上增加了阶次参数,无论用其对系统的建模,还是对系统设计控制器,都可以期望
学位
磁共振成像(MRI)作为一个强大的医疗成像技术具有越来越重要的地位,在当前诊断与临床应用中,它的出现极大地提高了医疗诊断水平。然而脑MR图像存在缺点:如成像模糊和不均匀以及噪声等,而婴幼儿的脑MR图像存在脑内信息不能如实反应病灶信号和强度不能得到客观表达等问题,对婴幼儿脑MR图像进行增强和去噪操作有助于医生的诊断以及后续如脑图像分割等步骤。因此,脑MR图像增强和去噪具有重要意义。本文对婴幼儿脑MR
学位
机器人在环境中根据传感器的数据估计自身位置,并创建环境地图,这一过程称为机器人即时定位与地图构建(SLAM)。它是真正实现自主移动机器人的关键,已成为自主智能机器人领域研究的热点。闭环检测是一个场景识别的问题,也是SLAM系统中的关键环节。对于增加机器人的位姿约束,减少系统累计误差,闭环检测至关重要。传统实现方法采用基于手工特征的词袋模型检测闭环,其局限性在于受光照和环境等影响明显。本文针对上述问
学位