基于卷积神经网络的音频场景分类方法研究

来源 :成都理工大学 | 被引量 : 1次 | 上传用户：shiguangli010

【摘要】

：

【作者】

：

孙凌山

【出处】

：

成都理工大学

【发表日期】

：

2019年01期

【关键词】

：

音频场景分类卷积神经网络梅尔频率倒谱系数集成学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

音频场景分类是一项通过音频分析使设备能够理解其所处环境的任务,属于计算机听觉场景领域的一个分支。目前该技术已广泛用于智能可穿戴设备、机器人传感、上下文感知服务等应用场景。近年来深度学习领域的发展更是加速了音频场景分类的研究进程。作为深度学习领域中一种重要的模型,卷积神经网络具有很强的学习能力。通过引入卷积神经网络模型作为音频场景分类器,可使分类准确率获得可观的提升,甚至能使机器超过人类水平。为了探究卷积神经网络在音频场景分类领域的适用性并寻找系统性能的提升方法,文中设计了三组系统并进行了实验及比较,主要工作如下:本文从设计基于梅尔频率倒谱系数和高斯混合模型的基线系统开始,用传统机器学习的方法构造了一个典型的基线系统作为之后系统的对照组。接着研究基于卷积神经网络的音频场景分类系统的原理,探讨将卷积神经网络应用在音频场景分类中的适用性,并设计实现了一个有两层卷积模块的基本系统。训练系统时通过调整滤波器参数以发挥其分类潜力,同时还将训练时间考虑到系统性能评估的要素中去。评估阶段分析基本系统在各类别上的分类准确率并引入混淆矩阵,发现其学习能力相对基线系统更强,但应对不同数据时泛化能力不佳,且没有有效利用到音频文件中的空间信息。根据基本系统体现出的问题,本文又设计了一个改进系统,从音频处理和网络结构两方面对基本系统进行改进。音频处理方面使用了双耳表示法及谐波-冲击源分离法对原始音频进行处理并提取相应特征,使系统得以利用场景的空间特征,进而使分类准确率得到了可观的提升。网络结构方面尝试借鉴图像识别领域中的VGGNet结构,在增加网络深度的同时提升系统灵活性,最终在不同的数据上取得了更好的泛化效果。此外改进系统还使用了集成学习中的Stacking方法将多个基于不同特征的独立子模型融合,融合后的系统相比其中的子模型分类性能又有了进一步的提升。通过实验及比较,最终得出的结论是:在音频场景分类领域中,卷积神经网络相比于传统机器学习方法学习能力更强。在设计卷积神经网络时应注意网络的灵活性,将提升系统性能的重点放在网络结构优化而不是参数调整上,避免因参数过多而造成系统的泛化能力不佳。此外,通过引入集成学习的方法将多组模型进行融合通常可以显著的提升性能,但集成时应注意模型间的独立性。最后,在音频特征提取阶段如果能利用到立体声信息,可以提升系统对空间的感知能力,进而提升分类准确率。

其他文献

油田注入水结垢趋势及配伍性预测研究

本文介绍了ScaleChem 3.0软件和桌面水化学软件的结垢预测原理。通过软件对八面河油田面138区块注入水和地层水的结垢趋势以及它们之间的配伍性进行了理论预测及研究,并提出

期刊

注入水结垢趋势配伍性预测

商业银行参与PPP项目贷款的风险研究

受产业结构调整、发展集约型经济、加强供给侧改革等政策影响,国内经济逐渐步入新常态,过剩产业加速出清,社会融资量得到有序控制。但是,对于商业银行而言,其一般贷款业务却面临诸多挑战。例如,不良贷款率迅速攀升、贷款量逐年缩减。考虑可持续发展需要,商业银行应当创新贷款模式,开发出顺应市场需求的优良贷款项目。此外,受限于传统融资平台的融资模式单一、融资供给不足,地方政府在基础设施建设的过程中依然面临着资金难

学位

商业银行PPP项目项目贷款风险研究

白纹伊蚊的杀虫剂抗性研究

背景:白纹伊蚊是最具侵袭性的蚊种,近年来在世界范围内广泛扩散,其能传播登革热、寨卡病毒病、基孔肯雅热和黄热病等疾病,对公共卫生安全造成了重大影响。目前清除幼虫孳生地

学位

白纹伊蚊抗药性登革热kdrP450s

加强建筑工程建设管理的措施及其创新研究

近些年,我国建筑行业得到了快速发展,但工程中存在的质量和安全问题,并没有完全得到解决,影响了建筑企业经济效益的实现和建筑行业的发展。针对建筑行业中存在的质量安全问题

期刊

建筑工程管理措施创新

基于ANSYS的渐开线直齿圆柱齿轮有限元分析

通过AutoCAD三维绘图功能建造直齿圆柱齿轮实体模型 ,采用有限元进行应力分析 ,计算出齿轮的最大应力和最大应变。结果表明 :通过ANSYS软件分析的结果与真实情况很接近 ,据此

期刊

直齿圆柱齿轮应力分析ANSYS失效

对于农民画辅导工作的一点思考

<正>2011年7月6日,由中国文联、中国美协、中共浙江省宣传部、浙江省文联共同主办的"农民画时代,时代画农民——全国农民绘画作品展",在浙江省美术馆开幕,我市农民画作者刘巧

会议

浅议如何加强建筑企业集团的内部控制

<正>随着社会主义市场经济体制的不断建立、完善,以及企业产权改革的逐步深入,很多建筑企业集团公司开始自主进行投融资决策,重视资金的使用效益,尤其注重成本费用的管理,集

期刊

建筑企业集团整体上市内部控制内部控制环境如何加强

品管圈活动对降低血液透析患者渗出率的影响

目的研究品管圈活动对降低血液透析患者穿刺处渗血的发生率的影响.方法抽取开展品管圈活动前的的透析患者30例设为对照组;在开展品管圈后随机抽取30例设为QCC组,比较两组患

期刊

血透品管圈护理

交联聚乙烯管材性能及应用的研究进展

简述了交联聚乙烯管材的性能及其应用领域,并对目前常见聚乙烯专用料的交联工艺进行了分类介绍和系统比较,指出在国内进行以开发高附加值建材为方向的交联聚乙烯专用料开发的

会议

交联聚乙烯管材性能

中国“护士处方权”申请者准入资质和工作描述的研究

目的明确“护士处方权”申请者的准入资质,形成“护士处方权”申请者的岗位工作描述(包括“护士处方权”的名称、处方权的内容、处方形式等)。方法1.通过文献回顾和半结构式

学位

“护士处方权”准入资质工作描述处方内容处方形式

基于卷积神经网络的音频场景分类方法研究

其他学术论文