Acoustic Scene Classification via Classifiers Voti

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cyc2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Acoustic Scene Classification (ASC) is the recognition and categorization of audio data that identifies the environment which it has been recorded. ASC is quite a challenging application of machine listening due to the noisy nature of the audio signal.
  We analyze several state-of-the-art models for ASC on two different datasets. The datasets belong to the IEEE challenge on the Detection and Classification of Acoustic Scenes and Events (DCASE) 2017 and 2019. The two datasets are publicly available for research purpose, and consist of 10 and 15 classes of acoustic scenes respectively. In total, 57 hours of stereo recordings are available which includes common indoor and outdoor environmental scenes, such as beach, city center, library, forest path train, car, etc.
  We propose a method of ASC via fusing the voting of deep neural networks. In the proposed method, two different acoustic features are first extracted from each audio recording i.e. Mel-frequency cepstral coefficients (MFCC) and Logarithmic filter-bank (LFB). These features are then fed into three different classifiers (deep neural networks):Visual Geometry Group (VGG), Residual Network (ResNet) and Long Short-Term Memory (LSTM). The motivation for choosing these variety of neural networks is that they have complementary advantages for ASC. After training each network and acquiring the results, fusion of classifiers voting is used to determine a final outcome. The fusion of all the results through voting technique is one of the methods under ensemble learning. The final Classification Accuracies (CA) that are obtained after the fusion of the classifiers are 73.27% and 76.99% on DCASE 2017 and 2019 datasets respectively. The proposed fusion of classifiers voting obtains the CA improvements by 12.71% and 13.79% on DCASE 2017 and 2019 datasets respectively, compared to the individual baseline classifiers.
其他文献
舰船在海上航行过程中会受到海风、波浪、洋流等因素的影响产生六自由度的摇荡运动,对舰船海上作业以及舰载武器设备造成扰动。如能对该舰船摇荡运动进行预测,将为舰载稳定平台的运动补偿提供有效基础信息,从而提高补偿精度。因此,该文以舰船的摇荡为目标,研究舰船极短期摇荡的预测方法。主要研究工作如下:
  首先,构建了双模型舰船摇荡预测模型用于舰载稳定平台,通过对舰船摇荡运动趋势做出预测,为稳定平台的运动补偿提供舰船运动预测信息,从而增强稳定平台的补偿能力。针对于舰载稳定平台补偿的高精度要求,在双模型框架中设计在
5G技术的应用为互联网行业带来了新的曙光,人们的生活进入更加智能的时代。同时,快速增长的数据流量以及更加智能的用户需求也给光网络带来了更多的挑战。传统的网络中,节点兼具路径计算和业务转发的任务,网络节点压力过大。软件定义网络(Software defined networking,SDN)架构实现了数据平面和控制平面的分离,将路径计算功能聚集到控制平面,减少网络节点的工作量。SDN架构以集中式的管理方式对网络进行管理,具有开放的接口。同时使对网络设备的控制以及对网络的管理变得更加容易。
  首先,介
突触传递信号是神经元传递信息的重要载体。人脑的诸多高级功能,如学习、记忆等与突触传递过程密切相关。神经科学研究中将突触传递信号分析作为常用研究方法。但目前传统的分析方法中多采用手工提取参数,分析数据量有限。针对该缺陷,该文设计了一种神经元突触传递信号分析处理系统,并通过神经元响应数据验证了系统的可行性,提出了太赫兹调控神经元突触传递机理猜想。
  首先,针对高效分析神经元突触传递信号问题,设计神经元突触传递信号分析处理系统。根据该系统的基本功能需求和信号的特点,设计模块化软件对应的主要功能。详细设计
互补序列和完备序列作为具有理想相关性的最佳序列应用在通信系统中,能够非常有效的抑制信号传输过程中的多径和多址干扰。正交幅度调制(Quadrature Amplitude Modulation,QAM)序列作为高斯整数序列的一种特殊形式,能够利用幅度以及相位同时传输信息,极大的提高了数据传输速率,同时16-QAM以及64-QAM序也已应用在3GPP通信标准中,因此对QAM序列的研究具有非常重要的意义,该文对多电平周期互补对、多电平完备序列以及QAM互补序列的构造进行了理论研究。
  首先,基于组合设计
现代网络业务的急剧增长,使光传输网络快速发展。应用通用多协议标签交换(Generalized Multiprotocol Label Switching,GMPLS)技术的光网络节点在正常工作时需要完成相当大的工作量,这无疑会影响网络的性能,需要引用新的网络架构来优化网络性能。但新架构同时要求与之相适应的新的业务疏导算法来优化网络。因此,该文对光网络架构以及网络业务的疏导机制进行了研究,具体内容安排如下:
  首先,将多粒度光交换网络与软件定义网络(Software Defined Network,
《将军寄语》一书,由南京市地方志办公室退休编辑吴小铁先生编纂出版。该书收录共和国将军213位,其中开国将军102位,1988年授衔将军111位。全书分为三辑:第一辑“将军寄语”,收录将军题词、题字、书信146件;第二辑“将军签名实寄封集”,收录将军签名封、片40件;第三辑“将军签名本”,收录将军签名书籍27件。除第三辑中的部分书籍是购得之外,其余所有将军手迹和签名封、签名本,均为将军本人在20多年
期刊
现代机械装备日趋复杂化、自动化与精密化,其安全运行显得尤为重要,因此机械设备故障诊断与预测方法的研究备受关注,基于振动信号分析的数据驱动类方法得到广泛应用。传统的智能诊断和预测方法依赖于所提取的特征质量,且受先验知识和诊断经验影响较大。近年来深度学习方法的引入为故障诊断及预测提供了新思路和新方法,该文主要研究了基于循环神经网络深度学习的故障诊断和剩余使用寿命预测。
  首先,针对传统方法难以自适地提取数据中的敏感特征以及没有充分利用故障演变的时间信息问题,提出了基于卷积网络和长短期记忆网络的轴承故障
疲劳驾驶是造成交通事故的主要原因之一,所以研究驾驶员疲劳检测方法,及时地检测出驾驶员是否疲劳,在其疲劳时对驾驶员给予警告提醒,对减少因疲劳驾驶导致的交通事故而言有着十分重大的意义。目前,驾驶员疲劳检测多数是基于驾驶员面部视觉特征判别疲劳状态,但在提取驾驶员疲劳特征时,会受光照、人脸角度等因素影响,使得该方法的疲劳检测的准确率相对不高。
  针对以上问题,提出了基于深度卷积神经网络的疲劳驾驶检测方法,深度网络可以直接从驾驶员图像中学习疲劳的视觉特征,相较于手工提取的特征对光照、姿势等条件变化具有更好的
《兩淮战役》(油画) 王君瑞  洪泽湖边秋草黄,两淮日伪失嚣张。  三师鼙鼓惊天地,韩信重生亦胆丧。   叶里青,中国书法家协会会员 ,浙江桐庐县书法家协会名誉主席,桐庐县政协书画院首任院长,海上兰亭书法院桐庐分院院长。作品入展全国第二届隶书展、 第十届全国书法篆刻作品展。其作品为国内多家博物馆、艺术馆收藏。
期刊
如何设计一种经济实惠且值得信赖的高级驾驶员辅助系统(ADAS)是汽车工业的一项真正挑战。ADAS是在驾驶时为驾驶员提供帮助的系统。它可以有效地协助驾驶员,减少交通事故的发生,并提高道路安全性和乘客的舒适度。随着自动驾驶汽车的发展,车道检测已成为ADAS的关键技术之一。
  本研究提出了一种结合几种特征提取方法的车道检测算法。在进行车道标记检查时,道路上那些含有黄色和白色反光涂料的典型车道标记很容易被识别出他们独特的形状。研究的首要目标是利用车道的这些特性,为图像和视频中的车道检测提供合适的ROI和算