【摘 要】
:
声学场景分类(ASC)是一项与机器听觉领域相关的任务,其重要作用是识别和分类描述场景位置的预定义标签中的音频数据。在大多数先进的ASC算法中,手工特征和单尺度深度特征被用作后端分类器的输入。由于音频信号的噪声特性以及每一类声学场景的时频特性变化很大,这些特征不能有效地表示不同声学场景之间的特征差异。因此,尽管许多研究者做出了很大的努力,但ASC的任务仍然具有挑战性,仍然是一个有待解决的问题。受多尺
论文部分内容阅读
声学场景分类(ASC)是一项与机器听觉领域相关的任务,其重要作用是识别和分类描述场景位置的预定义标签中的音频数据。在大多数先进的ASC算法中,手工特征和单尺度深度特征被用作后端分类器的输入。由于音频信号的噪声特性以及每一类声学场景的时频特性变化很大,这些特征不能有效地表示不同声学场景之间的特征差异。因此,尽管许多研究者做出了很大的努力,但ASC的任务仍然具有挑战性,仍然是一个有待解决的问题。受多尺度深度特征在计算机视觉领域取得成功的启发,本文提出了一种基于卷积神经网络(CNNs)的多尺度深度特征融合方法。我们在声学场景和事件检测与分类挑战赛(DCASE)的两个官方数据集(即DCASE 2019和DCASE 2017)上使用多个先进的ASC模型进行实验。DCASE 2019和DCASE 2017数据集都公开用于研究目的和竞争挑战,分别包括10类和15类声场景。这两个数据集总共有57小时的录音,包括室内和室外环境场景,如城市、公共汽车、海滩、火车、机场、森林小径等。论文方法首先从每个音频样本中提取Mel倒谱系数(MFCC)的声学特征,然后输入两个不同结构的CNN。然后,将两个CNN生成的多尺度深度特征串接起来,输入全连接层,得到分类结果。与基线系统相比,论文方法在DCASE-2019和DCASE-2017数据集的分类精度分别提高了11%和9%。
其他文献
由于地方院校办学资源的有限性以及核工程与核技术专业的特殊性,校企合作共建核电虚拟仿真实验室是必然选择。基于校企合作的模式,本文主要从开发仿真平台、设计实验项目、组建教学管理队伍、制订教学管理体系四个方面探索了我校核电虚拟仿真实验室的建设和管理经验,并总结了实验室建设与运行成效,为其他同类高校虚拟仿真实验室建设提供参考。
汽车悬架作为汽车底盘的重要部分,悬架的设计不仅影响到汽车的驾驶性能,而且关系到汽车的驾驶安全。悬架控制臂在车辆进行越障时承受较大的载荷,可能由于强度设计不足而发生弯曲失效。同时,由于环保及经济性的要求,控制臂需要进行轻量化设计,本文基于强度工况对控制臂的优化设计进行了研究。首先,对控制臂进行线性强度分析。根据整车设计参数在Adams中建立了前麦弗逊悬架的多体动力学模型,按照一般强度工况的定义输入轮
现代制造业正在往自动化和智能化的方向发展,控制系统作为工业机器人的大脑,决定着机器人的性能。传统的机器人控制系统是封闭式的,存在移植性差、可扩展性差和开放程度不高等不足。同时,智能制造对机器人的自主性控制要求也越来越高,将视觉传感器引入机器人控制系统的需求显著增加。针对以上问题,本文根据模块化和分层化的设计思想,在课题组已有的一套总线式软件运动控制器的基础上研究和开发了一套通用型工业机器人控制系统
极端降雨天气下外绝缘雨闪严重影响超、特高压输变电工程稳定运行。电站内雨闪多发生于伞裙较密集、直径较大的绝缘子,其在极端降雨下的电气绝缘性能尚未被全面研究。本文以空心瓷绝缘子为试品开展了人工淋雨试验,研究了不同淋雨条件和伞裙结构参数等因素对淋雨特性及闪络特性的影响,并重点分析了水滴形变与闪络特性的关联关系。研究成果可为极端降雨地区绝缘子选型和设计以及防治雨闪提供技术参考。首先,本文在已有研究的基础上
医院建筑区别于其他民用建筑,有服务人群特殊、功能繁杂、医疗流程和工艺复杂等特征,而医院项目建设本身也有自身的特点,如:管理难度大、要求高、影响大、造价高、工程变更多等,由此导致医院建设项目前期造价风险性大、控制难度高且不易管理。为经济、合理地控制医院建设项目的造价,必须对前期阶段存在的风险性进行有效管理,为后续造价风险控制提供可靠依据,进而实现造价风险管理目标。为此,本文的研究内容主要包括以下几点
公路货物运输是我国综合运输体系中至关重要的一环,承担了货物短途运输、“门到门”运输的重要责任,在社会和经济发展中具有举足轻重的地位。随着交通基础设施的不断完善、公路货物运输的不断发展,我国各级交通主管部门愈发重视公路货物运输的统计分析工作,但实践中采用的公路货物运输统计分析方法仍停留在传统方法中,公路货物运输信息化、智能化统计分析仍有待深入发展。近年来,交通信息化发展已初现成效,交通数据的不断积累
近年来,心血管病成为我国疾病负担和居民死亡的首要病因。随着医疗服务的信息化管理和数字化发展,医疗领域积累了大量的自由文本。如何从这些数据中提炼信息,并加以管理及应用,是推进智慧医疗建设的关键问题。本文旨在从心血管临床诊疗文献中自动提炼出有效的辅助诊断信息构建心血管知识图谱,并应用于自动问答系统,为医患提供高效精准的心血管资讯服务。具体内容如下:(1)研究基于多头标注和负采样的非结构化知识抽取。针对
我国的城市海岸线因周边生活需要和商业开发所需,有统一搬迁老港区、重新规划至新港区的需求,其投资建设具有一定风险,本文以海口XH港汽车客货滚装码头一期工程为案例,对BT&EPC模式下港口项目投资建设方的风险进行分析研究。本文首先通过专家访谈法对BT&EPC模式下港口项目投资建设方的风险进行识别,发现主要有下列风险:政策风险、市场风险、金融风险、自然风险、不可抗力风险、管理风险、成本风险。其次运用AH
随着社会人口老龄化发展,以人体为中心的无线通信网络将在医疗领域得到广泛应用。可穿戴天线,是保障无线通信可靠和稳定的重要元件,具有非常重要的研究意义。由于人体的电特性,可穿戴天线设计具有一定的挑战性。基片集成波导(SIW)结构,由于其简单的结构和出色的电磁屏蔽性能,非常适用于穿戴式天线的设计。将SIW结构的天线集成在可穿戴纺织材料上,可以保持人体舒适度的同时提供高效稳定的性能。本论文由国家自然科学基
高分辨率图像能够提供丰富的图像细节,帮助完成高级视觉任务,如识别、分割和检测等。它在很多领域有着广泛的实际应用,如遥感图像、医学图像、卫星图像、视频监控和生物测定等。获取高分辨率图像最直接的方法就是使用更好的硬件设备。受限于硬件制作技术和高昂的设备成本,该方法难以大范围使用和推广。图像超分辨率方法,可以从低分辨率图像中生成高分辨率图像,满足人们对于高分辨率图像日益增加的需求。近年来,深卷积神经网络