【摘 要】
:
目标检测是通过摄像设备对自然场景中的物体进行捕获并分析的一种技术,广泛应用于机器导航、自动驾驶、智能监控和工业检测等诸多领域。近年来,随着无人机航拍设备的不断发展,针对其捕获的航拍图像进行目标检测备受研究人员关注,尽管通用的目标检测模型的检测能力取得了显著进展,但是由于航拍图像受拍摄角度等外界因素影响较大,且随着拍摄高度的变化,图像中物体的尺寸跨度变化较大,检测准确性较差;另外,无人机的灵活性导致
论文部分内容阅读
目标检测是通过摄像设备对自然场景中的物体进行捕获并分析的一种技术,广泛应用于机器导航、自动驾驶、智能监控和工业检测等诸多领域。近年来,随着无人机航拍设备的不断发展,针对其捕获的航拍图像进行目标检测备受研究人员关注,尽管通用的目标检测模型的检测能力取得了显著进展,但是由于航拍图像受拍摄角度等外界因素影响较大,且随着拍摄高度的变化,图像中物体的尺寸跨度变化较大,检测准确性较差;另外,无人机的灵活性导致无法携带大型的计算设备,且航拍图像的检测需要较高的实时性,而通用的模型并不能很好地满足这方面的需求。为了应对这些挑战,本文在Yolov3(Yolo Only Look Once Version 3)算法的基础上提出了一种基于深度卷积网络的快速目标检测方法:1.针对航拍图像尺寸跨度较大和小目标检测困难的问题,本文提出了以下方法:1)使用五级多尺度感知的判别网络替换原始的三级来检测不同尺度的对象;2)设计基于多尺度融合的注意力机制模型,将经过不同维度的注意力机制提取的特征进行多尺度变换,融合之后来优化特征信息;3)优化非极大值抑制算法来优化预测框的位置和大小,并降低漏检率,提升检测精度;4)设计分类损失函数的权重优化策略来平衡不同类别在检测准确率之间的差异。通过以上对模型和方法的改进,在具有挑战性的Vis Drone2018-Det和UAVDT数据集上进行了广泛的实验评估,证明了在航拍图像检测任务中,本文提出的方法可以实现比大多数的已有检测模型和一些Yolov3系列更高的检测准确性。2.在提高检测准确性的同时,模型计算量和体积会有一定的增加。当以无人机为假想的实验平台时,考虑到检测实时性和模型的适用性,检测模型应该具有体积小、计算量小、速度较快的特点。本文针对上述改进,采用基于稀疏训练的模型剪枝方法来压缩模型,裁剪掉对当前检测任务贡献较小的卷积核。在Vis Drone2018-Det和UAVDT数据集上进行了广泛的实验评估,实验证明采用剪枝方法可以在保证准确性的同时,优化模型的计算量和体积,保证检测的实时性。
其他文献
随着互联网的发展,现在数据越来越多样化并且复杂化。FCM算法对数据集有一定的局限性,通常在球状的类间分离明显,类内紧致的数据集中表现得较为理想。显然,不能很好的处理一些复杂情况。为此,本文我们提出了两个算法,视点驱动的子空间模糊C-均值算法(Viewpoint-driven subspace fuzzy c-means Algorithm,VSFCM)以及核子空间可能性C均值模糊聚类算法(KSPF
偏振敏感型生物可以通过探测偏振光来进行寻找猎物或栖息地等视觉任务,其偏振视觉机制对于现代偏振信息获取和处理技术具有重要借鉴意义。作为典型代表的螳螂虾,其复杂的复眼结构使其拥有多种偏振信息处理系统的可能,其丰富的三轴眼部运动存在潜在的自适应机制,且兼具偏振视觉与颜色视觉。本文从信息处理的角度,探究这一系列生物行为背后的机理,并受此启发设计了系列仿生方法。在目标与背景颜色相近等场景的实验中,本文方法能
超分辨率重建技术旨在从一幅或多幅低分辨率图像中重建出成像系统无法获取的高分辨率图像。该技术在医学成像、视频监控等领域有重要的应用价值,也为目标检测、人脸识别等视觉任务提供了辅助作用。近年来,基于卷积神经网络的超分辨率重建方法在重建质量和效率上都取得了很好的效果,但是基于深度卷积神经网络的重建方法具有参数量大、训练难度过高等缺点,轻量级重建方法仍未能在模型复杂度、重建效率和重建质量之间做出较好的平衡
随着居民生活水平的提高,人们对健康的监测也越发重视。其中心率(Heart Rate,HR)是反应生理信息的重要指标之一,监测心率及其变化对医疗诊断和疾病预防具有重要意义。现存的心率监测装置多为接触式的,如心电图(Electrocardiogram,ECG)监测、光电容积描记(Photo-plethysmography,PPG)监测等。这些监测方式通常需要特殊设备,测量成本较高,并且若长期佩戴,可能
行人检索是可以从原始视频帧中直接对要查询的行人进行定位和识别的技术。一个性能出色的行人检索系统可以省去行人检测的环节,极大地降低行人检索在生产生活中应用和部署的难度,为打造智慧城市、增强城市安全、构建智慧生活提供动力,具有重要的使用价值和现实意义。将行人检测和行人识别在统一的架构里建模,并利用深度学习强大的数据拟合能力来训练行人检索系统是当前研究的主要方法。然而,目前的行人检索算法依然存在检测框不
近年来,随着无线网络技术的发展,使用Wi Fi信号进行人体动作的检测和识别的方法在智能家居、医疗辅助和情感追踪等领域起到了重要作用,受到了大量研究人员的关注和研究。然而,现有的工作多是集中于单人动作的识别,当双人动作均为有效动作时,这类动作识别系统难以分辨出两种动作,从而无法进行有效的检测和识别。因此,本文设计了一个基于信道状态信息(Channel State Information,CSI)的双
自然图像中,常存在各式各样的纹理区域,这些纹理区域会呈现出不同尺度、不同方向等不规则特性。高效准确地提取纹理特征是无监督的自然纹理图像分割方法的关键,而传统的纹理特征提取方法易受到不规则纹理特征的影响,很难稳定有效地提取有区分度的纹理特征,所以无监督的纹理图像分割仍然是一个值得研究的难点和重点。同时,由于纹理图像具有丰富的结构特征,且整体结构具有关联性,而纹理图像的结构特征不受方向和尺度等局部信息
随着图数据的日益普及,图挖掘已成为图分析的一项基本任务,其中频繁子图及模式挖掘作为重要一环已经被广泛应用在各个领域,如社交网络分许、蛋白质检测、金融诈骗检测等,它们的目标是在数据图中找到出现次数频繁的子图或者模式。在社交领域中,频繁模式挖掘具有广泛的应用前景,例如在合作图中寻找频繁的合作模式,以此来知道团队的科学构成。但是在关系密集的社交图中,寻找频繁模式是一件极其耗费时间的任务,这使得现有方法难
远程光电容积描记术(remote photoplethysmography,r PPG)是一种从面部视频非接触式测量血容量脉冲(blood volume pulse,BVP)信号的技术,在压力检测、情绪分类和健康监测等领域具有广泛的应用。通过r PPG获取高质量的BVP信号,可计算多种心脏相关的生理指标。然而,现有的多数r PPG方法受所提取BVP信号质量的限制,只能计算平均心率值。本文提出了一种
呼吸率是一种重要的人体生理指标,在评估人体呼吸状况和诊断呼吸障碍疾病上具有不可替代的作用。目前呼吸率检测方法多需专业人员操作,在家庭日常检测方面尚有不足,而近些年出现的基于视频的非接触式呼吸率检测方法具有操作简便、适用性强等优点,在智慧医疗领域极具发展潜力。现有基于视频的呼吸率检测方法在实时性上仍有不足,并且对人体姿态有所限制,最终影响检测性能。针对此问题,本文进一步研究了基于运动特征的视频呼吸率