【摘 要】
:
无人机和卫星遥感的飞速发展使得航拍图像越来越容易获取。相比于自然场景下拍摄的图像,航拍图像通常能够包含更多的地物信息,因此如何在航拍图像中进行检测已成为当前热门的研究课题。然而由于特殊的拍摄视角,航拍图像中具备检测意义的目标尺度通常非常小,例如人、车等,而且航拍图像也具有背景复杂、正负样例不平衡以及目标类别之间不平衡等问题,这给目标检测造成了极大的困难。当前基于卷积神经网络的航拍检测算法已经成为主
论文部分内容阅读
无人机和卫星遥感的飞速发展使得航拍图像越来越容易获取。相比于自然场景下拍摄的图像,航拍图像通常能够包含更多的地物信息,因此如何在航拍图像中进行检测已成为当前热门的研究课题。然而由于特殊的拍摄视角,航拍图像中具备检测意义的目标尺度通常非常小,例如人、车等,而且航拍图像也具有背景复杂、正负样例不平衡以及目标类别之间不平衡等问题,这给目标检测造成了极大的困难。当前基于卷积神经网络的航拍检测算法已经成为主流,这类算法通常将航拍图像的检测分为三个阶段。第一阶段获取图像的语义信息,例如目标簇区域、目标密度图等。第二阶段则利用这些语义信息对图像进行裁剪。第三阶段对裁剪块逐个进行目标检测,并融合最终的结果。这类算法在航拍检测中取得巨大成功的主要原因在于,通过图像裁剪可以增加目标在图像中的面积占比。但这类算法也存在一些问题,包括目标在裁剪块中面积占比不合理导致检测精度变低、裁剪块过多导致检测效率低等问题。针对航拍图像的检测难点以及近两年航拍检测算法的缺陷,本文提出了一种基于粗粒度密度图的航拍图像检测算法。首先本文设计了粗粒度密度图和密度估计模型。然后将密度图中目标连通区域的最小包围框作为图像裁剪的依据,并且闭操作和回归模型调整簇区域的数量和簇区域内目标的尺度。在训练阶段使用Mosaic增强和自适应训练样例选择机制解决正负样例不平衡、类别之间不平衡以及小目标训练问题。最后对裁剪块逐个进行检测,并且合并一张图像中所有裁剪块的检测结果。模型在VisDrone、UAVDT、DOTA和TT100K四个数据集上测试。实验结果显示了本文算法的优越性。在无人机采集的VisDrone和UAVDT数据集上,相比于近两年航拍检测模型,本文算法的检测精度有显著提升,这说明对于无人机拍摄的图像,本文算法是非常有效的。而对于卫星拍摄的图像DOTA和交通信号图像TT100K,本文算法获得了和主流算法近似的效果,这表明本文算法对于不同场景具有鲁棒性。
其他文献
使用机器人装配电缆等柔性工件是进一步提高生产效率和降低人力成本的关键。许多工业领域已经实现了用机器人自动组装工件。由于像电缆、柔性电路板、密封圈这类柔性工件在受外力作用时容易发生形变,大部分情况下机器人无法预测和估计工件的变形或利用工件的变形来完成装配任务,因此在研究时主要对柔性体的避障方法进行研究。但在一些环境中无法避免柔性体与环境的接触,这就需要利用柔性体与环境接触的变形来完成装配任务。本课题
图像/视频超分辨率重建任务作为计算机视觉的底层任务之一,其目的是将多帧或单帧低分辨率图片恢复成参考帧对应的高分辨率图片,由于高分辨率视频/图片提供了更为丰富的细节信息,这对于后续的诸多视觉任务至关重要,如复杂场景下的小目标检测、监控视频的行人重识别、医学成像、航空遥感图像等,这使得超分辨率技术成为了计算机底层视觉领域的一大研究热点。本学位论文基于生成对抗网络的框架,通过改进现有的循环帧处理网络结构
语音增强是语音信号前处理中的重要内容,它在助听器设备、语音通话、人机交互等领域有广泛的应用。智能设备的发展带动消费领域硬件规格提升,采用高采样率的麦克风已经成为一种发展趋势,研究高采样率语音增强有非常大的现实意义。本文对单通道48 k Hz采样率的语音增强算法进行研究,提出深度学习与传统方法相结合的语音增强方法。传统语音增强方法中最小均方误差频谱幅度估计器有较高的性能和较好的鲁棒性,该方法的效果主
随着我国实现经济全球化、市场的进一步对外开放,建筑行业受到了巨大的冲击。而在建筑行业中,室内装修占有突出地位,只有房屋装修良好美观,才能保证户主生活舒适。一方面,室内装修环境对工人健康存在威胁且工作过程的劳动强度大,虽然行业薪酬水平大大提升,但许多岗位依然出现人员严重短缺的情况;另一方面,很多工序对施工质量要求高,尤其是墙面精装修中的刮腻子工序,要求工作人员具备长期的施工经验和高超的技术水平,以保
随着计算机视觉技术的日益成熟,视觉系统越来越多地出现在机械臂领域中。然而,仅仅利用二指夹手的抓取动作,扁平物体的抓取存在困难,成功率较低。引入机械臂推移动作,不仅可以将扁平物体推动到平台边缘,使其能够被水平抓取;还可以清除指定物体周边的阻碍,腾出足够的空间以供抓取。本文期望通过设计一套流水线算法框架,以场景的RGB图和深度图为输入,实现场景中物体的识别与定位,自主规划推移和抓取动作序列,智能地实现
近年来全球各地如冰灾暴风雪等极端自然灾害事故多发,造成长时间大范围的停电,需要提升电力系统的弹性来应对这类事件。配电网直接参与大量关键负荷的供电,研究如何优化配电网的电压水平,提升关键负荷的供电质量,对增强电力系统弹性具有重要意义。本文利用分布式电源及可控设备对配网进行优化,根据配电网优化问题特性对求解方法进行研究和改进,并实现算法的并行化以减少计算时间,从而增强电力系统抵抗灾害及灾后恢复的能力。
近年来随着科技的迅速发展,人们对于产品的智能化以及自主化提出了更高的要求。在自动驾驶及驾驶辅助领域,行为主体的环境感知与自主决策能力成为关注的焦点。其中目标检测与测距技术作为关键技术,深刻影响着行为主体对周边环境目标种类的分辨以及距离的感知能力。基于单传感器及传统目标检测算法的目标检测与测距技术愈发无法满足主体对复杂环境感知的要求。而基于深度学习的目标检测算法以及基于传感器融合的环境感知技术能够提
经过了多年的发展,协作机器人的控制算法依然以拖动示教和阻抗控制为主,无法更好地发挥协作机器人与人合作的优势。因此本文针对重复的人机协作任务,对协作机器人控制算法进行了研究。机器人可以在与人进行协作任务的同时,通过记录任务时的相关位置、力和速度等信息,利用迭代学习控制算法更改机器人的参考运动轨迹,从而使得机器人适应人类的操作与运动习惯,提升人类在人机协作任务中的舒适性以及协作任务的精确性。在研究人机
科学技术的发展使得现代战争基本上已经实现了海陆空的全方位监测和打击,但是目前针对两栖环境下的作战平台的研制开发却并未进入实际战场应用阶段。随着我国军事战略重心的转移以及国际外部环境的压力,水陆两栖作战环境是我军以后比较常见的作战环境,为了增强我军在海滩、沼泽湿地等水陆两栖环境下的作战能力,有必要研制一款水陆两栖作战平台,实现对两栖战场环境的侦查、监测和打击,两栖作战平台可以代替人类去执行危险任务,
谐振式光纤陀螺(RFOG)是一种以光学Sagnac效应为基础的光学陀螺,与传统干涉式光纤陀螺相比,谐振式光纤陀螺可以在光纤环更短的情况下达到和干涉式光纤陀螺相同的检测精度,受到国内外研究人员的广泛关注。有学者论证,用圆偏振腔代替传统线偏振腔在抑制各种光学噪声的方面上具有更好的效果。论文在此基础上,利用法拉第旋光效应,提出了新的闭环控制方案,并开展了相关研究工作。本文提出的信号处理方案进一步增强了谐