基于注意力机制和神经网络结构搜索的目标检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lichao984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像目标检测的目标是确定图像中每个对象实例的空间位置和范围。目标检测作为图像理解和计算机视觉的基石,是解决复杂或高层次视觉任务的基础,被应用到很多的实际的业务场景。目前,现有的一步法目标检测算法存在多尺度特征融合不充分、视觉目标特征未对齐和对不同尺度特征未设置独立的预测输出等三个问题。因此,本文的主要研究目的是分析一步法目标检测算法的这些问题的成因,并对每个问题提出针对性的改进方案,最终提高模型的检测精度。首先,针对当前目标检测模型的多尺度特征融合不充分的问题,提出了一种新的特征融合结构NFS。NFS在特征金字塔网络FPN和PANet的特征融合结构的基础上,添加短路连接和3D卷积融合结构,使得各个尺度的深度特征的语义信息和空间信息更加丰富,进一步提高了多尺度特征融合的效果,能够在MS COCO数据集上提升1.7m AP。然后,针对一步法检测模型缺乏目标特征对齐过程的问题,提出了基于改进的非局部自注意力机制的模块BWNL。BWNL在当前的非局部自注意力网络NLN对全局特征信息的聚集作用的基础上,进一步引入第二次特征汇集过程。BWNL应用到一步法检测器的特征对齐过程,使得特征图获取了对应视觉目标更加准确的特征表达,实验表明BWNL能够显著改善一步法检测模型的特征对齐问题,在MS COCO数据集上提升0.8m AP。最后,针对一步法检测模型中head处理不同尺度特征没有采用独立的预测输出head模块的问题,提出了使用神经网络结构搜索算法为多尺度特征搜索各自独立的head的设置。实验表明,经过搜索得到的新head的设计能够显著提高特征提取能力,能够应对特征图尺度变化下的目标特征分布的变化,在MS COCO数据集上提升1.4m AP。
其他文献
作为重要的战略资源,石油的高效开采关系到着国家经济的良好发展,有杆泵抽油方式在石油的开采中占主导地位,却深受杆管偏磨的困扰,严重影响到开采效率和开采成本。解决杆管偏磨问题的众多方式中,尼龙基抽油杆扶正器的使用是极为有效的一种。但尼龙材料本身存在吸水率高、耐磨性能差等问题,因此研究一种吸水率低、力学性能好、耐磨性高的抽油杆扶正器专用材料具有重要的实际意义。本课题利用挤出造粒-注塑成型工艺,以尼龙66
学术合作是学术界的一种普遍现象,合作者推荐系统帮助学者发现有价值的合作者。大多数推荐技术以提高推荐结果的准确率为目标,为学者提供相似的合作者,但是它们忽略了推荐结
在GitHub中,议题报告(Issues)和分支请求报告(Pull Requests)是项目的两个重要组成部分(本文将议题报告和分支请求报告统称为议题单元)。现有研究证明,议题单元之间的链接在
随着城市化进程的不断深入,县级市的城区范围在不断扩大,人口在不断增加。在这个高速发展的过程中,县级市城乡结合部区域不仅存在大量新建的城市设施,同时也保留老旧面貌,在这个新旧更迭的时期,城乡结合部能够直观地、集中地反映出城市市容环境较脏乱、违章搭建较肆意、流动摊点较密集、倚门出摊较普遍、户外广告较无序等等的突出问题与症结,在城市管理过程中,该区域反映出来的问题具有一定的代表性,这些问题在一定程度上减
二氧化碳是主要的温室气体,但同时又是储量丰富、廉价易得并且可以再生的碳资源,将二氧化碳转化为高附加值的化合物不仅具有极大的经济价值,还能实现良好的生态效益。但由于
随着自动化控制技术的发展,工控系统的网络环境由相对封闭变得不断开放,使得作为工业领域神经中枢的工控系统面临着更严峻的安全形势。Modbus/TCP作为工业领域最重要的协议之一,被广泛应用于石油、电力等国家关键基础设施行业,一旦遭到恶意攻击将造成严重的安全事故。本文进行了基于Modbus/TCP协议的异常检测算法的研究,主要工作包括以下三个方面:(1)针对Modbus/TCP协议的异常检测技术中特征
三羧酸循环是需氧生物体内普遍存在的代谢途径。然而,由于缺乏α-酮戊二酸脱氢酶,蓝细菌需要通过非传统的三羧酸循环途径完成α-酮戊二酸到琥珀酸的代谢。本课题对集胞藻PCC6803中sll1981基因和鱼腥藻PCC7120中all3556基因编码蛋白作了详细研究,以深入理解蓝细菌中的三羧酸循环。蓝细菌α-酮戊二酸至琥珀酸的代谢途径中主要涉及两个关键酶,分别是α-酮戊二酸脱羧酶和琥珀酸半醛脱氢酶。α-酮戊
随着城镇人口的增加,城市生活成为一种普遍的生活方式,城市对人类发展产生越来越大的影响,城市何以繁荣以及可持续发展路径的探索受到关注。在我国,对这些问题的研究,哈尔滨
党的十九届四中全会强调加快建设人民满意的服务型政府,健全国家基本公共服务制度体系,实现公共服务高效化。政府作为公共服务的主要提供者,基层公务员流动是政府公共服务建设中的重要环节,调动基层公务员的工作积极性,加强基层公务员队伍建设,提高政府治理能力有重要意义。但从实际情况和相关研究来看,基层公务员的流动性普遍较弱,其内部横向交流和纵向交流产生的工作效益较小,影响了政府公共服务能力的创造性发挥。因此,
随着科学技术的发展,无障碍设施已经在我们的生活中逐步完善,但是盲人的安全出行仍然是一个急需解决的问题。我国现有盲人群体数量巨大,如何运用信息技术提高该群体的生活质量,越来越受到社会各界的关注。基于计算机视觉的导盲技术通过盲道检测提升了盲人获取信息的能力,具有很高的应用价值。盲道检测的关键在于准确获取盲道的两条边界线,本文根据图像中的盲道特征,利用二值图像的Gabor特征进行了盲道识别软件的算法设计