【摘 要】
:
随着计算机技术的快速发展,计算机视觉领域的算法成果在图像识别、目标检测、实时跟踪等方面都取得了显著的效果。其中,多目标检测任务作为计算机视觉任务的基础,结合了数据
论文部分内容阅读
随着计算机技术的快速发展,计算机视觉领域的算法成果在图像识别、目标检测、实时跟踪等方面都取得了显著的效果。其中,多目标检测任务作为计算机视觉任务的基础,结合了数据图像处理、相关模式识别、图像特征提取、深度学习等众多领域的相关理论成果,成为了计算机视觉领域中的重中之重,具有极高的研究价值和挑战性。本文以基于特征融合与注意力机制的多目标检测为研究主题,目的是为计算机视觉领域的相关部门提供参考,为此主要做了如下工作:首先,分析了多目标检测模型的相关背景和研究价值,对文中涉及的相关基础理论做出了分析,重点阐述了图像处理中用到的双线性插值法和相关注意力机制理论。其次,针对传统SSD多目标检测算法缺乏同时捕获局部细节特征和全局语义特征的能力,提出了SSD检测模型相关特征层的融合方法,从而重新生成模型的的目标检测金字塔(object detection pyramid,ODP)。通过实验表明,加入ODP机制的SSD 300算法在PASCAL VOC的测试集上可以达到79.2%的精确度,与传统的SSD 300算法相比精确度提高了2.3%。最后,针对网络模型的输入图像,设计了SSD多目标检测模型的注意力机制模块。该模块基于重新生成的ODP,能够分析到输入图像上不同位置特征的重要程度,注意力机制模块产生的注意区域图突出了输入图像中的关键区域,将分类检测器聚焦在对检测任务较为重要的图像区域上,对输入图像中的非关键区域起到了抑制作用。与单纯建立提议性区域间关联的方法相比,更加接近人类的视觉注意力机制。经实验验证,在加入注意力机制模块后,改进的SSD300多目标检测模型在PASCAL VOC的相关测试集上,检测精度再次提升了1.1%,模型的最终准确率达80.3%。与现有的一些多目标检测模型相比,改进SSD多目标检测模型的性能虽有所提升,但由于特征融合方法、注意力机制模块的使用,模型检测实时性有所下降。针对该问题,希望通过未来进一步的研究,提升改进模型的检测实时性。
其他文献
目的:腹腔镜手术,对麻醉和手术带来了很大的风险,这一点在各个脏器功能低下的老年患者更甚。气腹、头低足高位的双重作用对呼吸力学有着显著的影响,甚至会引起肺损伤等严重并
近年来,随着图像传感器技术与航天航空遥感技术的高速发展与进步,高分辨率的图像数据量显著提高。而高分辨率图像在带来更多信息的同时也带来了更复杂的背景信息。如何快速准
珍贵彩色健康森林建设对于促进森林系统健康稳定发展、优化生态功能、美化景观结构,提升城市品味、促进森林旅游,实现社会、经济、生态可持续发展具有重要意义,也是中共中央
21世纪,是一个信息技术高速发展的时代,日新月异的信息技术使人们的生活也发生了极大的变化,包括教育、医疗、购物等方方面面。在信息时代,GPS定位技术的发展与通信设备的普
太行菊属(Opistopopappus Shih)为菊科植物多年生草本,仅分布在太行山,具有重要的经济价值、观赏价值和药用价值。其属内有长裂太行菊(Opisthopappus longilobus Shih)和太行菊(Opishopappus taihangensis(Ling)Shih)两个种。太行山独特的地形地貌及复杂的气候条件对其产生了明显的影响,但其影响如何尚未明确。本文利用景观遗传学方法
目的:成釉细胞瘤(ameloblastoma,AB)是一种牙源性肿瘤,发生于颌骨,其具有侵袭性生长和术后易复发的特点。AB的临床表现为生长缓慢的无痛性肿胀,鉴于疾病早期症状不明显且缺乏
随着市场竞争加剧,如何提高产能、降低成本成为企业面临的重要问题。论文以某汽车电子开关生产线为研究对象,综合运用流程化生产、快速作业切换等精益生产方法进行产能提升研
随着互联网等信息技术的迅速发展,网络信息以文本、音视频、图像等为载体不断增长,形式、类型、内容等方面的规模日益增大。面对海量的信息数据,如何高效地挖掘出所需要的内
目的:围手术期许多诱因可导致QTc间期延长,如性别、高龄、电解质紊乱和某些药物等。临床上有明确报道,在全身麻醉或椎管内麻醉下实施手术,可引起QTc间期延长。喉镜置入、气管
地名是一定的社会群体为特定的地域所约定的专有名称,其基本作用在于指明一定地域的方位、范围和所属的地理类别。地名用字也称地名汉字,是记录地名的最主要载体。研究地名用字的目的在于:丰富汉字内涵,发掘该地自然地理、人文历史在地名用字上的特点,为历史、地理等学科开拓新思路、新方向,为新开发地区的命名提供重要参考依据。目前,自贡地名用字的系统研究在学界还是空白,研究自贡地名用字旨在深入了解和分析自贡地区的地