基于YOLOv5的目标检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:z57989503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域最具挑战性的研究课题之一,旨在对图像中的物体进行分类和定位。在深度学习快速发展的推动下,目标检测近年来取得了巨大的进步,如今在视频监控、自动驾驶、遥感检测等领域已得到广泛应用。因此,对目标检测做更深入的研究具有非常重要的学术价值和应用价值。先进的目标检测器结构为卷积神经网络,首先提取图像的语义信息和几何信息,生成特征图,然后在特征图上判断物体的类别以及置信度,并且给出物体的边框坐标。现阶段先进的目标检测算法已实现了实时检测,并且在通用物体检测上具有较高的检测精度,但是对于小物体检测、复杂背景物体检测、伪装物体检测、超大物体检测等检测场景,检测精度还有很大的提升空间。针对此情况,本文选择以YOLOv5目标检测算法为基础,对其进行研究,并提出了三种改进方案。首先将原来3个尺度的特征检测改为5个尺度,并且添加了新的特征融合结构,改进后的结构提取到的特征信息不仅更加丰富全面,而且检测器能够利用到更加细粒度的特征。其次在卷积神经网络的不同位置引入了注意力机制,并且将通道注意力机制中的压缩激励模块改为高效通道注意力模块,使得在特征提取的过程中网络能够在通道域和空间域增强有效特征,削弱无用特征。然后对图像处理中的高斯滤波做了研究分析,在目标检测中融入高斯滤波,对原始图像和路径聚合网络中特征融合时的浅层特征图分别做了不同程度的平滑处理。本文从理论上分析了改进方案的可行性,选择目标检测公共数据集MS COCO和伪装目标检测数据集COD10K进行实验验证。实验表明,本文改进的多尺度特征检测与特征融合结构扩大了检测范围,在保证查准率的前提下查全率有了明显提升;引入注意力机制后,对伪装物体和小物体的分类以及定位更加准确,对于MS COCO数据集中的大物体检测,精确率和召回率都有了明显提升,分别为6.3%和5.4%;对原始图像和部分浅层特征图做微小平滑后,有利于超大物体检测,在MS COCO数据集上测试,精确率和召回率分别提升了2.1%和2.7%。因此,通过实验测试,证明了本文在YOLOv5目标检测算法基础上提出的改进方案切实可行,达到了检测性能更优的效果。
其他文献
工程领域中存在着大量的待优化问题,其中多目标优化问题在生产和生活中具有广泛的应用,例如,在工业加工过程中,需要同时优化加工成本、生产效率、工具寿命这些指标;隐身飞机需要考量隐身性能和机动性能;而在药物研究领域,药效和副作用也是要同时优化的目标。因此,研究多目标优化问题具有重要意义。近些年来,大量的多目标进化优化算法被提出,实验结果显示,这些算法在一些测试问题上表现优异,例如 DTLZ(Deb-Th
一直以来,印章都是具有法律效力的个人身份象征、集体信誉代表。但是,随着信息技术与计算机科学技术的迅猛发展,伪造印章在社会上出现得越来越频繁,以激光雕刻印章为首的变造章无时无刻不在紊乱社会治安,给人民和国家的经济利益带来了不少的损失。通过自动鉴别真伪图章可以减少诈骗和犯罪率,有效维护国家、集体与个人的利益。本文以此为出发点,研究印章的自动匹配和印文内容的自动识别。印章的自动匹配可以高效地利用印章图像
视觉是人类获取外界信息最重要的途径,约80%的信息由视觉获得。人类的视觉识别能力对其成长和学习等诸多方面都具有重大意义,而其背后的神经机制更是学术界一直以来的研究热点。在神经科学研究领域中,视觉专家是指在视觉识别方面能够对某类物体进行快速准确地分类和鉴定的人,其在视觉识别方面的行为表现非常稳定且优于常人。因此,视觉专家常作为研究人类视觉识别的对象。然而关于视觉专家的分类及大脑表征研究还存在着很大空
2022年中注协工作的总体思路是:深入学习贯彻习近平新时代中国特色社会主义思想、党的十九大和十九届历次全会精神,以习近平总书记关于注册会计师行业要“紧紧抓住服务国家建设这个主题和诚信建设这条主线”的重要论述为指导,认真贯彻落实国办发30号文件,按照财政部党组对注册会计师行业的总体部署,弘扬伟大建党精神,重点围绕“整顿行业秩序、建设法规体系、
期刊
在线广告(Online Advertising)是一种利用互联网作为媒体,通过实时竞价(Real Time Biding,RTB)帮助广告主吸引目标消费者,从而实现目标诉求的市场策略。电商搜索广告(Sponsored Search,SS)是一种主流的在线广告,即消费者通过在电商平台输入用户请求,广告主在电商平台实时竞价竞得流量,从而获得后续的成交行为。在高度动态的电商市场(如淘宝,亚马逊,京东等)
异质功能件是指由不同材质构成,具有特定功能的零件,传统的机电分离制造方法存在工艺复杂、精度低、性能差、制造柔性差等不足,一体化喷射成形技术结合适当的固化工艺可实现支撑防护结构和功能系统的同步喷射与固化成形,不但易于实现复杂结构成形,还可简化制造工艺。但固化工艺种类多,机理复杂,固化工艺参数直接影响最终成形件的性能。本文针对紫外光固化和闪光烧结的工艺参数对成形件性能的影响和参数优化进行了研究,旨在提
自动制造系统(Automated Manufacturing System,AMS)的活性研究是生产系统领域中的研究热点问题。对于自动制造系统而言,死锁是不可以接受的,因为这意味着系统随时可能出现生产停滞现象,从而造成严重的甚至灾难性的后果。资源共享装配系统由于其包含同步操作,能够完成更为复杂的生产过程而受到了广泛的关注。但是该类系统结构复杂,建立其活性系统模型会面临许多困难和挑战。现有文献虽然对
高超声速飞行器在临近空间高速飞行时,飞行器会与空气剧烈摩擦,使得飞行器周围产生几十种化学成分组成的复杂结构等离子体鞘套。飞行器外围的等离子体鞘套会引起入射电磁波的散射、衰减等效应,情况严重时会使得通讯中断,外界无法与飞行器联系,即“黑障”现象。此外,等离子体鞘套的存在还会对飞行器的雷达散射截面产生影响,从而对雷达探测、雷达预警提出了更高的要求。本文基于电感耦合等离子体产生装置,开展地面模拟测量,并
随着自动控制等技术的快速发展,无人机系统以其广阔的应用前景受到越来越多的关注。多旋翼无人机因其操作简单、可定点悬停等优势,在自主完成各类复杂空中作业中担任着越发重要的角色。无人机在复杂环境下执行完空中作业后,对其进行安全回收是很重要的一个环节。本文以6-UPS并联机器人为操作机构,基于自动控制和机器视觉技术,开展了多旋翼无人机智能抓捕与收纳技术研究。论文的主要研究内容如下:首先,基于派克可编程自动
Petri网是离散事件系统建模和控制的数学工具,被广泛应用于表征离散事件系统。对系统的网络攻击可能会带来严重风险,因此受到研究人员和工程技术的广泛关注。本文中考虑在恶意攻击下部分可观Petri网(Partially Observed Petri Nets,POPNs)的监督控制。这些攻击可能因插入,删除和替换事件标签等不同攻击类型而破坏观测序列(即一系列的可观事件)。对于一个POPN而言,由于其部