基于改进的YOLOv3目标检测与应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：gigahunter

【摘要】

：

【作者】

：

朱斌

【机构】

：

南京理工大学

【出处】

：

南京理工大学

【发表日期】

：

2020年01期

【关键词】

：

目标检测 YOLOv3 注意力模型钢爪识别缺陷检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着机器视觉的发展与应用,将视觉检测技术运用于工业场景中已经成为智能制造业的热潮。钢水浇筑在生产过程中,存在很多不可控的质量问题,在制造过程中会出现部分划痕、形变等瑕疵,而操作人员需要近距离判断检测浇筑钢爪的合格与否,这样的检测方式效率过低。为此本文分析和应用了基于深度学习的目标检测框架进行训练,实现形态各异、多角度的钢爪识别与检测。论文主要完成以下工作:（1）分析了本文检测目标的实际环境和需求,介绍了工业智能制造业引入机器视觉的意义和目前国内外主流目标检测算法的情况。（2）针对目标检测算法的发展情况,从传统的检测算法和基于深度学习的检测方法两大方向,简要介绍了领域内经典的目标检测算法[5]和各自优缺点。（3）针对本文研究检测对象所处环境和需求,若采用基于滑动窗口算法找出钢爪的对应位置提取特征信息,传入SVM等分类器对目标实现特征识别和分类,在本文研究的检测环境下,无法保证检测准率度和实时检测的需求,同时,算法存在冗余、复杂度高的缺点。选取基于深度学习实现的SSD、Faster-RCNN、YOLO对采集数据集进行训练,选取综合效果更好的YOLO算法进一步展开探索与尝试。（4）针对YOLO检测精度、特别是针对小目标的检测效果较差,引入CBAM双通道注意力模型,进一步优化预测层传入的特征信息,提高检测精度;从Darknet-53网络结构角度增设一层预测层,更好的提高检测小目标物体的检测效率,更新本文检测对象数据集的anchors信息;损失函数方向引入GIoU完善对loss的修改,达到提升检测效果的功能。（5）针对本文改进后的目标检测算法,设计了一款基于PyQt5实现的图形用户界面应用程序,完成一键式检测目标的功能,并增设了相关基本图像预处理操作功能键。

其他文献

基于转导式的零样本图像分类方法

有监督学习是从标签化训练数据集中推断出函数的机器学习任务,是机器学习中最重要的分支之一,近年来随着深度学习的发展,有监督学习的性能得到了巨大的提升,例如深度残差网在ImageNet数据集上1000个类别的top-5物体识别精度已经达到97.7%,已被证明超越了人类的识别能力。但是,有监督学习受到一个非常强力的约束,即测试数据必须与训练数据来自同一类别,且需要为每个类别搜集数百乃至上千个有标签的样本

学位

转导式零样本学习Kullback-Leibler散度非负矩阵分解鲁棒性主成分分析领域偏移

乐谱识别软件的设计与实现

乐谱是用符号来记录音乐的方法,最初是以纸张为载体的。随着电子技术的发展,纸质乐谱可被扫描或拍摄成为乐谱图像,解决了纸质乐谱不易保存、复制、分发等弊端。计算机及互联网技术的浪潮,促进了各种音乐应用的兴起,而能被计算机理解的音乐文件是这些应用的数据基础。本文以拍摄或扫描的乐谱图像为研究对象,通过图像处理与识别的算法,将其转化为计算机能理解的MIDI文件,并基于上述算法构建了乐谱识别软件系统,具体工作如

学位

乐谱识别图像处理音符识别卷积神经网络

面向地面无人驾驶的语义分割方法及模型实现

无人驾驶是人工智能系统在人们生活中的重要应用之一,具有巨大的发展前景。图像语义分割技术作为无人驾驶系统中的重要技术之一,为无人系统分析道路可通行性提供了技术支持。目前,大部分网络模型采用相同的感受野提取图像语义特征。这将导致模型丢失大量的尺度信息,降低模型的分割效率。此外,为提高分割精度,模型常常具有庞大参数量。这不仅导致计算速度缓慢,还增大了对硬件资源的需求量,不利于模型在无人系统中的应用。本文

学位

图像语义分割卷积神经网络逐层分组堆叠自适应选择卷积核特征融合鱼眼图像

多标签分类方法研究及其在恶意软件检测中的应用

多标签分类的目的是为一个实例分配多个与之相关的类别标签,其在数据挖掘和机器学习领域是重要的一个学科分支并有着广泛的应用和研究。同传统的二分类问题相比,多标签分类问题主要的挑战在于标签相关性的利用和高维特征的约简。针对这两方面的研究有很多,但是现有的大多数算法仅仅解决了其中一个问题。为此,本文提出两个改进算法,在进行特征选择的同时考虑标签相关性,最后将研究成果应用于安卓恶意应用检测中。具体的工作包括

学位

多标签分类特征选择标签相关性恶意行为检测

基于姿态约束的车辆再识别方法研究

车辆再识别（Vehicle Re-ID）指的是根据给定车辆图像在跨摄像头车辆数据库中搜索相同ID（Identity）车辆图像的任务,在公共安全和智能交通领域具有广阔的应用前景。车辆再识别有两个主要挑战:由于车辆品牌的影响,会导致相同车型不同ID的车辆外观相似性高（类间相似性高）;因为车辆的刚体特性,使得车辆的不同姿态外观差别大,导致不同姿态相同ID的车辆图像外观相似性低（类内相似性低）。其中,姿态

学位

车辆再识别姿态变化对抗生成网络深度学习

基于图像特征的连铸钢板缺陷检测与分类研究

在工业化的连铸钢板坯生产过程中,钢厂针对连铸坯质量的评价与分类依然主要依靠人工经验。本文基于连铸坯冷酸蚀图像中的缺陷进行预处理、分割以及分类识别,为后续研发连铸坯缺陷评级系统提供准备工作。在预处理时,中值滤波和维纳滤波对图像中的噪声可以有效去除,但多次滤波会导致图像信息的大量损失。为解决这一问题,提出一种开关结构下的快速加权中值—维纳滤波器,以减少图像滤波过程中信息的损失,并通过与中值滤波、维纳滤

学位

连铸坯冷酸蚀图像缺陷识别粒子群决策导向无环图支持向量机

Al-Cu/Al-Mg双丝CMT电弧增材制造组织与性能研究

电弧增材制造技术以电弧为热源熔化金属丝材,基于离散/堆积的成形原理,并沿预设路径逐层沉积制造出3D实体零件,具有沉积效率高、生产成本低等优点。双丝CMT电弧增材制造以两根异种丝材作为填充材料,在CMT增材工艺中熔滴过渡和焊丝回抽相结合的基础上,快速生成多元成分可调合金体系,解决焊丝定制成本高、周期长等难题。本课题以2系Al-Cu焊丝和5系Al-Mg焊丝为填充材料,基于双丝CMT电弧增材制造工艺对A

学位

增材制造双丝CMTAl-Cu-Mg合金合金组分组织与力学性能

基于多目视觉的弹丸飞行姿态测试技术研究

为了解决在野外环境下测量炮口附近的弹丸飞行姿态时,攻角纸靶法精度较低,阴影照相法要搭建复杂的光路系统的问题,基于三目视觉原理,通过激光摄像法直接拍摄弹丸实像来测量弹丸的飞行姿态,既可以得到精度较高的弹丸飞行姿态,同时也不用搭建复杂的光路系统,相对于双目视觉姿态测量方式也提高了测试结果的稳定性。在对相机的成像原理、相机标定、三目姿态测量模型以及各坐标系间的空间转换关系等分析的基础上进行了三目视觉弹丸

学位

多目视觉姿态测试坐标系转换

基于Spring Boot框架与云存储的企业协作系统的设计与实现

随着“互联网+”时代的降临,办公自动化系统（OA）在信息与技术的不断演变过程中也在不断完备。如何解决企业项目管理、人员管理以及沟通管理等一系列需求,达到其信息化战略目的,打造一款能集项目、人员、沟通等多方管理一体化协作系统平台具有重大的实际意义。本文将针对某企业协作系统,分别从系统架构、系统功能模块和系统测试等多方面进行设计与实现,并研究基于Lucene的Solr检索算法和基于CB的推荐算法为系统

学位

办公自动化（OA）协作系统Spring BootSolr内容推荐算法

地铁底部图像拼接与关键部件螺栓检测系统研究

随着城轨列车技术的发展,地铁成为人们日常生活中不可或缺的交通工具,为保证人们出行安全,地铁的安全性不容忽视。车底状态检测是地铁检测的重要环节之一,但地铁段检、厂检会存在漏检情况。当前国内还没有一套完整的地铁底部复现技术和基于图像自动检测技术,因此本文对地铁底部做了相应的研究。主要工作内容如下:（1）对地铁底部图像拼接与关键部件螺栓检测系统进行总体架构设计,在需求分析的基础上,确定系统架构、系统工作

学位

地铁车底线阵相机图像拼接螺栓检测YOLO

基于改进的YOLOv3目标检测与应用研究

其他学术论文