基于深度学习的目标检测中不平衡问题的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:flowerofwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉研究中的一个经典任务,有许多重要应用如自动驾驶,安全监控等。目标检测旨在在图像或视频序列中定位出感兴趣的目标并进行分类。得利于深度学习在目标检测领域取得的巨大的成功,各种基于深度学习模型的目标检测算法不断涌现,极大地推动了该领域的发展,当前目标检测中主流的算法都是基于深度学习技术。但用来训练深度学习网络的数据往往面临着类不平衡问题,即某些类别的样本数量远远大于其他类别的样本数量,这类问题会显著降低深度学习模型的性能。在目标检测任务中,往往目标像素在图像中的占比远远少于背景像素(类间不平衡);同时检测模型本身结构会导致数据复杂度不同,即简单样本的数量往往多于复杂样本的数量(类内不平衡);此外,目标检测任务实际上包含两个子任务即定位和分类,它们对应不同的目标函数,在训练阶段中它们的损失函数对总损失的贡献程度不一样,往往分类任务的损失大于定位的损失(目标函数不平衡)。这类问题的存在会导致基于深度学习的目标检测器的性能显著下降,目前已有一些措施被提出处理类不平衡问题,但这些方法要么需要相当大的额外内存和计算量、难以训练,要么在两级检测器上基本没有增益。因此钻研并解决基于深度学习的目标检测中类不平衡问题是有价值而且有挑战性的工作。本文分别从数据和算法层面提出适宜的方案,主要工作及创新点如下:1.设计应用在检测场景下的数据增强算法:基于深度学习技术的目标检测模型面向不平衡数据时,更容易出现过拟合问题。因此本文考虑对训练数据采用块遮挡和通用扰动生成对抗样本,进行对抗训练从而减少网络的过拟合程度。2.设计子网络辅助检测候选框的训练:现有的主流检测框架R-CNN系列的网络结构,在第一阶段生成的候选框中存在大量的背景区域,在第二阶段通过随机采样控制前景和背景候选框平衡,但这会导致训练时梯度由大量的简单样本主导。本文考虑利用子网络辅助第二阶段的采样,给以不同候选框合适的权重,填补困难样本和简单样本分布不均衡带来的影响。3.设计约束优化方法:在样本较少的类别中,模型容易因为训练集中的偶然性从而依据无关的特征来进行判断,进而造成了模型的过拟合。而增加特征间的方差能使得模型的特征分布更广,降低模型特征的冗余度,因此本文设计一种针对方差惩罚的目标函数,从而使得模型的训练更可控。
其他文献
班主任工作,说到底是"人"的工作,认识到这一点很容易,而要做好这一点则很难.做"人"的工作要求班主任在工作方法上必须灵活而不呆板,深入而不肤浅,准确而不盲目,适度而不过分.
期刊
近年来,贵州职业教育在国家政策的支持下,取得了较快发展,同时也还存在一定的问题。对贵州省高等职业教育的发展现状和问题进行分析,提出了关于高等职业院校教育改革的几点思考。
小麦生育后期,是指小麦从抽穗开花,历经灌浆到小麦成熟收获这一段时间,约40d左右,时间虽短,但却是小麦产量形成的关键时期。因此,搞好小麦后期的田间管理,增加穗粒数,提高粒
随着国际贸易的发展,越来越多的国家受益于经济全球化,对外贸易蒸蒸日上,经过多年的贸易谈判,各国的贸易制度逐渐开放,关税水平已经大幅度的降低,通过调节关税促进国际贸易发
目标跟踪任务是计算机视觉中一个非常重要的研究课题,作为一门交叉了图像处理,信号处理,机器学习,最优化理论,人工智能等多方向的综合学科,近年来在学术界和工业界得到了广泛研究,但是由于目标跟踪算法本身的实现难度高,高质量数据缺失,取得的进展要慢于目标检测,语义分割等更加基础的视觉任务。目标跟踪技术在民用和国防领域应用广泛,是视频监控,城市安防,医学诊断,无人驾驶等概念的关键技术之一。基于深度神经网络的
<正>近年来,上海高中生涯辅导在促进每一个学生的终身发展的需求和高考改革背景下,在上海市教育委员会的统筹下,得以大规模地推进。本文在上海高中226所学校全样本调查的基础
随着信息时代的发展和编程技术的普及,搜索引擎成为了使用互联网的常用工具。搜索引擎大多使用爬虫技术作为核心模块,通过关键词返回用户查询的结果。但是网络信息呈现爆炸式的增长,使得信息的查找和定位也变得困难。为解决上述困境,研究借助Python和Scrapy语言框架基础,以“旅游网站”为爬取目标,通过分析当前现有Web crawler的运行机理、功能单元以及算法程序,试探性的创建一个针对性比较强的网络爬