面向高分辨率图像的目标检测算法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:storm_shen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉技术蓬勃发展。目标检测作为其中的代表性研究方向,在交通、医疗和军事等领域发挥了重要作用。随着计算机硬件能力的提升和目标检测算法不断的推陈出新,检测的精度和效率也不断得到了提高。在目标检测中,比较常用的数据集是MS-COCO和PASCAL VOC等,大多数检测算法基于这些数据集而提出,这些数据集的共同特点是图像分辨率相对较低,平均每张图像的分辨率在500×500像素左右。然而,硬件技术的提升也导致了拍摄图像分辨率的提高。尽管这些检测算法在低分辨率数据集上有不错的表现,但是在高分辨率图像上却会面临不小的挑战。一方面,真实的图像场景中可能包含许多小目标,这些小目标所占面积小,容易被漏检,进而影响检测精度。另一方面,图像分辨率的提高会导致计算量大大增加,进而影响检测效率。因此,在高分辨率图像中,小目标的检测和整体的检测效率问题无疑是两大难点。基于上述难点,本文的主要工作如下:(1)传统的YOLOv3采用了多尺度的检测方法来融合不同特征图之间的特征信息,以此来提高检测精度。但是由于在YOLOv3中,三个尺度均与特征提取网络较深层的结构相连,导致在高分辨率图像中损失了部分小目标的特征信息,造成漏检。因此,本文向上调整了YOLOv3的多尺度检测部分,将其中两个尺度与较浅层的网络相连,用于保留更多小目标的信息,以此来提高小目标的检测能力。同时,在特征提取网络中加入了空洞卷积模块,采用三个不同空洞率的卷积组来融合特征,对于小目标来说,可以利用目标的空间上下文信息进一步提高小目标的检测精度。实验表明对YOLOv3的改进提高了目标(特别是小目标)的检测精度。(2)受到计算机硬件资源的限制,较高分辨率的图像无法直接作为目标检测网络的输入,而若直接将高分辨率图像下采样后作为检测网络的输入,也会造成目标信息的损失。在本文中,首先将高分辨率图像切分成了若干个子图,然后引入了由粗到精的检测策略,大大提高了检测的效率。该策略在特征提取部分加入一个粗检测模块,用于过滤掉一些不含目标的子图。粗检测模块用以计算子图含有目标的置信度,对于置信度高的子图,表明有较大可能存在目标,而置信度低的子图很有可能是背景区域,在后续的步骤中,只对高置信度的子图继续进行特征提取。最后再在这些经过完整特征提取的特征图上进行精细检测。通过粗检测对子图的过滤,大幅提高了检测的效率。(3)为进一步提高高分辨率图像中的目标检测效率,本文基于知识蒸馏,提出了基于图像蒸馏的目标检测方法。与传统的知识蒸馏思路不同的是,本文将原始图像切块后的子图当作教师网络的输入,把子图按一定比例下采样后的图像当作学生网络的输入,而让教师网络和学生网络的结构保持一致。该方法通过教师网络对学生网络的指导训练,实现了在保持较高检测精度的同时达到更高检测效率的目的。本文共有图25幅,表13个,参考文献56篇。
其他文献
道路运输在交通运输中占有相当高的比重,货车作为运输过程中的主要载体,在运输时往往以多辆车编队的形式出现。货车编队行驶不仅可以增加道路通行效率,还可以利用前方车辆的尾流效应来降低整体的燃油消耗。近年来随着传感器技术、通信技术以及自动控制技术的发展,越来越多的学者开始关注货车编队控制研究。本文针对货车编队行驶问题,研究了三种基于无模型自适应控制(Model Free Adaptive Control,
在信息化高速发展的今天,管理信息系统作为企业的工作平台已得到越来越广泛的应用。但是,管理信息系统的开发需结合企业背景、经营理念以及管理流程等多个因素,同时涉及需求分析、架构搭建、功能设计、测试调试、运行维护以及应用评价等多方面内容,可以说是一项综合性较强的系统工程。由此可见,在规定的计划工期内完成管理信息系统的开发具有很大的挑战性。与此同时,管理信息系统的开发作为软件类项目的一个类别,同样面临着开
预售作为一种新产品销售策略,已被广泛应用于各类产品的销售。预售模式下,产品的整个销售周期被分为预售期与现货期两个阶段。在互联网时代,在线评论平台激增,预售期已购买的消费者往往会通过在线评论平台发表相关评论。现货期消费者可以轻松获知产品价格和产品评价等信息并对其进行学习,更新自身对产品的认知和态度。基于评论的社会学习行为会影响消费者的购买决策,最终将影响零售商的预售决策。为此,部分商家开始采取评论操
众所周知,中国的房地产起步缓慢,但是近几年崛起迅速,并且以惊人的速度发展壮大。自20世纪90年代以来,国家实行了一系列的经济政策,加强了政府对市场的宏观调控,伴随着整体环境的变化,房地产行业发展步入新阶段,在国民经济体系中的作用愈发明显,开发的房屋也是居民生活的必需品,对居民的消费行为产生直接影响,由于宏观大环境和顾客需求类型的转变,房地产行业在推行新的项目时需要重新审视自身的市场定位,改变固有的
临床病历是一种重要的数据类型,对于临床分析来说,通常包含有价值和详细的患者信息。近年来,医学领域的自然语言处理已经成为生物医学信息学的一个活跃研究方向。然而,中文临床病历一般以半结构化的文本形式存在,对医学研究造成了一定的困扰。因此,迫切需要对病历文本进行信息抽取,形成结构化病历,有效地利用临床文本。现阶段涌现了大量基于深度学习和预训练模型的方法,在医学命名实体识别领域取得了较好的结果,但多任务学
近年来,随着网络购物普及程度越来越高,顾客对电商企业的服务能力提出了更高的要求。然而,当前公共突发事件的相关信息在网络上传播的速度较快,致使短期内商品非计划性需求激增的情况日渐频发。由于突发事件所造成的非计划性需求激增具有较强的不确定性,商品供应能力无法及时跟上,一味从供应端紧急调配资源无疑增加了供应链运作负担。同时顾客消费心理和行为特点也会发生改变,商品的可得性成为影响购买决策的主要因素,给电商
随着人工智能和5G技术的全面推广,自动驾驶技术呈现出快速发展的趋势。为了应对复杂多变的环境,就要求自动驾驶汽车有更完善的环境感知能力。目前自动驾驶环境感知主要以相机、激光雷达为作为核心的传感器。然而,各个传感器都有各自的局限性。单目相机无法进行测距。而激光雷达则缺少物体颜色信息,难以识别车道线以及交通标识等信息。融合图像与点云能精准获取带有深度的环境信息。因此,为了实现满足自动驾驶要求的环境感知,
空间形态设计是学生从二维空间进入三维空间设计类专业学习的入门课程,是建筑设计专业基础课程。室内设计是建筑的延续和再设计,将建筑设计空间形态设计课程的一些方法迁移并运用在室内设计中,可以帮助学生进行空间形态设计。文章首先介绍了室内空间形态设计的基本概念和教学内容,最后提出室内空间形态设计的教学方法,以期提醒学生不断关注和审视身边的空间,增强学生的空间表现能力与空间创造的思维能力。
生鲜产品高频、刚需,生鲜电商市场潜力巨大且疫情加速培养消费者线上消费习惯,生鲜电商渗透率加速提升,各大资本和企业纷纷加入布局和扩张战略,市场竞争加剧,企业只有不断提高服务质量、提升客户满意度并精准地把控各项成本,才能在最终的市场上占有一席之地。D生鲜电商从上海起家,前置仓运营效果良好,逐步向一二线城市扩张,依据企业的选址战略,目前已布局到南京市场,且该市场上已存在两家主要的竞争对手,本文针对D公司
多数发展中国家的电子政务服务尚处于起步阶段,电子政务服务的有效性取决于政府和用户的意向。2016年以来,蒙古国一直在逐步实施电子政务服务。作为这项工作的一部分,政府交易电子支付系统由蒙古中央银行负责,并连接21家国有银行和商业银行作为系统参与方以保持合作。该系统旨在为320万蒙古公民实现可靠、高效、低成本和快速的政府交易,并且没有时间或空间的限制。自从引入该系统以来,人们就一直在关注系统的操作运行