自然场景中车辆检测与颜色识别

来源 :四川大学 | 被引量 : 0次 | 上传用户:libingyao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着交通信息量爆炸式地增长,难以仅凭人工处理方式实现对其的管理,以系统化和智能化方式对交通数据进行的操作的智能交通系统逐渐在现代交通管理中占据了重要地位。车辆作为交通中的一个重要组成成分,要完成整个系统的智能化管理,使用各种现代技术处理车辆数据是智能交通中不可或缺的一个重要环节。现阶段用于车辆检测与识别的技术中存在诸如处理计算量较大、效率较低等问题。针对上文中提到的车辆检测与识别技术中存在计算量大等问题,本文提出了以深度学习的方法对交通场景中车辆目标进行检测与颜色信息和车牌真伪识别的算法,使车辆的检测效率得到了大幅度的改进,并为后续车辆管理提供更加丰富的车辆信息。本文主要工作包括:1.基于YOLOv3神经网络模型,实现交通场景中车辆目标的检测。对于采用更深骨干网络Darknet-53,提取多尺度特征完成车辆目标检测的目标检测模型YOLOv3,通过采取适当的剪枝方式,使其能适应实际交通场景的需要,在达到车辆检测速度要求的同时,能够检测出包含足够多的,可以直接用于车辆信息识别的车辆前脸图像数据,不会产生数据浪费。通过与Faster R-CNN目标检测模型进行实验对比,证实文中所用方法可以在检测准确性和实时性上更胜一筹;2.设计一种基于深度学习的Multi Color-Net算法,实现对车身颜色的识别。针对YOLOv3网络的车辆前脸检测结果,在完成两个特征提取子网络RGB Net与HSV Net预训练的基础上,通过提取与拼接输入图像的RGB颜色特征与HSV颜色特征,利用分类子网络实现车身颜色的识别。通过在测试集上的测试结果展示,以及与Alex Net/Google Net等经典网络模型的对比实验均可以证明,文中所提出的颜色识别模型Multi Color-Net能够在维持较少计算量的前提下,以较高的识别准确率完成自然场景中车辆的车身颜色识别;3.通过两个神经网络模型实现对车辆伪车牌的识别。利用YOLOv3模型完成车辆前脸区域检测与车辆品牌的识别;利用深度学习模型Multi Color-Net完成车身颜色的识别;利用已有的车辆牌照识别模块完成车牌字符识别,最后结合车辆属性数据库中已有车辆牌照、车身颜色与车辆品牌等信息,通过多项属性信息相互验证的方式确定车牌的真伪。经验证,在复杂的实际交通情况中,可以在准确判别车牌真伪的同时,达到实时甄别车牌真伪的效果。本方案可以以端到端的方式,直接从输入图像学习特征,实现自然交通场景中车辆的检测、车身颜色识别与伪车牌的识别。其中,车辆前脸检测为车身颜色识别的前期辅助性工作,通过车辆前脸检测得到用于车身颜色识别的数据;伪车牌识别则是颜色识别工作的进一步延伸。文中在真实数据集上计算所得的实验结果表明,文中提出的方案相对于已有的检测与识别方法,能够取得较高的准确率与鲁棒性,同时保持较低的计算复杂度,满足实际需求。
其他文献
用户界面(User Interface,UI)原型设计是以用户为中心的应用软件开发过程中必不可少的一步。在界面原型设计的早期阶段,设计人员并不知道界面应该是什么样的,此时通常会使用线框图(Wireframe)进行探索。线框图是用户界面的图形化骨架,按照细节实现的程度,可分为低保真线框图和高保真线框图。低保真线框图是线框图的粗糙和基础表示版本,通常在纸上进行绘制,用于试验设计人员最初的想法,传达设计
随着互联网的发展,电子商务平台网站用户和商品数量急剧增加,用户的需求也是因人而异。推荐系统能帮助用户从海量的商品中找到喜欢的商品,改善用户购物体验的同时,也带来了巨大经济效益。传统推荐系统将用户对商品的评分信息作为输入,导致输入数据非常稀疏。解决数据稀疏性的常见方法是在算法中额外引入一些辅助信息作为输入。而用户评论文本包含丰富的语义信息,可以在一定程度上弥补数据稀疏问题。相比传统的推荐系统算法,基
近年来,随着物联网以及人工智能的飞速发展,计算机的计算性能和信息处理能力得到了极大提升。然而计算机硬件设备的运算速度越快,运行的应用程序越复杂,设备消耗的电量也越大。由于受到计算机硬件设备大小和芯片制作工艺的约束,降低计算机硬件功耗变得越来越困难,所以从软件层面降低功耗的办法受到了普遍关注。而软件功耗评估作为软件功耗优化研究的基础,更是成为了重点研究对象。现有软件功耗评估方法大多集中于软件功耗的建
近年来,倾斜摄影测量技术在大规模场景自动化建模方面获得了广泛的应用,成为了目前日益重要的数字资产。在实际应用中,由于模型数据可能需要不断更新以及保护知识产权等原因,往往需要将模型数据集中保存在服务器上。而在客户端应用需要渲染时,实时地通过网络传输最新数据来完成渲染。由于三角网格在几何、顶点索引和纹理信息上的紧耦合性,使得场景数据必须完整传输后才可以在客户端开始渲染。在网络带宽不稳定时,无法保证数据
图像是信息的重要载体,所呈现的内容丰富多样。前景通常是图像内容的关键信息,人们在观察分析图像时也会重点关注这部分内容。在现实生活和工作中,前景提取被广泛应用于图像处理相关领域,如自动驾驶、影视特效等领域。前景提取结果的准确率会直接或间接影响后续的图像处理环节。人眼视觉感知物体的过程具有整体优先效应,即先感知物体的整体视觉形象,再感知其局部细节。为进一步提高前景提取的准确率,本文从人眼视觉感知的角度
近年来,由于互联网的快速发展,网络中的内容与信息呈爆炸式增长,非专业人员想要从搜索引擎获取有效医疗信息的难度进一步加大。同时,由于我国的医疗建设水平无法跟上患者的就医需求,医患矛盾的现象始终得不到根本的解决,所以问诊难的问题普遍存在。随着大数据和人工智能时代的到来,人们获取各类信息的方式开始变得更加敏捷和高效,加快实现医学领域的信息化是一个迫切且具有重要意义的问题。为了方便患者在需要就医时能及时地
藏族医学,简称藏医,是中国传统医学的重要组成部分。然而,藏医的疾病诊断与治疗过程十分依赖医生的个人经验。同时,藏医院的信息化建设相对落后,以电子病历为基础的决策支持系统建设尚处于起步阶段。这些问题已经对现阶段藏医的传承和发展产生阻碍。本文依托青海省自然基金项目——“基于数据挖掘的藏医诊疗决策支持系统关键技术研究”,以藏医用药决策支持为切入点,将数据挖掘技术、推荐算法与藏医用药理论结合,借助青海省藏
如何更高效地制作具有较强真实感的可变形人体角色动画一直是计算机三维动画技术研究中的热点之一。为了提高人体角色动画真实感,研究者们通常采用物理或动力学模拟的方法,在初级运动(如行走等)的基础上模拟人体运动过程中的次级运动(如脂肪抖动等),从而满足人体角色动画的真实感要求。而为了提高动画制作效率,研究者们通常采用动作捕捉技术捕获真实人体的不同运动状态信息再结合手动编辑和调整的方法。基于物理的传统模拟方
噪声作为一种特殊的数据形式伴随着信号的出现而出现,其按概率密度函数可分类为高斯噪声、椒盐噪声、伽马噪声、瑞丽噪声等。图像噪声的产生会使其含载的信息受到干扰,对后续依赖于图像数据的处理如数据挖掘、机器学习、图像识别等造成很大影响。经典的图像去噪算法针对二维图像数据,应用各种先验知识与数学模型在尽可能保留原始图像细节的前提下最大程度去除噪声干扰。然而对高光谱图像(Hyperspectral image
三维目标检测在汽车自动驾驶、机器人环境感知等应用中占有重要的地位,主要研究如何有效地感知三维环境信息,对感兴趣目标进行准确分类和定位。相比于二维目标检测,三维检测由于维度增加更具有挑战性。一方面,各类传感器数据单独应用于三维场景理解时都有不足之处,例如激光雷达获取的点云稀疏且不规则;相机获取的图像缺乏空间深度信息。另一方面,物体在空间中随机分布,当目标距离远或部分被遮挡时,容易出现漏检情况。针对以