基于机器视觉的场景目标检测与分类研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:lml2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景目标检测与分类技术是机器视觉研究领域的热点问题。目标的检测、分类以及语义分析是实现场景理解的先决条件。场景理解的主要信息来源有图像和视频,再结合需要检测的处理对象不同,将场景目标检测分为基于视频序列和基于单帧图像的目标检测。前者常利用多帧图像信息检测出动态变化的区域,再进行目标分类和跟踪。后者是在单幅图像中识别并提取出所有已学习过的感兴趣类别目标。目标正确识别及在原图中的精准定位是高层次视觉分析任务的基础步骤之一。近年来,深度卷积神经网络具有通过对大数据样本的学习而自主获取物体特征的特性,避免了传统识别算法中复杂的特征提取和数据重建过程,是解决各类计算机视觉问题的一类有效方法。本文主要研究内容如下:(1)提出了基于卷积神经网络(Convolution Neural Network,CNN)的动态目标分类方法。在整个方法中利用逻辑性分析解决了高斯混合模型(GMM)提取的运动区域存在多目标融合的情况,得到较为完整且独立的运动目标。再利用深度卷积神经网络去学习运动目标的固有静态特征,结合softmax回归分类器进行分类。该方法通过实验说明在运动目标区域检测不完整和同类别重叠等情况仍能准确分类,同时拥有分类精度高、处理速度快的优点。(2)提出基于ACF(Aggregated Channels Feature)及卷积神经网络的图像目标检测方法。针对ACF检测图像行人和车辆目标存在部分误检的问题,利用经卷积神经网络对候选框进行二次识别,剔除误检的背景框。该方法既利用了ACF召回率高的特点,也结合了卷积神经网络高识别率的特点。最后通过实验说明了改进方法在不影响检测实时性和召回率的同时大大提升了检测准确率。(3)提出基于ACF及多任务式学习的卷积神经网络的图像目标检测方法。此方法不仅能够准确快速的检测出图像中的目标,还可以根据多任务式学习的特点对目标增加丰富的语义信息。通过行人和车辆检测实验,说明了该方法在提高检测准确率的同时可以获得行人、车辆目标的混合行为语义。如一个候选框在判别为是一个行人的基础上,还可以判别其运动方向是正或侧以及运动状态是行走或奔跑。该方法可以应用在移动机器人平台上,利用场景中多个行人、车辆的图像位置信息和混合行为语义共同分析场景异常行为。
其他文献
同步电动机具有结构简单、便于安装、方便维护、机械特性硬、过载能力强、效率高且功率因数可调等优点,因此广泛应用在工业上作为电动机和改善电网的无功补偿机。同步电动机的励磁电流是同步电动机稳定运行、实现功率因数可调的决定性因素。本文所研究的同步电动机励磁装置是实现同步电动机准确励磁的关键。针对传统的可控硅励磁系统需要操作笨重且能耗较高的工频变压器、励磁装置用模拟电路搭建而成、不能准确地控制励磁等缺点,本
心血管疾病是威胁人类健康和生命的主要疾病之一。动态心电图(DCG)可对心脏病患者的心电活动进行连续24小时的跟踪记录,是临床诊断心血管疾病的重要方法。因此,进行高性能动
同步电机调速系统是交流调速系统的两大分支之一,随着电力电子、微电子技术和现代控制理论的发展,同步电机调速系统日益得到广泛的应用。作为同步电机的一种,永磁同步电机在交流
宝钢股份有限公司梅山钢铁分公司新建的1422热镀锌、热镀铝锌两条自动化生产线是宝钢工程技术有限公司真正意义上完全自主集成的大型复杂机组,其设计生产产品主要针对国内外的
无刷直流电机既具有直流电机结构简单,运行可靠,维护方便等一系列优点,还具备交流电机运行效率高,无励磁损耗及调速性能好等诸多优点,现已广泛应用于工业控制的各个领域。无刷直流
机动车辆与日俱增,随之而来的车辆交通安全问题也越来越受到社会的广泛关注。调查表明,疲劳驾驶在造成交通事故的危险因素中高居第三位,在死亡交通事故原因中居首位。因此,研
组合优化是运筹学的重要分支,主要通过对数学方法的研究寻找离散事件的最优编排、分组、次序或筛选等。大多数这类问题通常在多项式时间里无法求解,属于NP完全问题。随着问题规
学位
学位
图像作为传递信息和媒体的重要手段之一,其中包含的信息是十分重要的。数字图像处理技术发展迅速,其应用越来越广泛,已渗透到许多领域,如遥感、生物医学、通信、工业、航空航
随着科学技术的进步,绣花机行业得到了突飞猛进的发展,电脑绣花机是绣花机行业进步的标志之一。然而,电脑绣花机控制系统在研发过程中存在较多问题,这些问题的存在严重影响了