基于显著性与部位建模的模型推荐行人检测算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:gaoxiang19931030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测技术应用于计算机视觉的多个领域,如视频监控、动作行为分析、汽车辅助驾驶、机器人控制等,具有广泛的应用前景和研究价值。多年来,行人检测技术取得了一定的研究成果,但由于行人较大的类内差异和场景的复杂性,仍然存在很多未很好解决的问题,需要进一步的研究。本文进行行人检测算法的研究选择了预处理环节、基于部位建模的分类器和自适应场景的模型推荐三个角度,并提出了改进方案。本文的主要研究工作和成果体现在以下几个方面:
  (1)显著区域检测为许多计算机视觉应用提供便利,成为行人检测的预处理过程。针对当前显著区域检测面临的异构特征和内外部线索缺乏有效融合的问题,以及部分方法依赖高层语义的先验假设,本文提出了一个多特征融合的无高层语义假设的显著区域检测算法。首先,设计了基于学习的概率纹理特征,并以此作为外部线索生成可靠的显著先验图。然后,构造多通道颜色特征,以此作为内部线索通过最小二乘拟合形成显著图。最后,对于噪声误差,引入颜色对比度特征通过信息熵优化,形成最终显著图。在主流测试数据集MSRA、ECCSD和PASCAL-S上实验表明,与基于先验假设的算法DSR、MC、RBD相比,本文提出的方法性能相当,计算复杂度低于DSR和DRFI算法。本文将显著区域检测应用于行人检测任务中,提高了行人检测性能。
  (2)基于部位建模的检测方法在行人检测方面表现出非常出色的性能,在人体姿态变化方面具有很强的适应性,但该方法存在模型初始化敏感和遮挡敏感问题。针对含有部位隐变量的模型训练非凸优化,受模型初始化影响大的问题,本文提出了基于人脸先验信息的模型初始化方法。将人脸检测技术应用于模型初始化,利用高层先验信息改善了利用图像自身特征的初始化方法,使模型训练更加准确。针对部位遮挡敏感问题,考虑LSVM方法对遮挡信息挖掘不足,本文在可变部位模型的基础上,建立了条件随机场模型,采用两层分类器,提出了基于遮挡建模的行人检测算法。在参数学习中,采用随机梯度下降和置信传播算法优化条件随机场的目标函数。在PASCALVOC数据集上测试结果表明,本文提出的方法在处理遮挡问题方面表现出较好的效果,有效的提高了可变部位模型的行人检测性能。
  (3)将深度学习的卷积特征与部位建模相结合的UDN模型,在行人检测任务中表现出色。但是,UDN模型依然是强部位模型,部位隐式训练,使行人判别能力受到很大影响。本文结合视觉注意机制,通过深度强化学习训练视点选择模型,模拟人类视觉搜索局部关键部位,提出了新的行人检测算法。通过视点选择模型生成聚焦图像,不断地叠加搜索关键区域,由检测网络对关键区域进行行人判别,并通过信息熵度量检测结果的可信度,作为奖赏通过深度强化学习优化视点选择模型。视点选择模型和检测网络协同迭代训练,使该方法具有很强的局部关键区域选择和判别能力,减少了形变和遮挡的影响。与经典的基于部位建模的行人检测算法在公开的行人检测数据集Caltech和ETH上进行对比实验,结果表明,所提出的行人检测算法可以有效地提高行人检测精度。
  (4)不同的行人检测模型在不同的场景下表现各异,精度和复杂度是一对矛盾因素。平衡精度和复杂度,充分发挥多模型的各自优势,有利于行人检测技术的应用。本文结合场景特征,将推荐系统引入到行人检测框架中来,提出了一个复杂度敏感的模型自适应行人检测算法。该方法通过建模场景特征作为探测特征响应,通过对多种模型的精度和复杂度进行权重评分作为评分矩阵,利用协同过滤推荐算法挖掘场景和检测模型间的内在关联。从而在复杂度权重的指引下,依据输入图像的场景特征,在检测模型集合中,动态的选取最优的模型进行行人检测。实验证明,在相同精度的情况下,行人检测效率有很大提升,有效的发挥了低复杂度的模型在某些场景中的优势。
其他文献
无轴承电机是一种能够同时实现转矩控制与悬浮控制的新型电机,作为高速、超高速电机发展的重要方向之一,受到了国内外众多专家学者的广泛关注。其中无轴承异步电机因其易于弱磁、结构简单、可靠性高等特点,成为研究最早、最多的类型之一。当无轴承异步电机在高速、超高速运行时,采用普通测速仪器进行转速测量时存在较大的困难,在一定程度上影响了电机的高性能矢量控制。采用无速度传感器技术替代普通测速仪器成为了电机高速、超
该文首先对现有陶瓷成型方法进行了系统分类,并扼要地介绍了各种成型方法的原理及优缺点,阐明了现代技术陶瓷对成型工艺的要求,重点介绍了凝胶注模成型工艺的原理、优点、发展及应用.论文系统研究了BaTiO基半导体陶瓷凝胶注模成型工艺,包括高固相含量低粘度浆料的制备、凝胶注模成型、坯体的干燥和烧成、陶瓷的显微结构与性能等方面,并成功地制备了显微结构均匀、形状复杂的陶瓷制品,如蜂窝状陶瓷发热体等.
该文介绍了一种用于高功率CO激光器的新的功率智能测控系统.功率采样单元主要由一具有稳定低透过率的全反球面介质镜和一薄膜型热电偶探测器组成.该单元将功率信号转化为探测器上电压信号实现功率采样.功率测控单元主要通过编辑实现对功率的检测并输出控制信号,通过与外部电路的接口,使功率在要求的范围内保持稳定.PLC通过对功率采样信号的处理,将其转化为实测的功率值.并与要求的功率进行比较,再采用一定的算法,输出
学位
文章首先介绍了射频激励CO激光器二十多年的发展历史及研究现状.接着从原理入手,给出射频激励CO激光器放电理论模型及放电腔的等效阻抗计算方法,分析了射频激励频率对激光器工作特性的影响,并介绍了射频激励CO激光器功率控制原理.然后,以25W射频激励CO激光器为例,论述了射频电源各部分的设计方法,给出了采用新型高频大功率晶体管放大器模块及以微带线作为阻抗匹配网络的新型电源设计方案,并对采用该设计电源的射
学位
随着数字图书馆等多媒体数据库的广泛应用,对多媒体数据库,特别是图像数据库的管理和查询成为制约这些应用的瓶颈,因此基于内容的图像检索成为人们研究的热点.由于基于内容的图像检索涉及到图像识别和多媒体数据库两个方面的知识.因此该文首先从图像识别出发,研究基于颜色和纹理的特征提取,然后从多媒体数据库出发,研究了面向对象的多媒体数据模型,最后设计了一个图像检索系统用来实现前面提出的算法.该文的重点在于:1.
学位
云计算作为一种新的高速网络计算服务受到越来越多的青睐,云计算技术广泛应用于通讯、交通、金融、制造等领域。通过实施任务的最优调度,充分利用现有资源实现任务的最快完成,是云计算中任务调度算法研究的目标。随着云计算的高速发展,云系统底层技术构架发生了明显变化,云系统结构越来越复杂,资源节点数量越来越多,不同云之间的差异性越来越明显。同时,用户数量多、行业普及、服务需求多、时效性期望高、数据海量且多样化等
学位
近年来,随着通信和位置感知技术的发展,基于位置的服务(Location Based Service,LBS)需求不断增加。位置预测是LBS的研究内容之一,在广告服务、位置导航等领域具有重要的应用。已有的位置预测方法多通过建立Markov位置预测模型和频繁轨迹挖掘来实现,尽管此类模型和方法可以较好地适用于GPS轨迹数据,可以有效地用于位置预测,但却存在模型阶数不好确定,轨迹挖掘过程只涉及轨迹数据本身
学位
近年来,伴随着互联网科技的迅猛发展,得益于低廉的维护和管理成本、可伸缩的软硬件配置和随时随地的便捷访问,越来越多的企业、组织、科研机构和个人将数据外包到云服务器。然而凡事具有两面性。在人们享受云存储带来的低成本和高效率的同时,数据安全性的问题随之而来。对于外包数据,用户失去了物理上的控制权。尽管云服务提供商会对数据提供一般性的保护,但此类手段完全依赖于厂商的信誉和技术水平,用户毫无掌控权。除此以外
学位
目标的位置与运动轨迹是无线传感器网络的基础信息,是基于位置服务实现的基础。卫星定位系统为室外环境下的目标定位与轨迹跟踪问题提供了解决方案。据统计,人类有80%以上的时间是在室内度过的,提供高精度的室内位置或者轨迹,是许多应用的基础。卫星无线信号会受到建筑物、墙壁等障碍物的严重影响,不能有效地在室内环境中工作。无线网络定位与轨迹跟踪问题涉及到计算机、通信、自动化与物理等多个学科的相关研究领域,为了提
随着互联网技术发展,信息的总量和增长速度严重超出了个人或传统的数据管理和分析方法所能接受、处理和有效利用的极限,引起信息过载问题。其中大多数信息过载问题源于非结构化文本数据,例如,社交媒体文本、网页、新闻文档以及学术论文等。因此,从大量文本数据中自动发现知识的文本挖掘和分析技术引起了学术界和工业界极大的研究兴趣和热度,成为大数据时代数据挖掘和自然语言处理领域的核心研究问题。  由于短语是自然、低歧
学位