论文部分内容阅读
行人检测技术应用于计算机视觉的多个领域,如视频监控、动作行为分析、汽车辅助驾驶、机器人控制等,具有广泛的应用前景和研究价值。多年来,行人检测技术取得了一定的研究成果,但由于行人较大的类内差异和场景的复杂性,仍然存在很多未很好解决的问题,需要进一步的研究。本文进行行人检测算法的研究选择了预处理环节、基于部位建模的分类器和自适应场景的模型推荐三个角度,并提出了改进方案。本文的主要研究工作和成果体现在以下几个方面:
(1)显著区域检测为许多计算机视觉应用提供便利,成为行人检测的预处理过程。针对当前显著区域检测面临的异构特征和内外部线索缺乏有效融合的问题,以及部分方法依赖高层语义的先验假设,本文提出了一个多特征融合的无高层语义假设的显著区域检测算法。首先,设计了基于学习的概率纹理特征,并以此作为外部线索生成可靠的显著先验图。然后,构造多通道颜色特征,以此作为内部线索通过最小二乘拟合形成显著图。最后,对于噪声误差,引入颜色对比度特征通过信息熵优化,形成最终显著图。在主流测试数据集MSRA、ECCSD和PASCAL-S上实验表明,与基于先验假设的算法DSR、MC、RBD相比,本文提出的方法性能相当,计算复杂度低于DSR和DRFI算法。本文将显著区域检测应用于行人检测任务中,提高了行人检测性能。
(2)基于部位建模的检测方法在行人检测方面表现出非常出色的性能,在人体姿态变化方面具有很强的适应性,但该方法存在模型初始化敏感和遮挡敏感问题。针对含有部位隐变量的模型训练非凸优化,受模型初始化影响大的问题,本文提出了基于人脸先验信息的模型初始化方法。将人脸检测技术应用于模型初始化,利用高层先验信息改善了利用图像自身特征的初始化方法,使模型训练更加准确。针对部位遮挡敏感问题,考虑LSVM方法对遮挡信息挖掘不足,本文在可变部位模型的基础上,建立了条件随机场模型,采用两层分类器,提出了基于遮挡建模的行人检测算法。在参数学习中,采用随机梯度下降和置信传播算法优化条件随机场的目标函数。在PASCALVOC数据集上测试结果表明,本文提出的方法在处理遮挡问题方面表现出较好的效果,有效的提高了可变部位模型的行人检测性能。
(3)将深度学习的卷积特征与部位建模相结合的UDN模型,在行人检测任务中表现出色。但是,UDN模型依然是强部位模型,部位隐式训练,使行人判别能力受到很大影响。本文结合视觉注意机制,通过深度强化学习训练视点选择模型,模拟人类视觉搜索局部关键部位,提出了新的行人检测算法。通过视点选择模型生成聚焦图像,不断地叠加搜索关键区域,由检测网络对关键区域进行行人判别,并通过信息熵度量检测结果的可信度,作为奖赏通过深度强化学习优化视点选择模型。视点选择模型和检测网络协同迭代训练,使该方法具有很强的局部关键区域选择和判别能力,减少了形变和遮挡的影响。与经典的基于部位建模的行人检测算法在公开的行人检测数据集Caltech和ETH上进行对比实验,结果表明,所提出的行人检测算法可以有效地提高行人检测精度。
(4)不同的行人检测模型在不同的场景下表现各异,精度和复杂度是一对矛盾因素。平衡精度和复杂度,充分发挥多模型的各自优势,有利于行人检测技术的应用。本文结合场景特征,将推荐系统引入到行人检测框架中来,提出了一个复杂度敏感的模型自适应行人检测算法。该方法通过建模场景特征作为探测特征响应,通过对多种模型的精度和复杂度进行权重评分作为评分矩阵,利用协同过滤推荐算法挖掘场景和检测模型间的内在关联。从而在复杂度权重的指引下,依据输入图像的场景特征,在检测模型集合中,动态的选取最优的模型进行行人检测。实验证明,在相同精度的情况下,行人检测效率有很大提升,有效的发挥了低复杂度的模型在某些场景中的优势。
(1)显著区域检测为许多计算机视觉应用提供便利,成为行人检测的预处理过程。针对当前显著区域检测面临的异构特征和内外部线索缺乏有效融合的问题,以及部分方法依赖高层语义的先验假设,本文提出了一个多特征融合的无高层语义假设的显著区域检测算法。首先,设计了基于学习的概率纹理特征,并以此作为外部线索生成可靠的显著先验图。然后,构造多通道颜色特征,以此作为内部线索通过最小二乘拟合形成显著图。最后,对于噪声误差,引入颜色对比度特征通过信息熵优化,形成最终显著图。在主流测试数据集MSRA、ECCSD和PASCAL-S上实验表明,与基于先验假设的算法DSR、MC、RBD相比,本文提出的方法性能相当,计算复杂度低于DSR和DRFI算法。本文将显著区域检测应用于行人检测任务中,提高了行人检测性能。
(2)基于部位建模的检测方法在行人检测方面表现出非常出色的性能,在人体姿态变化方面具有很强的适应性,但该方法存在模型初始化敏感和遮挡敏感问题。针对含有部位隐变量的模型训练非凸优化,受模型初始化影响大的问题,本文提出了基于人脸先验信息的模型初始化方法。将人脸检测技术应用于模型初始化,利用高层先验信息改善了利用图像自身特征的初始化方法,使模型训练更加准确。针对部位遮挡敏感问题,考虑LSVM方法对遮挡信息挖掘不足,本文在可变部位模型的基础上,建立了条件随机场模型,采用两层分类器,提出了基于遮挡建模的行人检测算法。在参数学习中,采用随机梯度下降和置信传播算法优化条件随机场的目标函数。在PASCALVOC数据集上测试结果表明,本文提出的方法在处理遮挡问题方面表现出较好的效果,有效的提高了可变部位模型的行人检测性能。
(3)将深度学习的卷积特征与部位建模相结合的UDN模型,在行人检测任务中表现出色。但是,UDN模型依然是强部位模型,部位隐式训练,使行人判别能力受到很大影响。本文结合视觉注意机制,通过深度强化学习训练视点选择模型,模拟人类视觉搜索局部关键部位,提出了新的行人检测算法。通过视点选择模型生成聚焦图像,不断地叠加搜索关键区域,由检测网络对关键区域进行行人判别,并通过信息熵度量检测结果的可信度,作为奖赏通过深度强化学习优化视点选择模型。视点选择模型和检测网络协同迭代训练,使该方法具有很强的局部关键区域选择和判别能力,减少了形变和遮挡的影响。与经典的基于部位建模的行人检测算法在公开的行人检测数据集Caltech和ETH上进行对比实验,结果表明,所提出的行人检测算法可以有效地提高行人检测精度。
(4)不同的行人检测模型在不同的场景下表现各异,精度和复杂度是一对矛盾因素。平衡精度和复杂度,充分发挥多模型的各自优势,有利于行人检测技术的应用。本文结合场景特征,将推荐系统引入到行人检测框架中来,提出了一个复杂度敏感的模型自适应行人检测算法。该方法通过建模场景特征作为探测特征响应,通过对多种模型的精度和复杂度进行权重评分作为评分矩阵,利用协同过滤推荐算法挖掘场景和检测模型间的内在关联。从而在复杂度权重的指引下,依据输入图像的场景特征,在检测模型集合中,动态的选取最优的模型进行行人检测。实验证明,在相同精度的情况下,行人检测效率有很大提升,有效的发挥了低复杂度的模型在某些场景中的优势。