论文部分内容阅读
人体检测是计算机视觉中一个非常重要的研究领域,有着广阔的应用前景,如智能视频监控,高级人机交互,驾驶员辅助系统,人体运动分析等。但是由于一些客观存在的原因,如光照不均匀,背景复杂,人体姿势变化较大,人体存在遮挡等,使得人体检测成为一个具有挑战性的工作。 在多核学习算法的基础上,本论文就提高人体分类器的性能,使得检测结果更加鲁棒,提出了一种基于部位的静态人体检测方法,利用图像的深度信息去除部分虚景,利用非负矩阵分解,得到具有区分较强的特征。 本论文主要工作如下: 1.提出了一种基于部位的静态人体检测方法,该方法首先将整个人体划分为头肩、躯干和下肢几个部位,分别提取各个部位的特征,计算它们的核矩阵,利用多核学习算法,将它们进行线性加权为一个矩阵,最后训练出一个分类器,根据分类器的响应来判定窗口是否包含人体。仿真实验的结果表明,此方法使得分类的性能有所提升,能够检测出背景复杂,光照不均匀,人体姿势变化较大,存在部分遮挡情况下的人体,使得图像中的人体检测比较鲁棒。 2.将基于梯度的HOG特征和描述纹理特征的局部二值描述子相结合,采用多核学习的框架来进行异质特征的融合。该方法对不同的特征分别计算其核矩阵,最后通过对各个核矩阵的线性加权来进行计算,其权重系数是根据训练样本中的各个特征对分类的贡献学习出来的。利用数据库中的深度信息对分类器的结果进行验证,来达到去除部分虚景的目的。最后的实验表明结合异质特征更加丰富的表征的图像的特征,采用多核学习的方法进行特征融合有利于分类器性能的提升,验证减少了虚景,这些使得人体检测更加鲁棒。 3.提出一种基于非负矩阵分解算法的人体检测方法。该方法将样本按块划分,分别提取其尺度不变特征,用它来表示样本。然后对训练样本组成的特征矩阵进行非负矩阵分解,得到一个基矩阵和一个系数矩阵。我们使用特征向量在变换后的空间中的另外一种形式来表示,即分解后的系数矩阵作为最终的特征向量。实验结果表明,该方法能得到与HOG算法相同的分类性能,但是值得一提的是提出的方法每个样本的特征向量为500维时,与3780维的HOG描述子取得了相当的分类效果。在特征维数如此少的情况下取得与HOG相当的分类性能,说明提出的方法得到的特征是非常具有区分能力的,这也能够减少运算量及存储空间。 本论文工作得到了国家自然科学基金(编号:61075041、61105016)的资助。