论文部分内容阅读
随着社会生活的日益丰富多彩,机场、商场、社区等各类公共场所对于行人检测技术的需求愈加强烈。行人检测技术是利用计算机强大的计算能力在图像中识别出行人目标,由于背景复杂多变、行人服装饰物各不相同、行人姿态各有差别、光线明暗变化等因素的影响,如何准确且快速地检测出行人仍是目前研究的热点问题。在该领域内,当前主流的算法是利用特征描述子提取行人特征,通过机器学习的方法训练分类器,再使用分类器来识别行人目标,本文中就是采用了这种方法实现行人检测技术。本文的主要工作集中在特征描述子与分类器两方面。通过对各类特征描述子的对比分析,采用由Dalal和Triggs提出的描述能力强的梯度直方图特征。针对梯度直方图特征计算量大、特征维数过高、没有利用图像的纹理信息等缺点,采用图像金字塔模型与熵信息组成一种新的混合特征,实现对图像的降维处理与纹理信息的利用。在分类器上,本文选择分类速度快、结构简单的支持向量机。目前常用的支持向量机都是线性核支持向量机,分类速度较快但是其检测率稍差。而非线性核支持向量机具有较好的检测率但是稍慢的分类速度限制了它的应用。针对这个问题,采用交互核这种非线性核实现了与特征相对应的分类器,并在交互核的基础上实现了一种加法核以及与其相对应的分类器。这两种分类器在保持非线性核较强分类能力的基础上,还具备了线性核的分类速度。最后,将塔式梯度直方图特征、熵特征组合的混合特征分别与交互核支持向量机、加法核支持向量机相结合,提高行人检测算法性能。本文在INRIA行人库上训练分类器,测试算法性能,通过DET曲线与ROC曲线对比检测结果。实验结果表明,本文的行人检测算法取得了较高的检测率与较快的检测速度,即使在复杂背景、行人多姿态、小范围遮挡的情况下也具有较好的检测性能。