论文部分内容阅读
在图像和视频中检测识别物体是计算机视觉领域要解决的根本问题之一,是长期以来该领域内的研究难点,同时也是近年来研究的热点。物体检测在视频监控、人机交互、医疗诊断以及国防工业中都有着广泛的应用。当前随着视觉传感器的快速普及,各种实际应用对快速、高性能物体检测技术的需求也与日俱增。物体检测技术经历了由人工制定规则到数据驱动的发展历程,性能也越来越接近实际应用的需求。可变形部件模型(Deformable Part Model,DPM)是当前数据驱动物体检测技术的优秀代表之一。DPM算法使用根模型和可变形的部件模型相互配合,大大提高了物体检测的精度。虽然DPM算法具有众多优良性能,但检测速度过慢,在Pascal VOC 2007数据集上平均每帧检测时间高达十几秒,这也成为其走向实际应用的瓶颈。为了克服DPM的速度短板,本文不仅从硬件上利用图形处理器(Graphics Processing Unit,GPU)并行计算,而且从软件上改进算法,来对原始的DPM检测过程进行加速。使用GPU计算充分挖掘了算法检测流程的并行性;利用DPM混合模型对特征金字塔中待滑窗位置进行筛选,有效降低了DPM完整模型的计算量,进一步加快了DPM算法并行执行的效率。并行加速后的DPM算法不仅在Pascal VOC 2007数据库上检测性能和时间性能优异,而且也成功应用于车辆检测和车牌定位等实际项目中。在保证精度的前提下,大大提高了车辆和车牌检测的速度,满足了实际应用的需要。本文主要研究内容与成果如下:1.实现了DPM算法的GPU加速。为了突破DPM算法的速度瓶颈,本文通过基于CUDA平台的GPU加速技术,充分挖掘算法的并行性,实现了DPM算法检测速度130+倍的提升。在Pascal VOC 2007数据集上平均检测速度达到10FPS,而且性能没有下降。2.机理上重新设计DPM算法使之更利于并行计算。与DPM算法传统串行优化不同,本文提出了基于DPM混合模型滤波的并行优化,从根本上重新设计算法的执行流程。改进后的DPM算法,更利于并行计算,加速比超过200,在Pascal VOC 2007上平均检测速度达到16FPS。3.并行加速后的算法成功应用于车辆检测和车牌定位实际项目中。使用并行加速后的DPM算法进行车辆及车牌的检测,不仅两者的准确率和召回率都在95%以上,而且车辆检测速度在300ms左右,车牌的检测速度在100ms以内,达到了实际应用的需求。并在此基础上实现了车牌识别系统,综合准确率在90%左右。