论文部分内容阅读
物体检测在图像理解和视频分析等多媒体数据处理中是非常重要的一个方面。由于图像和视频的数量巨大以及有限的计算资源,快速有效的检测是巨大的挑战。同时低计算复杂度和高泛化能力是视频物体检测的两个重要方面。低计算复杂度不仅意味快速同时也包括低能源消耗。基于支撑向量机的滑动窗口检测方法是物体检测方面的一个经典检测框架,计算损耗主要集中在特征提取和基于内积的分类。因此,如何提高特征提取和分类的效率是高效物体检测的关键。为了提高检测物体的效率并降低耗能,本文利用视频序列时间和空间上的相关性,提出了一种基于滑动窗口空间相关性的高效节能算法以及一种基于视频序列时间相关性的分布式的物体检测框架(DOD)。针对内积分类,本文算法提出了相邻滑动窗口子图像在特征空间也是相邻的理论假设,并在此基础上结合线性分类器的特性,利用一次内积快速排除掉一批相邻子图像,本算法总的乘法和加法次数与传统滑动窗口几乎一致,但本算法的乘法次数相比而言非常少。由于加法比乘法消耗能源要少很多,因此本算法更加节约能源和有效。针对特征提取,本文提出的分布式物体检测算法中,特征的提取与分类分散到了当前帧和前面数帧。在每一帧中,部分特征提取出来,同时计算分类器的部分响应值。为了降低传统的基于块的梯度直方图(HOG)特征(BHOG)的维度,本文提出了基于单元的HOG特征(CHOG)。结合CHOG与DOD框架,本文提出了CHOG_DOD作为分布式检测的一个实例,通过人手、人脸以及行人的实验证明了该算法的优越性。